Application of multidimensional scaling method in marine oil fingerprint identification
-
摘要:
本文采用GC-MS离子选择方法,分析了6种不同溢油样品的油指纹诊断比值参数,利用多维标度法鉴别了6种不同溢油样品,并与重复性限法进行了比对分析。结果表明:多维标度法可高效进行大量样品油指纹分析的同时鉴定,能直观的表现研究对象之间的关系,实现油样的分类鉴别;多维标度法与重复性限法相比,可简化两两样品之间对比繁琐的计算过程,避免不同油品多个诊断比值一致的情况下的误判,从而有效弥补、完善重复性限法和其他方法的一些不足,为海洋溢油事故指纹鉴定提供一些借鉴。
Abstract:In this paper, the GC-MS ion selection method was used to analyze the diagnosis ratio parameters of six different oil spill samples. Six kinds of oil spill samples were identified by multidimensional scaling method, and compared with the repeated limit method. Results show:Multidimensional scaling method can be used to effectively carry out a large number of samples of oil fingerprint analysis at the same time, it can directly show the relationship between the object of study, and realize the classification and identification of oil samples. Compared with the repeatability limit method, the method can simplify the tedious calculation process of comparison between two samples and avoid miscarriage of justice in the case of multiple diagnostic ratios of different oils, thus effectively to make up for the deficiency of the method of repeatability limit and other methods. It can provide some references for the marine oil spill accident fingerprint identification.
-
随着海上溢油事件的逐渐增多,快速、准确的油指纹鉴别方法受到越来越多的关注,如重复性限法、主成分分析法、聚类分析法、t检验法等已经被广泛用于溢油鉴定[1-4]。但是,由于油指纹特征比值参数众多,在实际的油指纹鉴别判断时,难于把握“多维”性问题,处理不当会出现误判。因此,如何有效降低判断的“多维性”,提高判断的客观性,是海洋油指纹鉴别面临的问题之一。多维标度法是一种表示研究对象之间相似程度的多元统计分析方法,有学者曾提出过将多维标度分析法用于溢油鉴别[5],但多维标度法在溢油鉴定中的实际应用过程和可行性报道甚少。为此,本文以几种不同的海洋实际溢油油品为例,在对比分析重复性限法基础上,研究多维标度法在油指纹鉴别中的应用,从而为今后海洋溢油事故指纹鉴定提供一些借鉴,为快速、高效的解决溢油来源问题并确定责任归属提供科学依据,对海洋环境的管理和保护具有重要意义。
1 材料与方法
1.1 多维标度法基本原理
多维标度法(简称MDS)是一种在低维空间展示“距离”数据结构的多元数据分析技术,用于分析研究对象之间的相似性或差异性[6]。MDS按相似性数据测量尺度的不同可分为度量MDS和非度量MDS[7];按相似性矩阵的个数和模型的性质分为:单矩阵多维标度、重复多维标度、权重多维标度。多维标度法目前已成为广泛用于经济学[8]、社会学[9-10]和自然科学[11-12]等领域的一种数学分析方法。
多维标度法的基本原理为:通过创建多维空间图,以图中对象点之间的距离反映研究对象之间的相似性或差异性关系。设r维空间中的n个点表示为X1,X2,X3,…,Xn,用矩阵表示为X=(X1, X2, …, Xn)。在多维标度法中,我们称X为原始距离阵D的一个拟合构件图,求得的n个点之间的距离阵
称为D的拟合距离阵,D和 应该尽可能的接近。通过观察拟合构造点之间的距离即可分析研究对象之间的相似性和差异性,达到还原研究对象之间关系的目的。1.2 分析步骤
多维标度法的分析步骤:首先选择需要进行比较分析的样品和适当的求解方法,确定和分析样品间的距离矩阵;其次,选择适当的维度,得到距离阵的解,将样品之间的关系直观的表现出来并对结果进行解释;最后,检验模型对样品的拟合情况并做出诊断。多维标度分析过程在SPSS软件的支持下完成[13]。
1.3 样品处理与分析
本文选取本实验室前期做过的A、B、C、D、E和F 6种不同的海洋溢油油品(表 1),其中油品A为原油,其余油品分别为不同国家船舶在我国沿海发生溢油事故中的燃料油。首先进行样品处理[1]:称取约0.2 g的油样,将其溶解于10 mL的正己烷中,在超声波清洗仪中混匀15 min得到油溶液。在含有玻璃棉的玻璃层析柱中加入3 g活化硅胶(用丙酮、正己烷、二氯甲烷冲洗后烘干,180℃下活化20 h),在顶部加入0.5 cm高的无水硫酸钠,用200 mL的正己烷调节层析柱并将流出液弃掉。取200 μL油溶液加入含玻璃棉的活化硅胶层析柱中,依次用12 mL正己烷和15 mL正己烷和二氯甲烷的混合液(体积比为1: 1) 冲洗分别得到洗出液饱和烃(正己烷和甾烷萜烷)和芳香烃组分,将洗出液进行旋蒸并氮吹至1 mL放入气相进样瓶;然后采用GC-MS选择离子分析方法[14]。每种油样做3个平行样进行分析,得到每种样品的正构烷烃、芳香烃和甾萜烷组分GC-MS谱图,典型谱图见图 1。
表 1 油样信息Tab. 1 Information of oil samples1.4 油指纹特征比值
通过对谱图积分,计算得到油指纹比值参数,其中诊断比值的选取首先是在对谱图分析时去除信噪比小于3的组分,同时去除难于积分的峰对应组分的情况下得到的,然后对得到的诊断比值进行重复性分析,判断平行样之间诊断比值的相对标准偏差是否小于5%,当相对标准偏差小于5%时比值可取。最终经过筛选得到17个诊断比值(表 2)。
表 2 油样指纹诊断比值Tab. 2 Diagnostic ratio of oil samples2 结果与讨论
2.1 多维标度法分析
2.1.1 样品距离阵
6种油品每种进行3个平行样测定,共有18个测试数据,采用17个诊断比值参数,根据分析变量的原始数据(表 2),计算分析对象间的相似测度,利用欧几里得距离[15](任意两个样品i和j之间的距离
测度样品之间的相似程度,得到样品距离阵D(表 3)。表中数据越小,相似度越好,反之亦然。表 3 油样间的距离矩阵Tab. 3 The distance between sample matrixes2.1.2 非度量MDS的解
采用Kruskal的非度量MDS分析方法[15]。将空间中样品对应的18个点表示为X1,X2,X3,…,X18。选择两个维度进行分析,将18个研究对象随机放置在二维空间中,形成一个感知图,任意两个对象i和j在二维空间的坐标用Xi=(Xi1, Xi2)和Xj=(Xj1, Xj2)来表示,对象i和j在二维空间的距离为
。通过调整18个对象在二维空间中的位置,改进不相似数据与空间距离dij的匹配程度,计算得到测度偏离完美匹配程度的量度Stress[16]值= 0.03681,小于0.05,表示拟合效果良好。由此匹配后得到非度量MDS的解,即样品在两个维度的坐标数值(表 4),根据该数值可画出油样在两个维度间的Euclidean距离模型图(图 2)。从图 2中可以看出:样品被清晰的分成6组聚焦点,每组聚焦点正好对应每个油样的平行样,每组聚焦点内的样品彼此为同一种油品。图 2还表明:不同聚焦点之间有明显的差异,表示“组”与“组”之间为不同的油样品,说明多维标度法较好地区分开了不同的6种油品(A、B、C、D、E、F)。表明多维标度法可高效进行多样品油指纹分析的同时鉴定,能直观形象的实现油样的分类鉴别。表 4 导出的二维坐标值Tab. 4 Exported two-dimensional coordinate values2.1.3 距离模型验证
通过线性拟合散点图验证模型的拟合情况,即验证距离模型图是否能够较好的反映样品间的关系。线性拟合散点图(图 3)呈现出样本点基本落在直线y=x附近,说明模型对样品的拟合效果比较理想,进一步验证了模型的可行性,说明多维标度分析法用于溢油鉴定是可行的。
2.2 重复性限分析
2.2.1 油品谱图分析
根据图 1谱图,对6种油品的风化信息进行分析。正构烷烃谱图显示油品A为前峰型分布谱图,其余均为后峰型分布谱图,油品B、C谱图相似,油品E低峰碳的风化程度较重,油品F低峰碳也存在一定程度的风化;萜烷谱图显示不同油品的萜烷分布存在一定的差异,尤其是C23萜烷与C24萜烷、C29αβ藿烷与C30αβ藿烷的相对含量存在明显差别,此外油品B、油品E的三环萜烷风化较严重;甾烷谱图显示C27-C29αββ甾烷3种甾烷组分的相对分布存在一定差异,其中油品A以C28αββ甾烷占优势与其他油品存在明显的不同,油品B、油品D峰型相似,油品F以C29αββ甾烷占优势。
2.2.2 重复性限分析
图 4为采用重复性限方法对6种油样(A、B、C、D、E、F)进行比对分析的散点图,横坐标为6种油样的17个诊断比值,纵坐标为诊断比值大小,并以重复性限方法规定的误差(7%)做误差棒。如果同一诊断比值的误差棒线相交,则认为对应的诊断比值一致,否则不一致。一方面,从油品直接比对可以看出:对于油品E和F,两者大多数的诊断比值是一致和基本一致的,对于6种油品(A、B、C、D、E、F)的17个诊断比值中至少6个诊断比值(R6、R7、R10、R12、R13、R14) 基本一致,难于明显区分开来;另一方面,从诊断比值可以看出:对于诊断比值R8、R9、R11,6种油品也难于明显区分开来;对于诊断比值R2和R15,B、D、E、F 4种油品差异性不明显;对于诊断比值R4, B和C两种油品是一致的;对于诊断比值R16,B、C、D、E 4种油品差异性不明显;对于诊断比值R17,E、F两种油品一致,A、B、C、D 4种油品一致。因此,重复性限方法在鉴定油品一致性时,存在难于判断的情况[17-18],容易造成误判。实际上,重复性限方法在鉴定油品出现误判的根本原因可能是不同油品可能出现部分特征比值一致性的问题,当不同油品的部分诊断比值差异较小时用重复性限法难以对其进行区分。但更重要的是诊断比值参数“过多”带来的难于决断。因此,如何降低“过多”诊断比值参数的“多维性”,是寻求油指纹鉴别方法准确的途径之一,显然多维标度法可以有效弥补、完善重复性限法的一些不足。
此外,据报道[1, 8, 19]主成分分析法要求所提取的前几个主成分的累计贡献率达到一个较高水平时才能解释原始数据所表达的信息,而多维标度法没有这一限制且计算量较小;与聚类分析法相比,多维标度法弥补了聚类分析将一些高维样品强行纳入一维谱系中而使得原始样品简单化甚至失真的缺点,将高维研究对象简化到一个较为低维的空间内以寻求一个最佳空间维度而保持各研究对象数据的原始关系;多维标度法与t检验法相比,省去了两两样品之间对比繁琐的计算过程,即提高了效率也使结果更加直观。因此,多维标度法用于油指纹鉴定将为现有的油指纹鉴别手段提供一种可供选择的有效方法。
3 结论
(1) 多维标度分析法可以实现油样的分类鉴别,它不仅可以对差异较大的油品进行不同程度的区分,而且能对油指纹相似的油品进行很好的聚类分辨,分析结果直观可辨。
(2) 多维标度分析法适用于大量样品的分析鉴定,方法简单,能全面而又直观的表现研究对象之间的关系。
(3) 多维标度分析法省去了两两样品之间对比繁琐的计算过程,避免了不同油品多个诊断比值一致的情况下用重复性限法鉴别可能造成的误判。同时,多维标度法也可以弥补和完善主成分分析法、聚类分析法等,为油指纹鉴别手段提供一种可供选择的有效方法。
-
表 1 油样信息
Tab. 1 Information of oil samples
表 2 油样指纹诊断比值
Tab. 2 Diagnostic ratio of oil samples
表 3 油样间的距离矩阵
Tab. 3 The distance between sample matrixes
表 4 导出的二维坐标值
Tab. 4 Exported two-dimensional coordinate values
-
[1] 韩雪. 海洋溢油油指纹多元统计鉴别方法研究[D]. 青岛: 中国海洋大学, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10423-1013368289.htm [2] SUN P Y, BAO M T, LI G M, et al.Fingerprinting and source identification of an oil spill in China Bohai Sea by gas chromatography-flame ionization detection and gas chromatography-mass spectrometry coupled with multi-statistical analyses[J].Journal of Chromatography A, 2009, 1216(5):830-836. doi: 10.1016/j.chroma.2008.11.100
[3] STOUT S A, UHLER A D, MCCARTHY K J.A strategy and methodology for defensibly correlating spilled oil to source candidates[J].Environmental Forensics, 2001, 2(1):87-98. doi: 10.1006/enfo.2001.0027
[4] 孙培艳, 赵玉慧, 曹丽歆, 等.油指纹鉴别中诊断比值的重复性限比较法[J].海洋环境科学, 2011, 30(1):110-113, 117. http://www.cnki.com.cn/Article/CJFDTOTAL-HYHJ201101025.htm [5] ZHOU P Y, CHEN C S, YE J J, et al.Combining molecular fingerprints with multidimensional scaling analyses to identify the source of spilled oil from highly similar suspected oils[J].Marine Pollution Bulletin, 2015, 93(1/2):121-129.
[6] BORG I, GROENEN P.Modern multidimensional scaling:theory and applications[J].Journal of Educational Measurement, 2003, 40(3):277-280. doi: 10.1111/jedm.2003.40.issue-3
[7] DOUGLAS CARROLL J, ARABIE P.Chapter 3-multidimensional scaling[M]//BIRNBAUM M H.Measurement, Judgment and Decision Making.2nd ed.San Diego:Academic Press, 1998:179-250.
[8] 阳长征, 周永生, 李慧敏.多维标度法在企业战略决策中的应用[J].全国商情(理论研究), 2010(21):27, 30. http://www.cnki.com.cn/Article/CJFDTOTAL-QGSQ201021013.htm [9] 刘莎, 马江洪, 刘东航.多维标度法在亲属关系中的应用[J].数学的实践与认识, 2014(15):261-266. http://www.cnki.com.cn/Article/CJFDTOTAL-SSJS201415034.htm [10] 骆文淑, 赵守盈.多维尺度法及其在心理学领域中的应用[J].中国考试, 2005(4):27-30. http://www.cnki.com.cn/Article/CJFDTOTAL-KSYJ200504009.htm [11] 戴益民, 邓小清, 杨晓焱, 等.应用多维标度法预测硝基苯化合物的生物毒性[J].长沙理工大学学报:自然科学版, 2008, 5(1):93-97. http://www.cnki.com.cn/Article/CJFDTOTAL-HNQG200801018.htm [12] READMAN J W, MANTOURA R F C, LLEWELLYN C A, et al.The use of pollutant and biogenic markers as source discriminants of organic inputs to estuarine sediments[J].International Journal of Environmental Analytical Chemistry, 1986, 27(1):29-54.
[13] 冯国生, 刘荣, 吕振通, 等.SPSS统计分析与应用[M].2版.北京:机械工业出版社, 2014. [14] GB/T 21247-2007, 海面溢油鉴别系统规范[S]. [15] 朱建平.应用多元统计分析[M].2版.北京:科学出版社, 2012. [16] SHEPARD R N.Multidimensional scaling, tree-fitting, and clustering[J].Science, 1980, 210(4468):390-398. doi: 10.1126/science.210.4468.390
[17] 刘新军, 马启敏, 杨雪娜.海面溢油不同油品特征比值的一致性研究[J].海洋湖沼通报, 2015(3):139-146. http://www.cnki.com.cn/Article/CJFDTOTAL-HYFB201503017.htm [18] 郝友亮. 海洋溢油化学指纹分析鉴定方法研究[D]. 青岛: 中国海洋大学, 2011. http://cdmd.cnki.com.cn/Article/CDMD-10423-1011228689.htm [19] 孙培艳, 王鑫平, 包木太.油指纹鉴别中特征比值的t检验比较法[J].湖南大学学报:自然科学版, 2010, 37(9):79-82. http://www.cnki.com.cn/Article/CJFDTOTAL-HNDX201009015.htm -
期刊类型引用(2)
1. 于卓玉,裴伟,朱永英,王鹏乾. 基于红外光谱与气相色谱耦合的海上溢油鉴别技术. 海洋环境科学. 2020(06): 926-931 . 本站查看
2. 肖寒,肖安山,孙晓英,马明. 海上溢油指纹鉴别技术现状及展望. 安全、健康和环境. 2019(02): 1-4 . 百度学术
其他类型引用(4)