9)数据处理
在安全检测检验中,通常用随机抽取的样本来推断总体。为了使样本的性质充分反映总体的性质,在样本的选取上遵循随机化原则:样本各个体选取要具有代表性,不得任意删留;样本各个体选取必须是独立的,各次选取的结果互不影响。
若采用了无效或无代表性的数据,会造成检查、检测结果错误,得出不符合实际情况的评价结论。对获得的数据在使用之前,要进行数据处理,消除或减弱不正常数据对检测结果的影响。在处理数据时常注意以下几种数据特性。
(1)概率。随机事件在若干次观测中出现的次数叫频数,频数与总观测次数之比叫频率。当检测次数逐渐增多时,某一检测数据出现的频率总是趋近某一常数,此常数能表示现场出现此检测数据的可能性,这就是概率。在概率论中,把事件发生可能性的数称为概率。在实际工作中,我们常以频率近似地代替概率。
(2)显著性差异。概率在0~1的范围内波动。当概率为1时,此事件必然发生;当概率为0时,此事件必然不发生。数理统计中习惯上认为概率P≤0.05为小概率,并以此作为事物间差别有无显著性的界限。
原设定的系统,若系统之间无显著性差异(通过显著性检验确定),就可将其合并,采用相同的安全技术措施;若系统之间存在显著性差异,就应分别对待。
数据整理和加工有3种基本形式:按一定要求将原始数据进行分组,作出各种统计表及统计图;将原始数据由小到大顺序排列,从而由原始数列得到递增数列;按照统计推断的要求将原始数据归纳为一个或几个数字特征。
10)“异常值”和“未检出”的处理
(1)“异常值”的处理。异常值是指现场检测或实验室分析结果中偏离其他数据很远的个别极端值,极端值的存在导致数据分布范围拉宽。当发现极端值与实际情况明显不符时,首先要在检测条件中直接查找可能造成干扰的因素,以便使极端值的存在得到解释,并加以修正。若发现极端值属外来影响造成则应舍去;若查不出产生极端值的原因时,应对极端值进行判定再决定取舍。
对极端值有许多处理方法。在这里介绍一种“Q值检验法”。
“Q值检验法”是迪克森(W.J.Dixon)在1951年专为分析化学中少量观测次数(n10)提出的一种简易判据式。检验时将数据从小到大依次排列:X1,X2,X3,…,Xn-1,Xn,然后将极端值代入以下公式求出Q值,将Q值对照表3的Q0.90,若Q值≥Q0.90则有90%的置信此极端值应被舍去。
式中 及 ——极端值与邻近值间的偏差;
——全距。
例:现场仪器测在同一点上4次测出:0.1014,0.1012,0.1025,0.1016,其中0.1025与其他数值差距较大,是否应该舍去
根据“Q值检验法”:
(4次观测的Q0.90=0.76)
所以,0.1025不能舍弃,测出结果应用4次观测均值0.1017。
(2)“未检出”的处理。在检测上,有时因采样设备和分析方法不够精密,会出现一些小于分析方法“检出限”的数据,在报告中称为“未检出”。这些“未检出”并不是真正的零值,而是处于“零值”与“检出限”之间的值,用“0”来代替不合理(可造成统计结果偏低)。“未检出”的处理在实际工作中可用两种方法进行处理:将“未检出”按标准的1/10加入统计整理;将“未检出”按分析方法“最低检出限”的1/2加入统计。总之,在统计分组时不要轻易将“未检出”舍掉。
(3)检测数据质量控制。检测质量控制经常采用两种控制方式来保证获得数据的正确性:一是用线性回归方法对原制作的“标准曲线”进行复核;二是核对精密度和准确度。
记录精密度和准确度最简便的方法是制作“休哈特控制图”,通过控制图可以看出检测、检验是否在控制之中,有利于观察正、负偏差的发展趋势,及时发现异常,找出原因,采取措施。
(4)安全评价的数据处理。收集到的数据要经过筛选和整理,才能用于安全评价。数据要:来源可靠,收集到的数据要经过甄别,舍去不可靠的数据;数据完整,凡安全评价中要使用的数据都应设法收集到;取值合理,评价过程取值带有一定主观性,取值正确与否往往影响评价结果。
为提高取值准确性可从以下三方面着手:严格按技术守则规定取值;有一定范围的取值,可采用内插法提高精度;较难把握的取值,可采用向专家咨询方法,集思广益来解决。