基准剂量法概述
基准剂量(benchmarkdose,BMD)方法F}lCrumpK.S.在1985年最先提出(Crump}1984,1985,1995),主要用于风险评估领域的剂量——反应分析,主要思想是采用剂量——反应模型拟合实验数据,再利用统计学的方法取得估计剂量。目前风险评估领域大多数人使用的定义是美国环境保护署(EPA)对基准剂量法的定义:基准剂量方法是指通过剂量——反应曲线获得使某种反应增加到某一个特定水平的剂量——反应分析方法,达到特定水平的剂量称为基准剂量(BMD),达到这一特定剂量水平的反应称为基准反应(benchmarkresponseBMR)。基准剂量下限(benchmarkdoselowerconfidencelimit,BMDL)是基准剂量BMD的可信区间下限1。
通常令基准反应BMR=10%,表示不良反应要控制在10%。实曲线表示剂量——反应模型的拟合曲线,与水平直线的交叉点所对应的横坐标是基准剂量BMD。基准剂量下限BMDL等于反应可能低于10%的剂量,这里的“可能”在统计学上通常取95%,虚曲线表示反应的95%可信区间上限,它是剂量的函数,虚曲线与水平直线的交叉点所对应的横坐标是基准剂量下限BMDL,表示在BMDL这个剂量下的不良反应以95%的概率小于10%。
基准剂量法由于能够提供较高的可信区间而被广泛使用。使用基准剂量评估方法一般需要四步:第一步是进行实验设计。基准剂量方法除要求反应指标是剂量的单调函数外,在毒物的剂量——反应本质上没有其它特殊要求;实验数据中包含的样本量不能太少,至少要满足统计建模的最低要求。第二步是根据反应指标的类型确定基准反应值BMR。第三步是选择并拟合基准剂量模型,在模型显著性条件下,根据基准反应BMR计算基准剂量BMD。第四步是计算基准剂量下限BMDL基准剂量下限的计算考虑了由实验设计造成的不确定性,并且当所有一实验剂量都存在显著不良反应时,仍然能够计算BMDL,外推实验剂量范围。使用基准剂量法分析后,应该给出全面的分析报告,供他人对比参照,一般要包括观察终点详细信息,BMR的取值,参数初始位设置、优化及假设信息,显著性检验信息,基准剂量BMD,基准剂量下限BMDL计算结果等。
目前使用基准剂量评估分析的理论和方法并不存在争议,学术界公认为是和传统NOAEL分析法相近的一种更科学更准确的分析方法,值得推广使用。但是目前基准剂量分析法并没有被许多地区和组织完全系统采用,欧洲食品安全局(EFSA)认为主要原因在于外部不同部门人员之间在风险交流上产生歧义造成的,比如BMD有无效应水平在风险管理者和消费者保护组织之间就存在不同认识。
基准剂量优化算法基准剂量优化算法主要是指这样的一个过程,在用剂量——反应模型拟合实验数据时,首先粗略估计参数的初始值,然后从初始值出发,通过反复拟合不断搜索较优参数值,直到模型参数取得“认为的”最优值为止。该过程涉及两个主要概念,一个是参数初始值粗略计算,另外一个是参数最优估计。基准剂量分析在此基础上估计基准剂量BMD值,以及基准剂量下限BMDL值。
参数初始值计算在数值分析软件的开发中,一般把参数初始值的计算分为三种情况。第一种情况是模型形式很复杂、不易化简计算,而且没有人为的经验可以借鉴,在这种情况下一般由计算机系统进行随机赋值,或者人为地猜测指定。从这样的初始值出发不断搜索计算,可以预想到时间的漫长以及不确定性,这样的求取参数初始值方法一般不作为软件的主要计算方法,有时作为计算的一种辅助办法在软件设置中供选择使用。第二种情况是模型形式较复杂,虽然不能通过化简求解,但是可以借助实验数据进行粗略计算,比如从实验数据中选取最大反应数据,最小反应数据,平均反应值等,将这些值带入剂量——反应模型,通过解方程组或线性回归等数学方法求得计算结果。第三种情况是对一般常用的主要数学模型,其模型形式相对简单,属于线性的,或者可以化简为线性的,比如带有指数的,可以对模型公式取对数转换成线性模型,然后用线性回归方法求解。第三种方法是目前常见的参数初始值计算方法。
线性回归(linearregression,LR)是数据分析领域运用非常广泛的一种统计学方法,线性回归方法分为简单线性回归方法和多重线性回归方法(陈宝林,2005)。目前基准剂量评估系统用于基准剂量分析的都是单变量,即只有一个自变量称为剂量(dose)。
参数最优估计参数估计也称为参数推断,是统计学中的一项重要统计推断。参数估计方法分为点估计和区间估计两类,点估计是指由样本观察值计算模型参数的估计值,到今天为止形成很多方法,包括最容易计算的矩估计(methodofmomentsestimators,MME),最常用最经典的极大似然估计(maximumlikelihoodestimation,MLE),介绍的通过使均方误差(MSE)最小的最小二乘法,还有1958年由图基提出的适用于有一偏样木或存在异常值等情况的“刀切法”(Jackknife),以及适用于多数概率分布的稳健估计,假设参数具有先验分布的贝叶斯估计等。区间估计是估计参数的一个可信区间,主要方法有枢轴法、自助法和贝叶斯法等。其基本思想是如果能找到这样的参数,参数使得出现己有实验样本的概率是最大的,那么就理所当然的认为这样的参数就是最好的,将这些值做为真实值的估计。极大似然估计法由统计学家和遗传学家在1912年最开始使用,如果假设模型正确,使用极大似然估计法推断参数是最优的。使用极大似然估计,首先要定义似然函数,但有时候似然函数存在,有时候不存在,或者可能还不唯一2。