Page 111 - 《中国药房》2022年7期
P. 111

然比检验无法使用;而贝叶斯信息准则(Bayesian infor-                  效用积分体系下,EQ-5D-5L所能获得的最小值,而“ulim
        mation criterion,BIC)则是一个非常适合的方式,可以很               (1)”为最大值。此处采用从中国类风湿性关节炎患者
        好地指示出分布类型合适的数量,以及不同分布类型似                           人群的EQ-5D-5L效用积分体系获得的最小值(-0.391)
        然值的图形。分布类型数量的增加,会使模型拟合度有                           和最大值(1)。需要注意的是,若此处不进行设定,模型
        一定增加,但在一定程度上也会使这个分布类型本身失                           默认使用英国的效用积分体系。“aldvmm”的命令可通过
        去意义(例如将某几个值作为一个分布类型单独列出,                           在Stata 16软件中输入“findit aldvmm”获取(下载并安装
        而实际这些值为异常值,并不能很好地代表实际分布情                          “SJ-16-4 st0401_1”)。ALDVMM 的命令语法以及选项
                                                                                        [12]
        况)。而如果在分布类型数量与单个分布的大小(分布                           等详情可参考 Hernández Alava 等 发表于 2015 年的文
        涉及的范围)之间做出一个折中选择,则可以使这个模                           献,该文献对相关问题进行了较为详细的描述。
        型更具有意义,从而做到对样本外数据进行更有效的预                                           表1 模型演示结果
          [11]
        测 。                                                                           Number of obs=169
            对于模型拟合度的检验,由于ALDVMM存在嵌套,                        Log likelihood=45.751 958  Wald chi2(3)=234.37
                                                                                      Prob>chi2=0.000 0
                                                  2
        Hernández Alava 等 并没有使用传统的调整后 R 、平均                 eq5d5l  Coef.  Std. Err.  z  P>z     95%CI
                        [11]
        误差(mean error,ME)、平均绝对误差(mean absolute              haqdi  -0.325 330  0.025 196  -12.91  0  -0.374 710~-0.275 940
        error,MAE)以 及 均 方 根 误 差(root mean square error,     age  -0.002 360  0.001 222  -1.93  0.053  -0.004 760~0.000 035
                                                            gender  -0.172 500  0.029 656  -5.82  0  -0.230 630~-0.114 380
        RMSE),而是使用了赤池信息准则(Akaike information                _cons  1.308 816  0.069 171  18.92  0  1.173 243~1.444 389
        criteria,AIC)和BIC。                                  /lns_1  -1.701 750  0.054 739  -31.09  0  -1.809 040~-1.594 470
                                                            sigma1  0.182 364  0.009 982     0.163 811~0.203 017
        1.4 模型演示示例
                                                               Log likelihood:对数似然值;Number of obs:样本量;Wald chi2
            为了让读者更好地了解 ALDVMM,本文使用笔者
                                                           (3):Wald χ 检验;Prob>chi2:P值
                                                                   2
        所在团队正进行的一项研究数据进行简单示例,通过
                                                           2 模型优势
        ALVDMM 模型将 HAQ-DI 映射到 EQ-5D-5L 上。该项
                                                               从已有的研究结果来看,ALDVMM 相对于传统映
        数据包含了中国类风湿性关节炎患者的 EQ-5D-5L 得
                                                           射模型具有明显的优势,主要体现在以下几个方面:
        分、HAQ-DI得分、年龄和性别等信息。其中,EQ-5D-5L
                                                               (1)能处理边界值,且拟合度更高。相较于传统的
        得分分布如图2所示。
                                                           线性模型(如 OLS 模型等),ALDVMM 能有效处理边界
            1.5                                            值,且在边界等极端值处的拟合度相较于已有的可处理
                                                           边界值的模型更高。
                                                               (2)能更真实地反映完全健康效用值与中等健康效
            1.0
                                                           用值的差距。如前所述,EQ-5D效用值的分布并不具有
            密度                                             完全连续性。传统的映射模型将 EQ-5D 获取的效用值

            0.5                                            当作一个连续性分布来处理,并没有完全还原其最真实
                                                           的分布情况;而 ALDVMM 内嵌多个模型的特性使其在
                                                           处理该问题时显得更加灵活,能更精确地捕捉到完全健
              0
              -0.5         0          0.5         1        康效用值与中等健康效用值的差距。
                             EQ-5D-5L得分
                                                               (3)能捕捉多峰的分布形态。EQ-5D 常出现如图 1
           图2 ALDVMM演示中的EQ-5D-5L得分分布
                                                           所示的分布形态,即整个分布形式并非单峰分布,而是
            将数据导入 Stata 16 软件后,设定 EQ-5D-5L 得分、             存在多个峰值。针对这种现象,传统的映射模型无法对
        HAQ-DI 得分、年龄和性别的变量名分别为 eq5d5l、haq-                 其有效识别,但ALDVMM得益于内嵌的多个模型,可以
        di、age、gender,使用命令“aldvmm eq5d5l haqdi age gen-    更真实地捕捉实际分布形态。以图1为例,针对其原始
        der,ncomponents(1)llim(-0.391)ulim(1)”即可获得映        分布情况,笔者分别采用线性回归模型、Tobit 模型、
        射结果(表 1),之后即可正常运行映射研究过程中的其                         ALDVMM 对其进行拟合,从各模型拟合的特性进行估
        他命令。其中命令“aldvmm”后的第 1 个变量为因变量                      计,可能拟合出如图3所示的分布直方图;但经过实际数
       (目标量表的值),其余为纳入研究的自变量。“ncompo-                       据的拟合,真实的拟合结果如图 4 所示。由图 3、图 4 可
        nents(1)”为设定的分布群数量,此处根据实际分布情                       知,ALDVMM在还原真实分布上具有更好的效果。
        况,同时为方便展示设定了1个分布群(需要注意的是,                              总体而言,ALDVMM提供了一个半参数框架,可在
        ALDVMM 对于只有 1 种分布群的数据也是适用的,此                       其中对未知或非标准的分布形态进行建模,具有较高的
        时与 Tobit 模型类似)。“llim(-0.391)”是指在所使用的               灵活性。


        中国药房    2022年第33卷第7期                                               China Pharmacy 2022 Vol. 33 No. 7  ·869 ·
   106   107   108   109   110   111   112   113   114   115   116