·临床研究·

定量CT对骨质疏松症诊断价值的meta分析

梁 鲲, 刘 勇

(同济大学附属第十人民医院放射科,上海 200072)

【摘要】目的 对定量CT在骨质疏松症中的诊断价值进行meta分析。方法 按照循证医学诊断meta分析的相关原则,对PubMed、Google学术、中国知网、百度学术中定量CT诊断骨质疏松症的相关文献进行检索,时间与语言不限。对筛选出的文献分别进行双变量混合效应及层次综合受试者工作曲线模型分析,并对其异质性进行分析。结果 共筛选出13篇文献,15组研究,两种分析方法均表明纳入文献的总敏感性为0.84(95% CI: 0.68~0.93),总特异性为0.78(95% CI: 0.66~0.87),SROC曲线下面积为0.88(95% CI: 0.84~0.90),表明该诊断方法具有较高的诊断价值。结论 定量CT骨质疏松症的筛查中具有较高的价值,在疾病的确诊中尚需要结合其他临床资料进行综合诊断。

【关键词】定量CT; 骨质疏松症; 双变量混合效应模型; 层次综合受试者工作曲线模型

骨质疏松症是现代社会常见的老年病。据统计,全球50岁以上人群的平均患病率为10%,亚洲人群的发病率远高于欧美、非洲人群。骨质疏松症是老年人骨折的主要危险因素。骨质疏松症的早期筛查,尤其是在50岁以上人群中显得颇为重要。双能X线吸收法(dualenergy X-ray absorptiometry, DXA)常用于骨质疏松症的诊断,DXA通过测量髋关节或腰椎的骨矿密度,从而评估骨质疏松或骨量减少的程度,WHO将其作为评估骨质疏松症的金标准。然而由于DXA尚未在国内普及,限制了国内筛查骨质疏松症的发展[1]

近年来,随着定量CT(quantitative computed tomography, QCT)的优化改善,其在骨质疏松症中的诊断价值逐渐受到重视。QCT是通过CT值间接算出骨密度的方法,国际临床骨密度学会将其列为测量骨矿密度的标准手段之一,并将QCT测得的BMD<80mg/cm2确定为诊断骨质疏松症的阈值。然而,由于QCT的测量值受人群特征等因素影响较大,且文献中尚缺乏50岁以上人群中准确性的系统性评价,因而影响了QCT对高危人群中的筛查价值[2]

本meta分析旨在系统地评价定量CT对50岁以上人群骨质疏松症的诊断效果,并评估其特异度、灵敏度。

1 资料与方法

1.1 文献检索

由两个评价者在PubMed、Google学术、中国知网、百度学术中检索自建库至2016年12月期间公开发表的全部研究,发表语言不限。检索词包括“quantitative computed tomography”、“diagnosis”、“DXA”、“osteoporosis”、“定量CT”、“诊断”、“骨质疏松”,并对以上检索词进行组合。同时检索相关综述钟引用的部分参考文献。

1.2 纳入标准

(1) 研究中诊断标准采用了WHO提出的DXA评估骨质疏松症的诊断标准: DXA测定的多个部位的骨矿密度的T值,数值最低者小于2.5的标准差即可诊断为骨质疏松症;(2) 提供了计算特异度和灵敏度的相关数据;(3) 明确提出研究对象是可能出现骨质疏松症患者;(4) 研究中同时包含有DXA和QCT的诊断结果;(5) 排除病例报道和综述;(6) 排 除了非患者数据的研究;(7) 排除了体外、动物或非活体研究;(8) 排除研究对象只针对已确诊为骨质疏松症的患者。

1.3 研究质量的评价

(1) 研究样本的纳入人群包括了不同性别、不同年龄段、不同骨质疏松程度。(2) 采用了以DXA、病理活检为金标准的测量方法,并将QCT的测量结果与其进行了比较。(3) 数据结果进行比较时采用了盲法。(4) 两种测量方法实施时,无明显干扰试验结果的因素,金标准按上述诊断标准实施,QCT按国际临床骨密度学会提出的BMD<80mg/cm2进行诊断。(5) 研究中不含有可疑灵敏度、特异度,阳性似然比的数据予以排除。(6) 全部纳入文献采用上述标准,并使用QUADAS-2对文献进行质量评价[3]

1.4 提取数据

两名研究者根据上述标准筛选出符合标准的文献13篇(数据15组)[4-16],对文献中研究作者、所属国家、文献发表时间、研究对象特征、真假阳性数(tp、fp)、真假阴性数(tn、fn)进行汇总统计,见表1。

表1 纳入文献一般情况

Tab.1 Information of articles included in study

作者/年份tptnfnfp江旭[10]2016 7 2150李晓玉等[6]2012021533李凯等[9]2015519041132李娜等[8]2013279621163李新民等[5]201129247301李娜等[7]20122441471Taylor等[11]2014227916Blomquist等[16]201631267张绍伟等[4]2013432310285Pickhardt等[13]2011292240143Edelmann-Schäfer等[14]201133703Clowes等[15]20061422397391Clowes等[15]2006613188599Schneider等[12]1992467539李新民等[5]201132211307

1.5 统计学处理

本研究采用双变量混合效应及层次综合受试者工作曲线模型对文献进行meta分析,两种模型属于随机效应模型,很好地避免了阈值效应对meta分析结果的影响,同时将文献内抽样误差、文献间结果差异、阈值效应均考虑在内,使其对一致性的探讨更加充分[17]

2 结 果

2.1 文献异质性的检验

本研究通过绘制双变量盒图,对本研究中所有纳入文献进行分析,结果显示: 本研究结果还存在一定的异质性,见图1。

图1 异质性检验的双变量盒图
Fig.1 Bivariate Boxplot of heterogenicity test for articles included in study

2.2 特异性和敏感性的森林图

合并特异度为0.84(95% CI: 0.68~0.93),灵敏度为0.78(95% CI: 0.66~0.87),阳性似然比为3.8(95% CI: 2.4~6.2),阴性似然比为0.21(95% CI: 0.10~0.43),诊断优势比为19(95%CI: 7~49),灵敏度和特异度的Q值分别为232.15、860.92(P<0.01),表明本研究异质性较大,不适合使用固定效应模型,见图2。

2.3 综合受试者工作特征曲线(SROC)

SROC曲线下面积(AUC)为0.88(95% CI: 0.84~0.90),见图3。

2.4 文献发表偏倚的检验

采用线性回归法检验漏斗图的不对称性。线性回归检验显示: 漏斗图中回归直线与横轴夹角几乎垂值,表明本研究文献发表偏倚较小(P=0.92>0.01),见图3。

2.5 单变量meta回归结果

为了探讨文献质量对回归结果的影响,以QUADAS-2量表对个文献的评价结果作为单变量,对本研究的所有文献进行单变量meta分析,量表中共有17个条目,经过评价,文献间共有11个条目存在存在差异。各条目从上至下分别以a-q来代表,分别生成单变量meta回归结果及联合模型结果,绘制单变量特异度和灵敏度森林图,见图4。

图2 纳入文献的总敏感性和特异性森林图
Fig.2 Forest map of combined sensitivity and specificity for articles included in study

图3 纳入文献的SROC模型与Deek漏斗图
Fig.3 Summary receiver operating curve and Deek’s funnel plot for articles included in study

图4 文献质量评价图与特异度和灵敏度的单变量meta回归
Fig.4 Quality evaluation and univariate meta regression of sensitivity and specificity for articles included in study

2.6 层次综合受试者工作曲线模型(HSROC)meta分析结果

HSROC使另一种诊断meta分析的随机效应模型,但由于结果参数较复杂,限制了它的应用推广。本研究的HSROC结果见图5。模型中beta估计值为-0.29(95% CI: -0.94~0.35,Z=-0.89,P=0.378),提示曲线对称。Lamda值为2.89(95% CI: 1.95~3.84),表明该诊断方法有一定的准确性,在临床中有诊断价值。

图5 HSROC曲线
Fig.5 Hierarchical summary receiver operating curve model for articles included in study

3 讨 论

传统的文献综述在处理同一问题的多个研究结果报道时,通常是等权重的对待每个研究结果而得出结论,忽略了各原始研究样本含量大小,也没有对文献质量进行评价,因此结果的可靠度和真实度并不可靠。meta分析是对相同研究目的的多个独立研究结果进行系统分析、定量综合的一种研究方法,能从统计学角度达到增大样本含量、提高检验效能的目的,从而使临床决策依据综合信息证据而不是个人经验。随着SROC方法[18]的出现,诊断性试验的meta分析趋于完善,近年来被逐步引入我国的医学影像研究领域。诊断性试验常用的指标为灵敏度和特异度,同一试验中因为阈值的取值不同往往两者呈反比关系,其中一个指标升高另一个指标就会降低,因此单一指标不能反映诊断性试验的全貌。ROC曲线以灵敏度为纵坐标,(1-特异度)为横坐标,能较好地反映诊断性试验的特征,曲线上最接近左上角的一点的坐标就表示这一试验的灵敏度和特异度。对同一检测指标的多个不同试验进行meta分析,可根据它们的诊断优势比(DOR)的权重,用一条ROC曲线表示出来,这条曲线称为SROC曲线,通过计算可以得出AUC。AUC越大,越接近1.0,诊断真实性越好。在本研究中,QCT的灵敏度为84%,特异度为78%,SROC曲线下面积为0.88,说明QCT对骨质疏松症具有较高的诊断价值。

诊断性试验通常很难满足随机化原则,试验中几乎不可能把“试验”组和“对照”组完全随机化,故诊断试验常依照患者的就诊顺序进行分组;同时因为不同的研究者在判断试验结果时,常常采用不同的阈值,因此诊断试验结果大部分表现为较高的异质性。本研究中,虽然QCT的诊断标准采用国际上通用的BMD<80mg/cm2进行诊断,但各文献中诊断金标准不尽相同,所以仍有较高的异质性,这在检验结果中也有所体现[19]。因此,传统的固定效应模型并不适用本研究。采用随机效应模型进行统计量的合并是比较理想的选择。这种做法属于目前诊断试验中比较公认的方法。一般而言单一试验的特异度和灵敏度往往成负相关,传统方法中单一合并这两项指标通常会忽视这一相关性,可能导致对诊断试验正确性的低估,同时传统的SROC模型在文献的特异度、灵敏度、文献间偏畸及阈值效应的评估上具有缺陷,为避免种情况的发生,本研究采用两种随机效应模型进行统计,并进行了结果的相互映证。所得数据表明,两种方法的统计结果差别不大,说明结果较可靠。Deek漏斗图上数据点的回归直线提示提示本研究的文献发表偏畸较小,说明文献中结果的比重比较均衡。本研究纳入的文献无语言限制,尽量避免了语言偏畸和出版偏畸。通过对各文献方法学质量的评价可以看出,本研究的文献在金标准的选择和QCT评价方法上存在偏畸。

从总体上来说,QCT在各类不同人群骨质疏松症的筛查上比较可靠,其确诊骨质疏松症的能力欠佳,故骨质疏松症的确诊往往还需结合临床其他资料综合分析。

【参考文献】

[1] ENGELKE K, ADAMS JE, ARMBRECHT G, et al. Clinical use of quantitative computed tomography and peripheral quantitative computed tomography in the management of osteoporosis in adults: the 2007 ISCD Official Positions[J]. J Clin Densitom, 2008, 11(1): 123-162.

[2] 王玲,白云,周玉红.QCT检查在诊断、治疗骨质疏松中的应用[C]∥中国中药杂志.基层医疗机构从业人员科技论文写作培训会议论文集.北京: 中国中药杂志社,2016: 2329-2330.

[3] WHITING P F, RUTJES A W, WESTWOOD M E, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies[J]. Ann Intern Med, 2011, 155(8): 529-536.

[4] 张绍伟,李树金,陈秀娟,等.围绝经期妇女椎体骨密度与骨质疏松的相关性[J].河北北方学院学报(自然科学版),2013(6): 59-62.

[5] 李新民,程晓光,汪伟,等.采用ISCD定量CT(QCT)推荐标准对绝经后女性骨质疏松患病率的研究[C]∥郑州: 中华医学会第十八次全国放射学学术会议论文汇编,2011: 285.

[6] 李晓玉,李娜,苏永彬,等.腰椎定量CT与双能X线骨密度测量对老年男性骨质疏松的诊断效能比较[J].中国骨质疏松杂志,2012,18(11): 980-983.

[7] 李娜,李新民,孙伟杰,等.腰椎定量CT与双能X线骨密度测量对老年患者骨质疏松检出率的比较分析[J].中华骨质疏松和骨矿盐疾病杂志,2012,5(2): 83-88.

[8] 李娜,李晓玉,马毅民,等.比较腰椎定量CT与双能X线骨密度测量对老年人骨质疏松的诊断效能[C]∥天津: 中华医学会第五次中青年骨质疏松和骨矿盐疾病学术会议,2013: 105-106.

[9] 李凯,马毅民,刘丹.定量CT骨密度测量诊断中国老年男性人群骨质疏松[J].中国医学影像技术,2015,31(10): 1454-1456.

[10] 江旭.腰椎定量CT与双能X线骨密度测量对老年男性骨质疏松的诊断效果比较[C]∥中国中药杂志.基层医疗机构从业人员科技论文写作培训会议论文集.北京: 中国中药杂志社,2016: 709-710.

[11] TAYLOR A, WAXMAN K, IZFAR S, et al., Screening for osteoporosis after trauma: a new approach using quantitative computed tomography of the skull[J]. J Trauma Acute Care Surg, 2014,77(4): 635-639.

[12] SCHNEIDER P, BÖRNER W, RENDL J, et al., Significance of 2 different bone density measurement methods in the assessment of mineral content of the peripheral and axial skeleton[J]. Z Orthop Ihre Grenzgeb, 1992,130(1): 16-21.

[13] PICKHARDT P J, LEE L J, DEL RIO A M, et al. Simultaneous screening for osteoporosis at CT colonography: bone mineral density assessment using MDCT attenuation techniques compared with the DXA reference standard[J]. J Bone Miner Res, 2011,26(9): 2194-2203.

[14] EDELMANN-SCHFER B, BERTHOLD L D, STRACKE H, et al. Identifying elderly women with osteoporosis by spinal dual X-ray absorptiometry, calcaneal quantitative ultrasound and spinal quantitative computed tomography: a comparative study[J]. Ultrasound Med Biol, 2011,37(1): 29-36.

[15] CLOWES J A, PEEL N F, EASTELL R. Device-specific thresholds to diagnose osteoporosis at the proximal femur: an approach to interpreting peripheral bone measurements in clinical practice[J]. Osteoporos Int, 2006,17(9): 1293-1302.

[16] BLOMQUIST G A, DAVENPORT D L, MAWAD H W, et al. Diagnosis of low bone mass in CKD-5D patients[J]. Clin Nephrol, 2016,85(2): 77-83.

[17] BEGG C B. Meta-analysis methods for diagnostic accuracy[J]. J Clin Epidemiol, 2008,61(11): 1081-1082.

[18] WALTER S D. Properties of the summary receiver operating characteristic (SROC) curve for diagnostic test data[J]. Stat Med, 2002,21(9): 1237-1256.

[19] FORMICA C A, NIEVES J W, COSMAN F, et al. Comparative assessment of bone mineral measurements using dual X-ray absorptiometry and peripheral quantitative computed tomography[J]. Osteoporos Int, 1998,8(5): 460-467.

Diagnosis value of quantitative CT in osteoporosis: a meta-analysis

LIANG Kun, LIU Yong

(Dept. of Radiology, Tenth People’s Hospital, Tongji University, Shanghai 200072, China)

【Abstract】Objective To evaluate the application of quantitative CT in diagnosis of osteoporosis with meta-analysis. Methods According to the principle of diagnosis test in meta-analysis and QUADAS-2 scale, we searched Pubmed, Google Scholar, CNKI, Baidu Scholar for papers on osteoporosis diagnosed by quantitative CT. We calculated the combined sensitivity and specificity based on bivariate mixed effects models and hierarchical summary receiver operating curve model and took tests for heterogeneity. Results Fifteen data sets from 13 articles were included for meta-analysis. The combined estimation for sensitivity was 0.84 (95% CI: 0.68-0.93); for specificity was 0.78 (95% CI: 0.66-0.87). The area under summary receiver operating curve (SROC) was 0.88 (95% CI: 0.84-0.90). The value of diagnosis has been proved in upper middle level. Conclusion Quantitative CT may be used in screening of osteoporosis for general population, however, the confirmed diagnosis of osteoporosis should be made on the basis of comprehensive investigations.

【Key words】quantitative CT; osteoporosis; bivariate mixed effects models; hierarchical summary receiver operating curve model

doi:10.16118/j.1008-0392.2017.03.014

收稿日期:2016-12-31

作者简介:梁 鲲(1978—),男,技师.E-mail: 46398972@qq.com

通信作者:刘 勇.E-mail: ly777dragon@sina.com

【中图分类号】R 445.3

【文献标志码】A

【文章编号】1008-0392(2017)03-0070-06