诊断准确性研究的质评工具解读,遇到外审也不怕

大家都知道在写meta分析的时候,都需要对文献的质量进行评估,避免“垃圾进,垃圾出”的后果。那么在诊断性meta分析中,有什么工具吗?答案就是“QUADAS”。


诊断准确性研究的质量评价工具QUADAS(Quality Assessment of Diagnostic AccuracyStudies)自2003年正式推出以来,就得到了广泛的应用。在实践过程中,一些个人经验、零星报道及各种反馈都提出了该工具在使用过程中需要进行改进的一些问题。因此,为了进一步完善该工具,研发小组对QUADAS于2011年推出了QUADAS-2。


相比QUADAS,QUADAS-2将一些易混淆的条目内容进行了删除和完善,将评价的条目改为单独评价的偏倚风险和临床适用性两个方面,并增加了标志性问题进行辅助判断。在此处需要说明一点:在RevMan5.0和5.1版中,使用的是QUADAS工具;而在RevMan5.2和5.3中使用的是QUADAS-2工具。QUADAS-2工具为QUADAS工具的改进版,于2011年10月发表。


诊断准确性研究的质评工具解读,遇到外审也不怕

QUADAS-2在诊断准确性研究的质量评价工具中的应用


QUADAS-2工具主要由4个部分组成: 病例的选择,待评价试验,金标准,病例流程和进展情况。所有组成部分在偏倚风险方面都会被评估,前3部分也会在临床适用性方面被评估。在偏倚风险判断上纳入了标志性的问题,这些研究设计方面的标识性问题与偏倚潜在性有关,旨在帮助评价者判断偏倚风险;但临床适用性的判断未纳入标志性问题。完整版的QUADAS-2工具资源在QUADAS官方网站(www.bris.ac.uk/quadas)及附录(www.annals.org)中可以获得。


QUADAS-2工具的4个组成部分都要进行偏倚风险评价。根据每部分纳入的相关标志性问题的回答“是”、“否”或“不确定”,可对应将偏倚风险等级判定为“低”、“高”或“不确定”。


若一个范围内所有标志性问题答案均为“”,那么可以被评定为低偏倚风险;


若所有信息化问题答案有一个为“否”,那么偏倚有存在可能性,评价作者接着就必须根据制定的指南判断偏倚风险。


“不确定”分级指的是文献中没有提供详细的内容以致评价者难以做出判断,此类只有在报道的数据不充足的情况下才可以使用。具体的条目如下:


1: 病例选择: 选择的病例是否会产生偏倚?


PATIENTSELECTION


问题1:是否纳入了连续或随机的病例?


Was aconsecutive or random sample of patients enrolled?


一个理想的研究应该连续或随机纳入带有疑似疾病的符合要求的患者,以避免潜在偏倚发生。如果文献中描述了病例的纳入是连续性的且是有时间范畴的,就评为“是”; 若什么都没介绍,就评为“否”; 若有纳入的时间界限,而没有指明是不是连续性的,就评为“不清楚”。


问题2:是否避免了病例-对照类研究设计?


Was a case-control design avoided?


在纳入的病例中,至少有一例诊断为不明确,就评为“是”; 若其中一组可以直接诊断,而另一组为疑似病例,那么就评定为“否”; 若提供的资料不足以判断的,就判定为“不清楚”。例如: 腮腺区良性肿瘤的诊断如果纳入的病例其中一组直接是考虑良性肿瘤的,而另一组考虑是良性肥大的,就评定为“否”; 若提供的资料不足以判断的,即为“不清楚”。


问题3: 研究是否避免了不恰当的排除?


Did the study avoid inappropriate exclusions?


作出不恰当研究排除( 如: 没有纳入“难以诊断”的患者) 的研究可能导致诊断准确性评价过高,研究纳入的已知的疾病和不符条件的对照组同样可以夸大诊断准确率; 相反,排除易诊断的患者就可能会导致诊断准确性过低。在纳入的病例中,若诊断不明确的病例占20%~30%及以上就可以评价为“是”; 如果都能较明确诊断,也就是没有包含他们诊断不明确的病例,就应评为“否”; 当纳入的病例中,诊断不明确的所占比例少于20%,就认为是“不清楚”。


2待评价试验: 待评价试验的实施或解释是否会产生偏倚?


INDEXTEST(S)


问题1:待评价试验的结果判读是否是在不知晓金标准试验结果的情况下进行的?


Werethe index test results interpreted without knowledge of the results of thereference standard?


判定待评价试验结果应该遵守盲法,因为金标准的信息可能会影响待评价试验的解释,所以评价者在判定试验结果时应该不知道病理结果。如果待评价试验始终是在金标准制定之前实施和解释,那么该条目就可以评定为“是”,相反则为“否”; 如果没有介绍的就评定“不清楚”。


问题2:若使用了阈值,那么它是否是事先确定的?


If a threshold was used, was it pre-specified?


选择测试阈值优化灵敏度和/或特异度可能会导致诊断效能的提高; 在独立的样本中,对患者使用相同的阈值,诊断效能可能变差。如果使用的阈值是在评判前确定的,就判定为“是”,相反即为“否”,信息不足以判断即为“不清楚”。


3 金标准: 金标准的实施及解释是否会产生偏倚?


REFERENCE STANDARD


问题1:金标准是否可以正确地区分目标疾病状态?


Is the reference standard likely to correctly classify the target condition?


从理论上讲,选择恰当的金标准很关键,它是决定诊断性试验的一个重要因素。金标准可以正确区分目标疾病或已是现有最佳方法就判定为“是”,不能准确区分即为“否”,判断依据不足就认为是“不清楚”。


问题2: 金标准的解释是否在所选用化验方法结果不知情的情况下做出的?


Were the reference standard results interpreted without knowledge of the results of the index test?


该项与待检测试验的标志性问题类似,就是金标准结果判读是否使用了盲法,偏倚的产生与之前金标准的解释有关。若金标准结果的判读是在不了解待评价试验结果下进行的即评价为“是”,相反则为“否”,难以判断即认为“不清楚”。


4 病例流程和进展情况: 病例的流程是否会产生偏倚?


FLOWAND TIMING


问题1:待评价试验和金标准之间是否有恰当的时间间隔?


Was there an appropriate interval between index test(s) and reference standard?


在相同时间对同一患者进行待评价试验和金标准得到结果是最理想的。导致高风险偏倚的时间间隔随疾病状态条件的不同而不同,对慢性疾病患者来说短期的延误可能不会产生问题,但对急性感染性疾病患者而言,它就可能产生问题。因此,此问题判定的关键取决于目标疾病。一般而言,对于急性疾病,时间间隔若非常短则评价为“是”,而慢性疾病,检测时间间隔即使比较长也应该评价为“是”;若对于某疾病而言,金标准和待评价试验的检测时间间隔过长,目标疾病可能已经发生变化,那么就评价为“否”; 信息不足则为“不清楚”。因此结合疾病种类对“恰当的时间间隔”的判定是关键。


问题2:所有的患者是否只接受了一个相同的标准?


Did all patients receive a reference standard?


问题3: 所有的患者是否只接受了一个相同的金标准?


Did patients receive the same reference standard?


问题2和问题3大致表示的意思是一致的,也就是患者是否接受一个相同的金标准。若只有一定比例的研究组接受了金标准,或者一些患者接受不同的金标准,那么就会发生验证偏倚。如果待评价试验的结果影响了是否执行金标准或使用哪个金标准的判断,那么评价诊断的准确性就可能存在偏倚。若可以清晰地判断所有的患者均通过了金标准验证其疾病状态,那么就判定为“是”,相反则为“否”,若研究未报告该信息则评价为“不清楚”。


问题4:是否所有的病例都纳入了分析?


Were all patients included in the analysis?


存在偏差,那么就存在潜在偏倚,也就是说所有纳入研究的病例都应该包含在分析内,不应有遗漏,因为失访的患者与那些留下的患者会系统性地产生差异。判断标准是所有病例都纳入研究及评价为“是”; 有病例遗漏为“否”; 未说明无法判断即为“不确定”。


临床适用性评价对于临床适用性,仅对其前3 个部分( 病例选择、待评价试验、金标准) 进行评价,其判定方法与偏倚风险的原理相同,主要是根据其与评价问题的匹配程度,也按“高”、“低”、“不清楚”判定等级,只是此部分不包括标志性的问题。评价者记录每一个作出了适用性判断的信息,然后在确定与研究不匹配的问题。判定适用性形式采用“是”、“否”或“不确定”。仍须强调的是,“不确定”这一类仅在报道的数据不充足时才可使用。具体的条目如下:


域1 病例选择: 相关纳入的病患和背景与评价问题匹配情况。


纳入研究的患者与评价问题所针对的目标疾病状态的患病程度,人口统计学特征,研究背景,及以前的测试报告等存在差异,那么就要考虑适用性问题。


域2 待评价试验: 待评价试验的实施和解释与评价问题的匹配情况评价。


一些因素( 如: 执行方案、检测技术) 的变化可能影响诊断准确性评价。如果待评价试验方法与评价问题不同,那么就可能要考虑其适用性。


域3 金标准: 金标准的适用性评价。


金标准是可以避免发生偏倚的,但是,目标疾病所规定的条件可能会与评价问题中的特定目标条件有所不同。因此若金标准不是很容易区分目标疾病就要考虑其适用性。

欢迎关注公众号启帆医学BioSCI, 创始人之一为留美海归生物医学博士,经过数年积累,汇聚了大批国内外顶级名校的教授、博士、博士后以及其他科研人员等强大人脉资源。公众号专注于生物医学研究、科研课题设计、SCI论文写作等领域的知识梳理和资料分享,为广大医务工作者提供便利。

展开阅读全文

页面更新:2024-05-16

标签:评价者   阈值   工具   可能会   适用性   条目   病例   间隔   患者   准确性   疾病   风险   目标   评价   时间   标准

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top