13分+，1区Top，JAMA子刊，模型开发测试新思路！性抓紧看过来~

尔云间一个专门做科研的团队

欢迎点赞+收藏+关注[给你小心心]

要说2023年生信最火的分析版块，应该非“临床公共数据库分析”和“孟德尔随机化研究”莫属了吧？

火的原因也是非常现实，那就是实现了生信内卷形势的突破，从常规生信思路中撕出一道口子，拼出了一条光明大道！并且这俩版块还非常适合临床科研人员，现在只靠纯纯的数据挖掘+分析就能快速发高分，就像生信刚开始的红利阶段，所以小云在这里真诚提醒感兴趣的小伙伴千万不要错过这个时机呀！千万不要等着文章数量爆发式增长，后面发文竞争力变大了再上车，那可真就追悔莫及了~ ~

今天分享这篇文章来自1区top JAMA子刊，13分+的NHANES数据库挖掘+分析，联合两大数据库，进行模型开发和验证，分析数据量较大但分析难度不大，这分值，这种杂志级别，对于临床科研人员来说称得上是非常好的评职称文章了，性价比非常高！具体怎么做就跟着小云来一探虚实吧~

（ps：还没有看到小云前面推荐的“临床公共数据库”挖掘文章的朋友，可以点击文末链接查看一下，小云真诚建议不要错过这个发文好途径~）

题目：美国有慢性肾脏疾病风险的成年人蛋白尿的估计患病率和检测

杂志：JAMA Netw Open

影响因子：IF= 13.7998

发表时间：2023年7月

研究背景

蛋白尿检测对于指导循证治疗以减轻慢性肾脏病(CKD)进展和心血管疾病发病率至关重要，但在CKD患者或CKD风险人群中普遍使用不足。该研究旨在使用两步法评估临床医疗系统中非随机检测的蛋白尿检出不足的程度。

研究思路

本研究使用NHANES作为全国代表性样本，建立了一个逻辑回归模型来估计蛋白尿(尿白蛋白/肌酐比值[UACR]≥30 mg/g)。然后将该模型应用于2017年1月1日至2018年12月31日EHR的192 108名活跃门诊患者，来评估在此期间有和没有蛋白尿测试的人群中蛋白尿的发生率。采用多变量逻辑回归分析检验随后一年内进行蛋白尿检测和CKD治疗（包括ACEi或ARB治疗、SGLT2i治疗和血压控制在130/80毫米汞柱或140/90毫米汞柱以下）之间的相关性。

主要结果

1.纳入人群特征

EHR队列共纳入192 108名2017年1月1日至2018年12月31日期间至少有2次门诊就诊的患有高血压或糖尿病的年满18岁成年人（图S1）。基线特征显示，192 108名患者中105 591名(55.0%)为女性，185589人(96.6%)患有高血压，50507人(26.2%)患有糖尿病，平均年龄为60.3 [15.1]岁，eGFR的平均值为84 (21) mL/min/1.73 m2。在纳入的患者中，33629人(17.5%)接受了UACR检测（表1）。

图S1 EHR参与者选择流程图

表1 EHR参与者基线特征

2.基于NHANES的蛋白尿评估模型的开发和评估

作者将13410名NHANES参与者作为开发队列，拟建立一个蛋白尿的评估模型（蛋白尿定义为UACR大于或等于30 mg/g），来应用于EHR研究人群中未经测试患者的蛋白尿患病率评估。作者根据年龄、性别、种族、民族、收缩压、eGFR、糖尿病、冠状动脉疾病和心力衰竭与蛋白尿的既定关联，将其作为自变量拟合成逻辑回归模型。连续变量以样条项建模，以适应非线性关联。

作者计算了 C 指数以评估模型的区分度，并比较了估计的蛋白尿患病率和观察到的患病率以评估校准情况。结果显示，蛋白尿评估模型显示了良好的区分度：NHANES人群的C统计值为0.730 (95% CI，0.719-0.740)，应用于EHR亚组进行UACR检验时，C统计值为0.682 (95% CI，0.676-0.688)。为了检查模型在蛋白尿检测率可能不同的亚人群中的可移植性，作者按糖尿病、保险类型和教育水平对模型性能进行了分层评估，并在EHR研究人群中进行UACR测试的亚组中评估模型性能。

结果发现模型校准效果非常好，但在 EHR 数据集中进行 UACR 检测的患者中，模型似乎低估了白蛋白尿患病率 8%-15%（图S3）。

图S3 蛋白尿预测模型的校准图

3.EHR数据集中患者的蛋白尿患病率评估

作者在HER数据集受试患者中，使用大于或等于30 mg/g的UACR测定值来确定蛋白尿的比例。对于未经测试的患者，应用开发的估计模型为每个患者分配一个蛋白尿的概率，蛋白尿的估计患病率被确定为蛋白尿的平均估计概率。蛋白尿的估计总患病率是测试人群和未测试人群中蛋白尿患病率的总和。结果显示，在接受测试的患者中，蛋白尿的真实患病率为34.3%(33629人中的11 525人)，而在未接受测试的患者中，蛋白尿的估计患病率为13.4%(158479人中的21 231人)。因此，整个研究人群中蛋白尿的估计患病率为17.1%(192108人中的32 756人)，其中只有35.2%(32756人中的11 525人)通过UACR试验检测到（表S5）。在所有人口统计学和共病亚组中，蛋白尿患者的检出率都明显偏低（图1）。检出率最低的是高血压和无糖尿病患者（10.4% [16 681 人中的 1742 人]）。

表S5 EHR数据集中患者蛋白尿患病率、检测率和检出率

图1 高血压和/或糖尿病患者的估计蛋白尿患病率和检出比例

4.UACR检测和蛋白尿治疗的关系

在149 554 名患者中研究 UACR 检测与蛋白尿治疗之间的关系，图 2 显示了接受 ACEi 或 ARB 治疗、接受 SGLT2i 治疗以及血压控制在 130/80 毫米汞柱以下或 140/90 毫米汞柱以下的患者比例。在估计蛋白尿风险的每个五分位数中，受试患者总体上更有可能接受ACEi或ARB和SGLT2i治疗。在多变量校正分析中，发现进行UACR检测与接受ACEi或ARB治疗的约2.4倍优势相关(OR，2.39 [95% CI，2.32-2.46])，与接受SGLT2i治疗的8.2倍优势相关(OR，8.22 [95% CI，7.56-8.94])，以及血压控制低于140/90 mm Hg的1.2倍优势相关(OR, 1.20 [95% CI, 1.16-1.23])（表3）。

图2 按蛋白尿估计风险五分位数分列的已检测和未检测患者的治疗情况

表3 尿白蛋白-肌酐比值（UACR）检测与蛋白尿治疗之间的关系

小结

这篇文章利用NHANES数据库开发了一个蛋白尿预测模型，然后在HER队列中进行应用和测试。该文章与常规NHANES数据库分析思路有所不同，2个数据库联用并且还进行了模型开发和测试，创新性较高，所以才仅仅依靠纯公共数据分析就发到13分+的JAMA子刊，这种数据库分析的硬实力毋庸置疑！如果你想在临床数据挖掘方向发高分文章，快来尝试一下这个思路吧！

如果你还苦恼于生信分析没有思路，或者嫌分析方法太过简单、太过老套，想要创新思路的，或者对单细胞分析、多组学联合分析等方向感兴趣的小伙伴快来联系小云吧！

小云持续为大家带来最新生信思路，更多创新分析思路请点击链接。需要复现或了解更多分析思路的朋友欢迎call小云，风里雨里小云等你！

1. 13分+纯生信，40天接收！SEER数据库+临床试验数据+其他数据库，只做生存分析就能发到13分+，性价比太惊人了！

2. 11分+临床数据库挖掘好文！3大数据库联合分析，外加转录蛋白代谢多组学分析，内容丰富到超乎想象，速围观！

3. 2个月发表9分+纯数据挖掘文章！都来看看NHANES临床公共数据库分析的硬实力！快速发文红利期，错过后悔1年

4. Q1区11分+影像组学！放射组学模型构建+基因预后特征验证，突破生信内卷的利器，抓紧学起来！

5. 川大华西医院陈永平团队：1区Top 11分“孟德尔随机化”新鲜出炉，纯数据挖掘，高性价比发文途径快上车！

展开阅读全文

页面更新：2024-05-16

标签：孟德尔毫米汞柱模型蛋白尿测试检出高血压新思路患者思路数据库

1 2 3 4 5

13分+，1区Top，JAMA子刊，模型开发测试新思路！性抓紧看过来~

尔云间一个专门做科研的团队

“海上石油加工厂”20年累计外输原油超5000万吨

专家学者共话图像图形前沿技术

英雄不再“无名” 复旦科技考古团队让吕梁烈士重获姓名

我国最大750千伏超高压输电环网开工建设

想要认识更多节能“黑科技”？他们来了！

挪威请求欧盟数据监管机构扩大对脸书母公司处罚范围（图）

济南黄河公路大桥复线主桥提前一年合龙，有望2025年6月通车

德媒：中国去年安装工业机器人数量超过世界其他地区总和

科学演讲局上线中秋特别版搜狐视频带你科学话中秋

张靖皋长江大桥南航道桥北主塔承台开始浇筑

李宇春高调出席辱华品牌活动，宋轶为日货站台，真当互联网没记忆

杨洪基：我唱三国演义主题曲，拿了9万块，毛阿敏唱历史的天空

福利丨从文学到电影，朱一龙颠覆式演绎《河边的错误》

梦鸽三次发声警告，造谣者何其猖狂？

天下第一淫棍：设计玷污60位女艺人，被判入狱39年，仍不知悔改！

通义千问开源超百亿参数模型大模型，周靖人：持续拥抱开源

我国科学家提出脑启发神经环路演化模型促进人工智能

人工智能开发出“癌症生存计算器”，可高度准确评估患者

AI赋能小商品产业应用，义乌发布首个商贸领域大语言模型

AIGC底层数据探索-高质量数据助力大模型迭代升级

华为官宣再获突破！全面完成5.5G关键技术测试，使传统网络

重量级光显材料测试平台落户烟台黄渤海新区

应县木塔巨型木质模型引人注目

新3D打印模型更有效治疗癌症

科大讯飞刘庆峰：讯飞星火医疗大模型效果超越GPT4

13分+，1区Top，JAMA子刊，模型开发测试新思路！性抓紧看过来~

尔云间 一个专门做科研的团队

尔云间一个专门做科研的团队