杭州健澜科技有限公司：人工智能技术在医药研发中的应用

人工智能技术在医药研发中的应用

来源

中国新药杂志 2020 年第29卷第17期

作者

刘伯炎，王群，徐俐颖，褚淑贞

中国药科大学国家药物政策与医药产业经济研究中心

摘要

人工智能技术在医药领域的应用给整个行业带来巨大的变革，为了加快实现利用人工智能技术为医药行业赋能的目的，本文首先对人工智能技术在医药研发领域的应用进行了概括，概述人工智能在医药研发各专业领域中的应用情况，最后提出了未来人工智能在我国医药研发方面面对的难点以及相应的建议。

关键词

人工智能; 医药行业; 药物研发

_正文_

人工智能是一种先进的技术，它能利用计算机的高速处理和分布式计算能力来模拟人脑的信息处理能力和学习能力，使计算机能够分析和解决问题［1］。为抓住人工智能发展的重大战略机遇，打造人工智能发展的先发优势，中国政府于2017 年7 月颁布了“新一代人工智能发展计划”，将新一代人工智能( NGAI) 的发展提升为国家战略［2］; 同年12 月，工信部发布了“人工智能产业发展三年行动计划”，提出要在2020 年前实现一系列人工智能标志性产品的重大突破，在几个关键领域形成国际竞争优势。人工智能的发展可分为3 个阶段: 第一阶段始于1956 年建立的达特茅斯会议这一术语，建立了人工智能( AI) 这一术语; 在第二阶段，Hopfield 神经网络和BT 训练算法在20 世纪80 年代被引入，日本提出了第5 代计算机，语音识别与语音翻译计划也被提出，虽然技术继续发展，但人工智能还没有进入人们的生活; 第三阶段，乔治大学的Geoffrey Hinton 在2006 年与几位学者共同出版“A fast learning algorithmfor deep belief nets”一文中，首次提出了“深度学习”的概念，其后2012 年ImageNe 在图像识别领域取得了重大突破，人工智能从此走向发展的黄金阶段。目前，人工智能技术正处于从基础研发到工业化的关键时期，在商业应用方面已取得初步进展。

医药产业既是世界贸易增长最快的朝阳产业之一，也是一个与国民经济和民生有关的基础和战略性产业。人工智能技术在医疗健康领域中最早应用于医药研发，在健康管理、辅助诊疗、药物挖掘、药品调配甚至临床合理用药等诸多方面，都已经实现了人工智能技术的广泛应用和发展［3］。人工智能有望进一步为医药行业发展中的一些挑战性问题与发展难点提供切实可行的解决方案。而医药行业数据量极其庞大［4］，若将这些数据用于人工智能算法模型训练，然后用于医药研发的流程之中，能够有效加快研发速度，降低研发成本，提高研发成功率。2017年有多个人工智能相关公司与制药公司开展项目合作，药物研发领域里的重大改变与人工智能领域的突破性进展息息相关［5］。

根据《Nature》报道，新药开发的平均成本约为26 亿美元，大约需要10 年，包括小分子化合物的长期开发阶段、Ⅲ期临床试验以及注册批准过程。但是，只有不到1 /10 的药物可以成功通过并上市［6］。2016 年，塔夫茨大学药物开发研究中心关于新药开发成功率的权威数据表明，在过去40 年中，人体试验前的研发成本增加了10 倍，临床研究成本和开发增加了21 倍，总成本增加了14 倍。尽管主要制药公司的销售额有不同程度的增长，但远远落后于研发成本的增长率。因此，近年来药物投资的回报率有所下降。2017 年德勤发布的《Pharma is‘gettinglower returns on Ｒ＆D’》显示， 2017 年全球前12 大制药公司的研发投资回报率仅为3． 2%，与2010 年的10． 1%相比大幅下降［7］。在投资回报率下降的同时，新药研发的成功率继续下降。根据塔夫茨大学( CSDD) 的数据，新药临床第一阶段到批准上市的成功率已从20 世纪80 年代的23% 大幅下降到今天的12%左右。但随着新药开发中人工智能取得突破性进展，这种下降趋势可能会放缓［8］。

鉴于人工智能技术在医药领域内得到越来越多的关注，以及在未来新药研发的重要位置，有必要对目前的研究及应用现状进行归纳总结。本文首先概述人工智能的主要方法，论述人工智能的特点，综述人工智能在医药研发各专业领域中的应用情况，讨论国内外实践经验，归纳人工智能应用的关键问题，最后提出建议并总结。

人工智能概述

1． 1 人工智能的主要应用领域

人工智能的主要应用领域包括机器学习、进化计算、图像识别、自然语言处理、认知计算等。除此之外，其他领域仍在持续性发展中。目前机器学习的主流研究方向也是人工智能的重要应用领域，机器学习可以通过计算获得经验来提高系统本身的性能。机器学习可以分为传统机器学习和高级机器学习，传统机器学习包括无监督学习和有监督学习等，高级机器学习则包括深度学习、强化学习和迁移学习等［9 － 11］。

1． 2 人工智能的主要发展过程与自身特点

自从1956 年人工智能诞生以来，它经历了从高潮到低潮的各个阶段。最近的低潮发生在1992 年，当时日本的第五代计算机并未取得成功，其后人工神经网络热潮在20 世纪90 年代初退烧，人工智能领域再次进入低潮期。直到2006 年，Geoffrey Hinton提出了深度学习的概念并改进了模型训练方法，突破了神经网络的长期发展瓶颈，人工智能的发展迎来新一轮浪潮。此后，国内外众多知名大学和知名IT 企业开展了深度学习、强化学习、迁徙学习等一系列新技术的课题研究。同时，智能医疗、智能交通、智能制造等社会发展的新需求驱动人工智能发展进入了一个新阶段。

人工智能基于先进的机器学习、大数据和云计算，在感知智能、计算智能和认知智能方面具有强大的处理能力。它以更高水平接近人的智能形态存在，主要特点包括: ① 从人工知识表达到大数据驱动的知识学习技术。② 从多媒体数据的子类处理到跨媒体交互。③ 从追求智能机器到高层人机协作。④ 从关注个人智能到基于网络的群体智能。⑤ 从拟人机器人到更广泛的智能自我处理系统。

内容由凡默谷小编查阅文献选取，排版与编辑为原创。如转载，请尊重劳动成果，注明来源于凡默谷公众号。

人工智能在医药研发领域的应用现状

本文为全面了解目前研究现状以及关注热点，借鉴杨超凡等［12］的方法，通过Scrapy( 爬虫) ，在百度学术以“artificial intelligence and drug discovery /research”为关键词进行英文文献搜索，得到共361篇英文文献，爬取到了每一篇文献中摘要、关键词、研究点分析以及发表时间。在进行文献搜集时只搜集了英文文献，因为一方面，人工智能在药物研发领域国外研究起步较早且研究体系相对成熟，形成对比的是国内在该方面领域研究较少; 另一方面，本文要爬取信息并对文本进行分词处理，英文由标点符号、空格、单词组成，所以只用根据空格和标点符号便可将词语分开，进行处理时更为便捷和精确。

作为抽象信息的视觉表达手段，信息可视化可用于文档处理和数据挖掘。本文主要使用Python的Pandas 数据分析软件包进行文献的可视化处理和可视化分析，为了符合科学的测量原理，使研究结论更加具有时间敏感性，首先需要进行数据清理。为了更形象、更直观地展现出人工智能在医药研发方面的发展趋势，将对本文年度发表文章数使用Matplotlib 绘图库进行绘图分析。通过数据清洗后，分析年度相关发表论文量与发表文章数量趋势，见图1 和图2。

通过以上可视化分析，可以清楚了解到人工智能在医药研发方面的研究发展趋势，与上文分析人工智能发展趋势基本一致，同时也能发现近5 年人工智能在医药研发方面研究趋于减少乃至于停滞，亟须整个行业进一步投入以及寻找发展新活力。为了确认人工智能在医药研发重点应用领域，利用Python 对爬取到的数据中关键词、摘要、研究点分析进行了系统的词频统计，见表1。

从上述表1 关键词频可以直观看到，关键词词频数越大，说明该主题在人工智能医药研发方面中的关注度越高，研究越热。高频词中机器学习( MachineLearning) 、药物研发( Drug Discovery) 、医疗保健( Health Care) 、数据库( Databases) 、数据挖掘( Data mining) 、数据分析( Data Analysis) 、数据可视化( Data Visualization) 、数据交流( Data Communication)、归纳逻辑编程( Inductive logic programming) 、癌症( Cancer) 、神经网络( Neural Networks) 、药物制剂( Pharmaceutical Preparations) 、计算机科学( Computerscience) 、医药制造业( Pharmaceutical Industry)由于研究内容过于宽泛抑或与在医药研发方面的研究相关性不足所以被剔除。通过词频分析、清洗无关研究领域的词汇、综合近义词汇后最终确定了7个频次靠前的人工智能在医药研发重点研究领域:靶点药物研发( Drug Targets Development) 、药物挖掘( Drug Mining) 、化合物筛选( Compound Screening)、预测ADMET 性质( Predication of ADMET Properties)、药物晶型预测( Crystal Structure Prediction) 、病理生物学研究( Pathophysiology) 、药物重定位/药物再利用( Drug Ｒepurposing) 。人工智能的主要应用领域包括机器学习、进化计算、图像识别、自然语言处理、认知计算，7个频次靠前的人工智能在医药研发重点研究领域在这5 个主要应用领域各有涉及，具体关系如图3 所示。

2． 1 人工智能技术在医药研发的应用现状概述

2． 1． 1 靶点药物研发

研究和开发新药的关键是寻找、确定和制备药物筛选目标分子药物靶点。靶点药物是指药物在体内的结合位点，包括生物大分子，比如基因座、受体、酶、离子通道和核酸等，而识别新的有效的药物靶点是新药开发的重中之重，因此发现和验证大量分子靶标所涉及的工作极大增加了药物开发的负担［13］。利用机器学习算法可以组合设计并评估编码的深层知识，从而可以完全应用于旧时的单目标药物发现项目［14］。研究人员首先研究了靶点选择性结合均衡小分子的可能性来确定那些最易于化学处理的靶点，对于双特异性小分子，设计过程类似于单一目标药物。关键的区别在于功效必须同时满足2 个不同的目标。初创公司Exscientia是AI 公司这方面的典型代表，Exscientia 针对这些靶点药物通过AI 药物研发平台为GSK 公司的10 个疾病靶点开发创新小分子药物，来发现临床候选药物［15］。Exscientia 系统可以从每个设计周期的现有数据资源和实验数据中学习，这些原理近似于人类自我学习的过程，但AI 在识别多种微妙和复杂的变化以平衡药效方面更具效率。Exscientia 首席执行官霍普金斯表示，其人工智能系统已经可以用传统方法的1 /4 时间和成本得到新的候选药物［16］。目前，公司已与众多国际知名制药公司建立了战略合作关系，如Merck 公司、Sunovion 公司、Sanof 公司、Evotec 公司、强生公司。

2． 1． 2 药物挖掘

医学、物理学或材料科学领域的专业论文非常广泛，但这些专业论文中有大量独立的专业知识和研究结果，快速且有针对性地组织和连接这些知识和发现的能力对于药物挖掘是极其重要的。使用人工智能可以从大量的科学论文、专利、临床试验信息和非结构化信息中生成有用的信息。通过自然语言处理算法的深度学习优化，分析和理解上下文信息，然后进一步学习、探索、创建和翻译它所学到的知识以产生独特结论。该技术通过寻找可能遗漏的连接使以前不可能的科学发现成为可能: 可以自动提取药学与医学知识，找出相关关系并提出相应的候选药物，进一步筛选对某些疾病有效的分子结构，使科学家们能够更有效地开发新药。2016 年Benevolent AI 公司曾通过人工智能算法在1周内确定了5 种假造药物，用于治疗肌萎缩侧索硬化。Benevolent AI 使用AI 算法建模来确认化合物对睡眠的潜在影响，这是解决帕金森病相关嗜睡症状的一大机会。该公司目前的药物研发产品组合表明，它可以将早期药物研发的时间缩短4 年，并有可能在整个药物研发过程中将药物研发的平均效率提高60%［17］。

2． 1． 3 化合物筛选

化合物筛选是指通过标准化实验方法从大量化合物或新化合物中选择对特定靶标具有较高活性的化合物方法，这样通常需要很长的时间和较多的成本，因为要从数万种化合物分子中选择与活性指数相匹配的化合物。Atomwise 是硅谷的一家人工智能公司，开发了人工智能分子筛选( AIMS) 项目，该项目计划通过分析每种疾病的数百万种化合物来加速拯救生命药物的开发。同时，该公司开发了基于卷积神经网络的AtomNet 系统，该系统已经学习了大量的化学知识和研究数据。该系统分析化合物的构效关系，确定药物化学中的基本模块，并用于新药发现和新药风险评估。目前，AtomNet 系统已经掌握了很多化学知识和研究资料， 2015 年AtomNet 只用1 周时间已经可以模拟2种有希望用于埃博拉病毒治疗的化合物［18］。

2． 1． 4 预测ADMET 性质

ADMET 性质是衡量化合物成药性最重要的参考指标［19 － 20］，化合物ADMET预测是当代药物设计和药物筛选中十分重要的方法。药物的早期ADMET 特性主要使用人或人源化组织功能蛋白作为药物靶点，体外研究技术结合计算机模拟研究药物与体内生物物理和生物化学屏障因子之间的相互作用。为了进一步提高ADMET性质预测的准确性，部分企业通过深度神经网络算法探索了结构特征( 包括处理小分子和蛋白质结构) 的有效提取，加快了药物的早期检测和筛选过程，并大大减少了研发投入和风险。典型的公司包括晶泰科技等［21］。

2． 1． 5 药物晶型预测

多晶型现象是一种物质可以存在于2 种或更多种不同晶体结构中的现象，对于化学药物，几乎所有固体药物都具有多态性。由于晶型的变化可以改变固体化学药物的许多物理性质和化学性质，因此存在几种由于晶型问题而导致上市失败的药物，因此，晶型预测在制药工业中具有重要意义。使用人工智能有效地动态配置药物晶型可以完全预测小分子药物的所有可能的晶型，与传统的药物晶型研发相比，制药公司不必担心缺少重要的晶型。此外，晶型预测技术大大缩短了晶体的发展周期，更有效地选择了合适的药物晶型，缩短了开发周期并且降低了成本［22］。

2． 1． 6 病理生物学研究

病理生物学是一门研究疾病发生、发展和结果的规律和机制的科学。它是传播临床医学和基础医学的“桥梁”学科。病理生物学研究是医学研究和发展的基础。肌萎缩侧索硬化症( ALS，也称为渐冻症) 是一种毁灭性的神经退行性疾病，确切的发病机制尚不清楚。ALS 的突出病理特征是一些ＲNA 结合蛋白( ＲBPs) 在ALS 中发生突变或异常分布。人类基因组中至少有1 542 个ＲBPs，并且仅发现了与ALS 相关的17 个ＲBPs。IBM Watson 是认知计算系统和技术平台的杰出代表。IBM Watson 基于相关文献中的广泛学习，构建模型以预测ＲBPs 和ALS 相关性。2013—2017 年Watson 对引起突变的4 个ＲBPs 进行了高度评价，证明了该模型的有效性，然后Watson 筛选了基因组中的所有ＲBPs，成功鉴定了5 个ALS 中发生变化的新ＲBPs［23］。

2． 1． 7 药物重定位

多年来，研究人员逐渐认识到，提高疗效的最佳策略是基于现有药物治疗某些疾病，发现新的适应证并用于治疗另一种疾病。Visanji 博士与IBM Watson for Drug Discovery 合作，使用Watson 强大的文献阅读和认知推理技巧，在几分钟内筛选出3 500 种药物，并按最佳匹配顺序排列。然后研究人员根据这个“药物排名表”提出了6种候选药物，并在实验室进行了测试。第一种药物( 已经得到FDA 批准，但该适应证不包括帕金森病)已经在动物实验中初步验证［24］。

2． 2 人工智能技术

在医药研发方面国内发展现状我国在这方面起步相比于国外较晚， 2015 年百度公司和北京协和医院开展了癌症研究，结合北京协和医院医学研究优势与百度大数据、人工智能技术，找到了一个重要标志物用于早期诊断与中国大样本密切相关的食管癌，为食管癌提供早期筛查和诊断，为食管癌药物的开发提供靶标，这是中国医学研究和发展领域的重要一步［25］，这是我国人工智能在医药研发领域迈出的重要一步。

目前国内相关研究企业数量较少，仍处于起步状态。比较著名的企业有晶泰科技和深度智耀及冰州石生物技术公司。晶泰科技是谷歌与腾讯两大科技巨头共同投资的第一家人工智能公司，它也是中国第一家宣布与世界顶级制药公司进行战略合作的人工智能药物算法公司。该公司在过去严重依赖于实验和误差的一些药物研发步骤上使用药物晶型预测，以极其准确和快速的算法预测结果，帮助制药公司提高研发效率，最后加速药物开发。深度智耀是以人工智能为基础的药物研发和决策平台，以“决策大脑”为核心产品，同时公司已推出10 款产品，并于近日发布了新一代人工智能药物合成系统，该系统通过大量学习公共专利和论文数据库，大大提高了科学家的工作效率［26 － 27］。

另外，深度智耀还推出智能化医学写作，是在自然语言处理等助力下，自动写作绝大多数药物注册类文档。冰洲石生物科技( Accutar Biotech) 利用人工智能针对生物药进行药物筛选，已经利用人工智能平台进行了药物设计，其中一款药物针对乳腺癌，适用于乳腺癌常用药物tamoxifen 后3 ～ 5 年复发的患者，已经经过了细胞验证和初步小鼠动物实验，正在美国申请相关专利，并计划推进新药临床研究申请。

但人工智能在我国医药研发方面仍存在部分难点:

其一人才支持是一大问题，全世界大约有22 000名具有博士或以上学历的人工智能从业者和研究人员，而在中国只有约600 名。另外，国内人工智能人才几乎被几家主要的龙头企业所垄断。数据显示，未来中国人工智能人才缺口高达500 万［28］。人才集中是任何行业进一步发展的重要基础，也是人工智能在医药行业应用的关键因素。

目前，人工智能与药学的融合提升了对人才的需求。目前，高校培训与市场需求存在差距，产出人才远远少于市场需求。国家要重视复合型人才的培养，注重培养综合人工智能理论、方法、技术、产品和应用的垂直复合型人才，以及掌握经济、社会、管理、药学的复合型人才。当地政府也需要进一步加强产学研合作，鼓励高校、科研院所和企业合作开展人工智能学科建设，开展创新型专业人才的继续教育，建立公平合理的人才评估机制。

其二，国内创新药研发起步较晚，与国外相比，对于优质数据的积累还有一定距离。但利好消息是某些国内企业比如晶泰科技，在数据积累上颇为优秀。晶泰科技的数据来源是公共数据和私有数据结合，这其中包括晶泰科技在国内外工业、学术界的合作伙伴的积累。同时，晶泰科技通过量化计算算法也可以自行生成大量高质量的数据，这是其一大优势。总体大环境上，中国的医药大数据存在数据不完整、数据质量低、数据共享水平低等问题，医药数据的数量和质量将成为制药行业人工智能发展的主要障碍。

制药行业的专业门槛很高，而且链条很长。此外，中国长期的“多头管理”制度也是导致国内药品数据极度分散的重要原因。此外，医药领域的监管政策和体制改革也很频繁，使得获得连接历史药物数据变得困难。这些都会导致医药数据统计在完整度和精准度上的不足，从而影响相关决策。因此，国家应该在原有的标准管理体系框架内，加强信息和标准的整合，加强国家、行业现有相关标准的普及推广，并出台一系列激励和惩罚措施来推动标准的应用和落地。建立一套有效、完备、真实可靠的数据评估体系，进一步提升数据质量。同时应该加快完善数据共享开放机制，发挥数据应用价值，为人工智能在医药行业应用提供有质有量的数据支撑。

其三，与当前人工智能在医药领域发展火热形成鲜明对比的是政策法规的制定相对滞后。国内目前尚未有人工智能在医药研发方面的立法，但它已经受到学术界和医药行业的关注。2018年1 月6 日，第一届全国“人工智慧与未来法治”研讨会在西北政法大学举行。

参会者认为，未来人工智能将不能单独提出提供人性化的法律服务，仍然需要人们完成一些辅助工作。展望未来，人工智能法律建设将涉及人格权、知识产权、财产权、侵权责任认定、法律主体地位等方面［29］。目前，人工智能创作的知识产权归属问题、人工智能研发人员法律权利和义务定义问题、人工智能可能需要监管等，都没有明确的法律法规规定［30］。缺乏法律支撑的人工智能在医药行业的前景并不明朗。为了解决以上问题，国家应该加强人工智能知识产权保护，当前许多应用由医院、科研院所、人工智能企业等多方联合开发，最终知识产权归属需要进行明确。另外，建立追溯体系，保证算法的透明，使人工智能的行为及决策全程处于监管之下，明确研发者、运营者和使用者各自的权利和义务是重中之重。

人工智能在医药研发中的应用总结

由大数据支撑的广泛互联、高度智能、开放互动和可持续发展的医药产业，是未来发展的趋势，借助人工智能技术推动医药产业发展具有重要意义。虽然人工智能技术在医药产业各专业领域已有较多的应用研究，但总体上还停留在初级研究阶段，在可靠性与准确性方面仍存在部分问题，离实际广泛应用尚有差距。但是，人工智能技术为医药研发带来了无限可能，还需众多医药产业相关人员与政府能够紧抓历史机遇，积极投入，深入开展相关研究工作。

参考文献

详见中国新药杂志 2020 年第29卷第17期

免责声明

我们尊重原创作品。选取的文章已明确注明来源和作者，版权归原作者所有，如涉及侵权或其他问题，请联系我们进行删除。

展开阅读全文

页面更新：2024-05-13

标签：人工智能医药神经网络科技有限公司技术杭州新药化合物中国算法药物分子机器领域智能数据科技公司

1 2 3 4 5

杭州健澜科技有限公司：人工智能技术在医药研发中的应用

房地产税重磅！全国人大常委会授权国务院在部分地区开展改革试点

杭州健澜科技有限公司：AI阅片让医疗系统看到了AI技术的优势

口罩在磁共振检查中竟然也会伤人！警惕！又一起磁共振事故

酷相思，梦落枫

健澜人工智能“阅片无数”快速实现医学诊断，究竟多“神奇”？

全国1271家检验医学第三方实验室名单汇总

广西来宾市兴宾区区委副书记房红波一行莅临健培健澜科技考察调研

健澜科技&西湖论健：医学影像机器人“机智过人”的背后

人工智能“阅片机器人”进入医学影像科，未来看病可能不需排长队

健澜科技首席执行官季红丽：智慧医疗，走进你的“健康云”

杭州健澜科技有限公司解析｜医疗AI影像简史

全球首个AI生成3D虚拟主播参与新闻播报

鹅鹅鹅，万万没想到，有人敢坑鹅

荣耀X10发布，打响5G千元机第一枪

一把筋膜枪，戳破多少人的中产幻觉

杭州健澜科技有限公司：AI阅片让医疗系统看到了AI技术的

健澜人工智能“阅片无数”快速实现医学诊断，究竟多“神

广西来宾市兴宾区区委副书记房红波一行莅临健培健澜科

健澜科技&西湖论健：医学影像机器人“机智过人”的

人工智能“阅片机器人”进入医学影像科，未来看病可能不

健澜科技首席执行官季红丽：智慧医疗，走进你的“健康云”

杭州健澜科技有限公司解析｜医疗AI影像简史

「中国天眼」计划启动地外文明搜索，寻找外星人

北斗，当之无愧的中国骄傲

小米MIX 4发布，能否接力华为成国产高端智能机下一个“