医学培训的 AI 飞跃:代理 rag、开放重量的 LLM 和实时病例洞察如何塑造纽约大学朗格尼分校的新一代医生
快速阅读: 《VentureBeat 公司》消息,纽约大学朗格尼健康中心开发了一种大型语言模型(LLM),帮助医生应对患者数据复杂和研究文献繁多的挑战。该模型每天分析电子健康记录并与相关研究匹配,生成定制邮件发送给医生。这种方法提高了诊断决策的准确性,并受到师生的好评。然而,模型仍存在一些不成熟的问题,需进一步优化。
订阅我们的每日和每周通讯,获取行业领先的人工智能最新更新和独家内容。了解更多患者数据记录可能复杂且有时不完整,导致医生未必总能及时获取所需全部信息。此外,医疗专业人员不可能跟上从行业中不断涌现的大量病例研究、研究论文、试验和其他前沿发展。纽约市纽约大学朗格尼健康中心提出了一种新颖的方法,旨在帮助下一代医生应对这些挑战。这个学术医疗中心——包括纽约大学格罗斯曼医学院和纽约大学格罗斯曼长岛医学院,以及六个住院医院和375个门诊地点——开发了一个大型语言模型(LLM),作为受人尊敬的研究伙伴和医学顾问。每天晚上,该模型处理电子健康记录(EHR),将其与相关研究、诊断提示和基本背景信息匹配,然后在第二天早上以简洁、定制的电子邮件形式发送给住院医生。这是纽约大学朗格尼开创性的医学教育方法的一部分——他们称之为“精准医学教育”,利用人工智能和数据提供高度定制的学生旅程。“‘精准’这一概念在医疗保健中是必需的,”纽约大学朗格尼健康中心教育信息学副主任兼医学教育创新研究所主任马克·特里奥拉告诉VentureBeat。“显然,证据表明人工智能可以克服医疗系统中的许多认知偏见、错误、浪费和低效,它可以改善诊断决策。”纽约大学朗格尼如何使用LLaMA增强患者护理纽约大学朗格尼正在使用基于最新版LLaMA-3.1-8B-instruct的开放权重模型和开源Chroma向量数据库,用于检索增强生成(RAG)。但这不仅仅是访问文档——该模型超越了RAG,积极运用搜索和其他工具来发现最新的研究文件。每天晚上,该模型连接到设施的EHR数据库,提取前一天在朗格尼就诊患者的医疗数据。然后,它搜索诊断和医疗状况的基本背景信息。使用Python API,该模型还搜索相关的医学文献,如PubMed,特里奥拉解释说,那里有“数百万篇论文”。LLM筛选综述、深入论文和临床试验,选择看似最相关的几篇,并将所有内容整理成一封邮件。第二天一早,医学生和内科、神经外科及放射肿瘤科的住院医生会收到一封个性化的电子邮件,其中包含详细的患者总结。例如,如果前一天有一名充血性心力衰竭患者进行了检查,电子邮件将提供心脏状况基本病理生理学的复习以及关于最新治疗方法的信息。它还提供自我学习问题和人工智能精选的医学文献。此外,它可能会给出居民下一步可以采取的步骤或他们可能忽略的动作或细节。“我们从学生、住院医生和教师那里得到了非常好的反馈,他们认为这种方式可以让他们毫不费力地保持最新状态,并将此纳入他们对患者护理计划的选择中,”特里奥拉说。对他个人而言,一个关键的成功指标是在系统故障导致几天内无法发送电子邮件时出现的——教师和学生抱怨他们没有收到他们依赖的早晨提示。“因为我们是在医生开始查房之前发送这些电子邮件的——这是一天中最疯狂和最忙碌的时刻之一——而他们注意到没有收到这些电子邮件并错过它们作为思考的一部分,真是太棒了,”他说。通过精准医学教育改变行业这个复杂的AI检索系统是纽约大学朗格尼精准医学教育模式的基础,特里奥拉解释说,该模式基于“高密度、无摩擦”的数字数据、人工智能和强大的算法。该机构在过去十年中收集了大量关于学生的数据——他们的表现、他们照顾患者所处的环境、他们书写的EHR笔记、他们做出的临床决策以及他们通过患者互动和护理进行推理的方式。此外,纽约大学朗格尼拥有医学学生可用资源的庞大目录,包括视频、自学材料、考试题目和在线学习模块。该项目的成功也得益于医疗设施的精简架构:它拥有中央IT、医疗侧单一数据仓库和教育侧单一数据仓库,使朗格尼能够结合其各种数据资源。首席医疗信息官保罗·特斯塔指出,伟大的AI/ML系统如果没有伟大的数据是不可能实现的,但“如果你的数据分散在系统中的各个孤岛中,那并不是一件容易的事。”医疗系统可能很大,但它运作起来就像“一个病人,一个记录,一个标准”。生成式AI让纽约大学朗格尼摆脱“一刀切”的教育模式正如特里奥拉所说,他的团队一直在寻找解决的主要问题是:“如何将诊断、个体学生的背景和所有这些学习材料联系起来?”“突然间,我们找到了一把打开这把锁的钥匙:生成式人工智能,”他说。这使得学校能够摆脱长期以来的标准做法,无论学生打算成为神经外科医生还是精神科医生——这两种截然不同的学科需要独特的方法。他说,重要的是学生在整个学习过程中接受定制教育,并获得适应他们需求的“教育提示”。但是你不能简单地告诉教师“花更多时间与每个学生单独相处”——这是人类不可能做到的事情。“我们的学生一直渴望这一点,因为他们认识到这是医学领域快速变化的时期,也是生成式人工智能的时代,”特里奥拉说。“这绝对会改变……成为一名医生意味着什么。”为其他医疗机构树立榜样当然,一路上也遇到了一些挑战。值得注意的是,技术团队一直在处理模型的“不成熟”。正如特里奥拉指出的那样:“令人惊讶的是,它们嵌入的知识多么广泛和准确,有时又是多么有限。它会在连续99次中完美、可预测地工作,然后在第100次中做出有趣的一系列选择。”例如,在早期开发阶段,LLM无法区分皮肤溃疡和胃溃疡,特里奥拉解释说,这两者“在概念上毫无关系”。他的团队此后专注于提示细化和基础,结果是“显著的”。事实上,他的团队对这套流程非常有信心,相信它能为其他人树立一个很好的例子。“我们倾向于开源和开放权重,因为我们想达到一个点,可以说,‘嘿,其他医学院,许多没有太多资源的学校,你们可以用低成本做到这一点,’”特里奥拉解释道。特斯塔同意:“它是可复制的吗?是我们想要传播的东西吗?绝对,我们希望在整个医疗保健领域传播它。”重新评估医学中的“神圣”实践可以理解的是,业界对可能嵌入AI系统的细微偏差有很多担忧。然而,特里奥拉指出,在这种用例中,这不是一个大问题,因为对AI来说这是一个相对简单的工作。“它在搜索,从列表中选择,它在总结,”他指出。相反,最大的表面关注点之一是技能退化。这里有一个关联:某些年龄的人可能还记得在小学学过书法——但由于他们在成年后很少有机会使用,他们很可能已经忘记了这项技能。现在,书法几乎成了过时的技能,很少在今天的初级教育中教授。特里奥拉指出,成为医生有一些“神圣”的部分,有些人不愿意以任何形式将这些交给AI或数字系统。例如,有一种观点认为年轻医生应该在非临床环境中积极研究和阅读最新的文献。但今天医学知识的丰富性和临床医学的“狂热节奏”要求一种不同的做事方式,特里奥拉强调。当谈到研究和检索信息时,他指出:“AI做得更好,这是一个许多人不愿相信的不舒服的事实。”相反,他提出:“让我们说这将赋予医生超能力,并找出人类和AI之间的副驾关系,而不是谁将做什么的竞争关系。”
(以上内容均由Ai生成)