|
西奈山伊坎医学院的医学研究人员完成了一项关于人工智能 (AI) 模型的新研究,以测试他们在独立医疗实践中的能力。
该报告强调,大语言模型 (LLM) 已展现出对循证医学 (EBM) 的熟练程度,标志着一项突破,可为医疗保健带来多种可能性。
EBM 涉及使用现有的最佳研究证据来治疗患者,而不是传统方法或个人信仰。 鉴于医疗保健从业者可以获得大量新医学研究,在现代临床实践中采用循证医学是一项艰巨的任务。 尽管如此,研究人员表示,人工智能聊天机器人为解决这一复杂性提供了“有前途的解决方案”。
为了得出结论,研究人员对 OpenAI 的 ChatGPT、Gemini、LLAMA v2 和 Mixtral-8x7B 进行了实验,使他们能够访问之前整理的案例文件。 这些模型根据可用数据做出临床决策,研究人员根据多个指标测试其性能。
在报告中,研究人员评估了法学硕士在抵抗幻觉方面的有效性、临床决策的有效性以及对指南的遵守情况。 在最终报告中,ChatGPT-4 表现出了与其他法学硕士相比在不受人为干扰的情况下在临床环境中运行的最大能力。
报告中写道:“法学硕士可以成为循证医学的自主实践者。” “可以利用他们利用工具的能力与现实世界的医疗保健系统的基础设施进行交互,并以指南指导的方式执行患者管理任务。”
尽管法学硕士在 EBM 方面很熟练,但研究人员发现了他们的操作中需要改进的几个领域,包括主流法学硕士通常在 2021 年有培训截止日期,这使得他们在该日期之后不知道新的医疗数据。 利用新的医疗信息微调模型是一项成本密集型项目,研究人员表示可能会使他们的应用变得不可行。
其他缺点包括要求模型生成有关不熟悉主题的信息而产生幻觉的风险,以及缺乏有关文化问题和抗生素耐药性的数据。
克服挑战
为了提高法学硕士在 EBM 中的表现,研究人员开发了一种名为检索增强生成(RAG)的新工具,涉及将特定于任务的信息输入到人工智能模型中。
研究人员认为,使用即时工程,例如告诉法学硕士“你是医学教授”,可以提高模型响应的质量。
研究人员表示:“模型处理复杂指南和诊断细微差别的能力存在局限性。” “检索增强一代提出了更适合患者和医疗保健系统的建议。”
通过探索癌症检测和流行病追踪的研究,人工智能和区块链等新兴技术正在医学和公共卫生领域取得重大进展。
观看:人工智能、区块链以及技术取胜的秘诀
区块链新手? 查看 CoinGeek 的区块链初学者部分,这是了解更多有关区块链技术的终极资源指南。
版权声明 本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。