時間:2024-01-14|瀏覽:315
西奈山伊坎醫(yī)學院的醫(yī)學研究人員完成了一項關于人工智能 (AI) 模型的新研究,以測試他們在獨立醫(yī)療實踐中的能力。該報告強調,大語言模型 (LLM) 已展現出對循證醫(yī)學 (EBM) 的熟練程度),標志著一項突破,可能為醫(yī)療保健開辟無數可能性。EBM 涉及使用現有的最佳研究證據來治療患者,而不是傳統方法或個人信仰。
鑒于醫(yī)療保健從業(yè)者可以獲得大量新醫(yī)學研究,在現代臨床實踐中采用循證醫(yī)學是一項艱巨的任務。
盡管如此,研究人員表示,人工智能聊天機器人為解決這一復雜性提供了一個“有前途的解決方案”。為了得出結論,研究人員對 OpenAI 的 ChatGPT、Gemini、LLAMA v2 和 Mixtral-8x7B 進行了實驗,使他們能夠訪問之前整理的案例文件。
這些模型根據現有數據做出臨床決策,研究人員根據多個指標測試其表現。在報告中,研究人員評估了法學碩士在抵抗幻覺方面的有效性、臨床決策的有效性以及對指南的遵守情況。
在最終報告中,ChatGPT-4 表現出了與其他法學碩士相比,在不受人為干擾的情況下在臨床環(huán)境中運行的最大能力?!胺▽W碩士可以成為循證醫(yī)學的自主實踐者,”報告中寫道。
“他們利用工具的能力可以與現實世界的醫(yī)療保健系統的基礎設施進行交互,并以指南指導的方式執(zhí)行患者管理任務?!北M管法學碩士在 EBM 方面很熟練,但研究人員還是確定了幾個需要改進的領域。他們的運營有所改善,包括主流法學碩士通常在 2021 年有培訓截止日期,這使得他們在該日期之后不知道新的醫(yī)療數據。
使用新的醫(yī)療信息微調模型是一項成本密集型項目,研究人員表示,這可能使其應用變得不可行。其他缺點包括要求模型生成有關不熟悉主題的信息而產生幻覺的風險,以及缺乏文化數據為了提高 LLM 在 EBM 中的表現,研究人員開發(fā)了一種名為檢索增強生成 (RAG) 的新工具,涉及將特定于任務的信息輸入到 AI 模型中。研究人員認為,使用即時工程,例如就像告訴法學碩士“你是一名醫(yī)學教授”一樣,可以提高模型響應的質量?!霸谀P吞幚韽碗s指南和診斷細微差別的能力方面觀察到了局限性,”研究人員說。
“檢索增強一代提出了更適合患者和醫(yī)療保健系統的建議。
“通過探索癌癥檢測和流行病追蹤的研究,人工智能和區(qū)塊鏈等新興技術正在醫(yī)學和公共衛(wèi)生領域取得重大進展。為了讓人工智能 (AI) 在法律范圍內正常工作并在面臨日益嚴峻的挑戰(zhàn)時蓬勃發(fā)展,它需要集成企業(yè)區(qū)塊鏈系統,確保數據輸入質量和所有權——使其能夠保證數據安全,同時保證數據的不變性。
查看 CoinGeek 對這項新興技術的報道,了解更多為什么企業(yè)區(qū)塊鏈將成為人工智能的支柱。觀看:人工智能、區(qū)塊鏈以及技術取勝的秘訣 width="562" height="315" frameborder="0"allowfullscreen= “allowfullscreen”>區(qū)塊鏈新手?
查看 CoinGeek 的區(qū)塊鏈初學者部分,這是了解更多有關區(qū)塊鏈技術的終極資源指南。