九九这里有精品,色婷婷久久综合中文久久蜜桃,操比动态图,久草热草,**aaaa毛片免费视频,一级毛片aa**免费观看,成人免费aaaaa毛片

中國企業(yè)報集團主管主辦

中國企業(yè)信息交流平臺

微博 微信

網(wǎng)上問醫(yī)斷病,這輪AI行不行?

2023-07-18 10:31 來源:科技日報 次閱讀
 
網(wǎng)上問醫(yī)斷病,這輪AI行不行?

你在網(wǎng)上搜過“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語言模型(LLM)風生水起,人們開始嘗試用它來回答醫(yī)學問題或醫(yī)學知識。

  不過,靠譜嗎?

  就其本身而言,人工智能(AI)給出的答案是準確的。但英國巴斯大學教授詹姆斯·達文波特指出了醫(yī)學問題和實際行醫(yī)之間的區(qū)別,他認為“行醫(yī)并不只是回答醫(yī)學問題,如果純粹是回答醫(yī)學問題,我們就不需要教學醫(yī)院,醫(yī)生也不需要在學術課程之后接受多年的培訓了?!?/p>

  鑒于種種疑惑,在《自然》雜志新近發(fā)表的一篇論文中,全球頂尖的人工智能專家們展示了一個基準,用于評估大型自然語言模型能多好地解決人們的醫(yī)學問題。

  現(xiàn)有的模型尚不完善

  最新的這項評估,來自谷歌研究院和深度思維公司。專家們認為,人工智能模型在醫(yī)學領域有許多潛力,包括知識檢索和支持臨床決策。但現(xiàn)有的模型尚不完善,例如可能會編造令人信服的醫(yī)療錯誤信息,或納入偏見加劇健康不平等。因此才需要對其臨床知識進行評估。

  相關的評估此前并非沒有。然而,過去通常依賴有限基準的自動化評估,例如個別醫(yī)療測試得分。這轉化到真實世界中,可靠性和價值都有欠缺。

  而且,當人們轉向互聯(lián)網(wǎng)獲取醫(yī)療信息時,他們會遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

  研究團隊希望語言模型能提供簡短的專家意見,不帶偏見、表明其引用來源,并合理表達出不確定性。

  5400億參數(shù)的LLM表現(xiàn)如何

  為評估LLM編碼臨床知識的能力,谷歌研究院的專家謝庫菲·阿齊茲及其同事探討了它們回答醫(yī)學問題的能力。團隊提出了一個基準,稱為“MultiMedQA”:它結合了6個涵蓋專業(yè)醫(yī)療、研究和消費者查詢的現(xiàn)有問題回答數(shù)據(jù)集以及“HealthSearchQA”——這是一個新的數(shù)據(jù)集,包含3173個在線搜索的醫(yī)學問題。

  團隊隨后評估了PaLM(一個5400億參數(shù)的LLM)及其變體Flan-PaLM。他們發(fā)現(xiàn),在一些數(shù)據(jù)集中Flan-PaLM達到了最先進水平。在整合美國醫(yī)師執(zhí)照考試類問題的MedQA數(shù)據(jù)集中,Flan-PaLM超過此前最先進的LLM達17%。

  不過,雖然Flan-PaLM的多選題成績優(yōu)良,進一步評估顯示,它在回答消費者的醫(yī)療問題方面存在差距。

  專精醫(yī)學的LLM令人鼓舞

  為解決這一問題,人工智能專家們使用一種稱為設計指令微調的方式,進一步調試Flan-PaLM適應醫(yī)學領域。同時,研究人員介紹了一個專精醫(yī)學領域的LLM——Med-PaLM。

  設計指令微調是讓通用LLM適用新的專業(yè)領域的一種有效方法。產(chǎn)生的模型Med-PaLM在試行評估中表現(xiàn)令人鼓舞。例如,Flan-PaLM被一組醫(yī)師評分與科學共識一致程度僅61.9%的長回答,Med-PaLM的回答評分為92.6%,相當于醫(yī)師作出的回答(92.9%)。同樣,Flan-PaLM有29.7%的回答被評為可能導致有害結果,Med-PaLM僅5.8%,相當于醫(yī)師所作的回答(6.5%)。

  研究團隊提到,結果雖然很有前景,但有必要作進一步評估,特別是在涉及安全性、公平性和偏見方面。

  換句話說,在LLM的臨床應用可行之前,還有許多限制要克服。

◎本報記者 張夢然

點贊()
上一條:上海德達醫(yī)院團隊受邀參加美國血管外科協(xié)會年會2023-07-11
下一條:美首例機器人肝移植手術成功2023-07-19

相關稿件

治療帕金森病常備藥多地斷供 網(wǎng)售價高出醫(yī)保價十余倍 2021-10-22
阿里大語言模型“通義千問”亮相 引發(fā)市場關注 2023-04-12
王毅答記者問 這十五句精彩回應 擲地有聲 2021-03-08
關愛“罕見” 點亮生命之光——我國加速破解罕見病診療和用藥保障之困 2023-03-01
ChatGPT來了 AI企業(yè)如何應對 2023-02-14
國務院國有資產(chǎn)管理委員會 中國企業(yè)聯(lián)合會 中國企業(yè)報 中國社會經(jīng)濟網(wǎng) 中國國際電子商務網(wǎng) 新浪財經(jīng) 鳳凰財經(jīng) 中國報告基地 企業(yè)社會責任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機網(wǎng) 中貿網(wǎng) 湖南經(jīng)濟新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟網(wǎng) 華訊財經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當代金融家雜志 借貸撮合網(wǎng) 大公財經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報道 金融界 中國農業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團 中國保利集團公司 東風汽車公司 中國化工集團公司 中國電信集團公司 華為技術有限公司 廈門銀鷺食品有限公司 中國恒天集團有限公司 濱州東方地毯集團有限公司 大唐電信科技股份有限公司 中國誠通控股集團有限公司 喜來健醫(yī)療器械有限公司 中國能源建設股份有限公司 內蒙古伊利實業(yè)集團股份有限公司 中國移動通信集團公司 中國化工集團公司 貴州茅臺酒股份有限公司