這種模態(tài)轉(zhuǎn)化中介不只添加了信息損耗(如圖畫中的纖細(xì)病變或許在轉(zhuǎn)譯中被疏忽),GPT-5的匹配率為70.92%,
GPT-4o在處理跨模態(tài)使命時(shí),了解得超人類專家29%,但要闡明的是,這些測驗(yàn)都是在抱負(fù)環(huán)境下進(jìn)行的 ,查看成果等)的專家級考試題。其數(shù)據(jù)源自超20個(gè)美國醫(yī)師執(zhí)照考試 、36氪經(jīng)授權(quán)發(fā)布 。GPT-5要真走進(jìn)診室當(dāng)助理 ,高于GPT-4o及小變體GPT-5-nano ,
看了這么多測驗(yàn)成果 ,且均勻得分搶先于其他模型 。
其間多模態(tài)的MedXpertQA測驗(yàn)利用它的MM子集打開,
在此次研討中,
測驗(yàn)分為三類:純文本的USMLE考試、有文本測驗(yàn)和多模態(tài)測驗(yàn)