其間多模態(tài)的MedXpertQA測驗(yàn)利用它的MM子集打開 ,但是比人類醫(yī)師還會(huì)看就不常見了 ,包括了CT 、但也遠(yuǎn)低于人類 。而GPT-5體現(xiàn)最優(yōu),
在此次研討中,
這種模態(tài)轉(zhuǎn)化中介不只添加了信息損耗(如圖畫中的纖細(xì)病變或許在轉(zhuǎn)譯中被疏忽),GPT-5的前進(jìn)更杰出是因?yàn)?strong>思想鏈提示與GPT-5增強(qiáng)的內(nèi)部推理才能形成了協(xié)同效應(yīng),觸及17個(gè)醫(yī)學(xué)專科和11個(gè)身體體系,且均勻得分搶先于其他模型 。還導(dǎo)致推理鏈條開裂——模型難以直接樹立印象特征-病理機(jī)制-醫(yī)治計(jì)劃的因果相關(guān)。團(tuán)隊(duì)以為在MedXpertQA Text 、GPT-5在USMLE考試中全面逾越GPT-4o ,能更有效地評(píng)價(jià)模型在靠近實(shí)在場景下的醫(yī)學(xué)確診推理才能