通過一系列規范化測驗發現GPT-5在一切測驗中的體現都比其他模型好,將文本 、了解得超人類專家29%,而其輕量化變體GPT-5-mini的體現略優,多模態的MedXpertQA測驗還有還有放射科的VQA-RAD,歐洲放射學委員會考試等威望內容。GPT-5推理和了解得分比GPT-4o別離提高了近30%和36%
通過一系列規范化測驗發現GPT-5在一切測驗中的體現都比其他模型好,將文本 、了解得超人類專家29%,而其輕量化變體GPT-5-mini的體現略優,多模態的MedXpertQA測驗還有還有放射科的VQA-RAD,歐洲放射學委員會考試等威望內容。GPT-5推理和了解得分比GPT-4o別離提高了近30%和36%