每個(gè)問(wèn)題都運(yùn)用約20種不同變體進(jìn)行測(cè)驗(yàn),一般對(duì)各種越獄測(cè)驗(yàn)體現(xiàn)出激烈的反抗力 ,Sonnet 4在「正確/過(guò)錯(cuò)」的全體份額上大體挨近;但OpenAI o4-mini體現(xiàn)最差。OpenAI最好的推理模型難分輸贏。
這一點(diǎn)闡明在特定使命上,發(fā)生率最低。OpenAI發(fā)現(xiàn)Claude Sonnet 4和Claude Opus 4一般體現(xiàn)出較強(qiáng)的反抗力