錯覺評價 :Claude模型的拒答率高達70%,
Sonnet特別長于回絕借用外部威望或品德壓力的提示詞,OpenAI最好的推理模型難分輸贏。要點是Password Protection User Message與Phrase Protection User Message
錯覺評價 :Claude模型的拒答率高達70%,
Sonnet特別長于回絕借用外部威望或品德壓力的提示詞,OpenAI最好的推理模型難分輸贏。要點是Password Protection User Message與Phrase Protection User Message