對每條思路,
Cons@512和mean@512別離標明運用512條推理軌道進行的大都投票成果,
怎樣讓模型在考慮時更聰明 、
按分數做一次相信度過濾,可以挑選出相信度排序前η%途徑的最低門檻 ,
不靠譜就當場叫停,一切試驗均重復進行了64次。
DeepConf由Meta AI與加州大學圣地亞哥分校提出 ,再在線用s給并行思路「邊走邊查看」 。越深的綠色標明相信度越高。
問題難度經過已生成途徑之間的一致性程度來評價,
其間,
當模型在寫推理進程時,當即間斷生成 。
因而 ,它的定見重量更大;低相信度的途徑,簡略選錯答案。還需求使用相信度過濾,通常是不值得持續的推理。
在一切設置下均取得約10%的安穩準確率提高 。
赤色叉叉