數據集鏈接:https://www.kaggle.com/datasets/kaggle/chess-text-gameplay
國際象棋文本輸入基準測驗旨在評價和比較當今通用言語模型的戰略推理才干。
每一步棋,比方發現大言語模型特別喜愛西西里防護局勢。
除了Elo分數
數據集鏈接:https://www.kaggle.com/datasets/kaggle/chess-text-gameplay
國際象棋文本輸入基準測驗旨在評價和比較當今通用言語模型的戰略推理才干。
每一步棋,比方發現大言語模型特別喜愛西西里防護局勢。
除了Elo分數