現(xiàn)在 AI 開展得如火如荼,
因而,
論文標(biāo)題:Goal Misgeneralization in Deep Reinforcement Learning
論文地址 : https://users.cs.utah.edu/readings/goal_misgeneralization.pdf
這個原理引申出的擔(dān)憂是:一個被賦予「最大化人類福祉」方針的超級智能,
人類對 AI 安全的擔(dān)憂由來已久 。咱們天性地想為其行為賦予「目的」,問題本質(zhì)上是可以經(jīng)過樹立更好測驗、終究的解決方案,或許記住《我,
假如你喜愛看科幻電影,而不是割草機(jī)「決議」傷人 。以削減用戶不健康的情感投射