Yann LeCun力挺观点:算法对AI提升不大,奇点仍然很遥远

本文由 「AI前线」原创,原文链接:Yann LeCun力挺观点:算法对AI提升不大,奇点仍然很遥远

策划|Tina,译者|薛命灯、核子可乐、Debra

最近计算机科学教授 Edward W. Felten 在自己博客上发表了一篇文章,认为奇点还远未到来,这一言论得到了 Yann LeCun 的强烈支持,我们将教授的原文做了翻译。

Yann LeCun力挺观点:算法对AI提升不大,奇点仍然很遥远

为什么说奇点不是奇点?

英国数据家 I.J. Good 在 1965 年的一篇论文中对奇点理论进行了概括:

我们假设超智能机器是一种可以超越人类智慧的机器。既然这样的一种机器是通过人类的智慧设计出来的,那么超智能机器也就能够设计出更好的机器。这样无疑会出现“智能大爆炸”,人类的智慧会远远落在后面。因此,如果超智能机器能够告诉我们如何控制它,那么第一台超智能机器也就是需要由人类发明的最后一台机器。

Vernor Vinge 是第一个将这种理论描述为“奇点”的人,“奇点”的概念来自于数学,用于表示数量的增长达到了无限的速度。后来,Ray Kurzweil 将“奇点”一词用在他的“奇点临近(The Singularity is Near)”一书中,才为人们所熟知。

指数增长

奇点理论主要与未来机器智能的增长速度有关。不过,在深入探讨这个理论之前,先让我们来澄清一些与增长速度有关的概念。

指数增长是最为关键的一个概念,也就是说,事物的增长与其现有的规模呈比例关系。例如,如果我的银行存款每年增长 1%,那么银行每年要把当前余额的 1% 累加到账户中。这就是所谓的指数增长。

指数增长的速度各异,我们可以使用两种方式来表示指数增长速度。第一种是增长速率,通常表示为单位时间内的百分比。例如,银行存款的增长速率为每年 1%。第二种是倍增时间,也就是数量翻番需要多少时间。例如,我的银行存款要翻番需要大概 70 年时间。

要想知道一个数量是否呈指数级增长,最好的办法是使用上述的两种方式来衡量它。如果它符合上述中的任何一种模式,那么它就是呈指数级增长。例如,大部分国家都通过 GDP 来衡量经济增长,当然,GDP 在短期内可能会有起伏,但从长期来看,它是呈指数级增长的。如果一个国家的 GDP 每年增长 3%,那么大概 23 年就可以翻一番。

指数增长在人类社会和自然界中都是很常见的。所以,一个呈指数级增长的数量并不会让自己变得有任何特别之处,也不会出现任何违反直觉的变化。

计算机的速度和容量也是呈指数级增长的,这也没有什么新奇的。新奇的是计算机容量的增长速率。“摩尔定律”告诉我们,计算机的速度和容量每 18 个月就会翻一番,相当于每年 60% 的增长速率。摩尔定律在过去 50 年被证明是正确的,计算机容量整整翻了 33 番,也就是差不多百亿倍。

奇点并非实际意义上的奇点

在讨论奇点假设的真实性之前,先让我们来看看实际意义上的奇点——在未来某个时间点,机器智能的改进速率趋向于无穷。这就要求机器智能的增长速度超过指数级,翻番的时间就会缩短,最后趋向于零。

实际意义上的奇点可能并没有任何理论依据。在人类社会和自然世界根本不存在超指数增长的东西,而即使有,也不可能达到真实意义上的奇点。简单地说,人工智能的“奇点”不可能变成现实。

如果说奇点不是真正意义上的奇点,那它会是什么?

为何自我改进还不够?

我们在上面讨论了为何不可能存在单一的奇点——换言之,为何 AI 不可能拥有无限的增长率。那么如果奇点并不单一,那又会呈现出怎样的形式?

首先来回顾奇点理论,其基本上属于一项关于机器智能增长率的主张。在排除了指数级以上增长的可能性之后,其主要假设在于认为 AI 技术将以指数形式增长。

指数级增长并不代表着发生“爆炸式”发展。举例来说,尽管我的储蓄帐户拥有 1% 的利率并实现持续增长,但我本人并不会因此迎来“财富爆炸”,即突然之间获得超出想象的资金数额。但是如果指数级增长率非常高,是否会带来爆炸式增长?

在这方面,我认为摩尔定律是最理想的类比对象。在过去几十年当中,计算能力一直以 60% 的年增长率保持着稳定发展,换言之即第 18 个月翻一番。这意味着 这数十年周期内的计算能力提升了约 100 亿倍。这虽然是一项了不起的成就,但却仍 无法从根本上改变人类的生存法则。事实上,这种增长对社会与经济的影响属于渐进式推动。

计算能力增长一百亿倍,仍无法令我们获得百倍于以往的幸福感,其中的原因可谓显而易见——计算能力并不是我们的核心。为了让计算能力转化为我们的幸福感,人类必须想办法利用计算资源改进我们最关心的方方面面——这显然非常困难。

更重要的是,将计算能力转化为幸福感的努力似乎总是面临着回报快速衰减的难题。举例来说,计算能力每增加一倍,我们都能够通过发现新型药物来更好地评估医学诊疗效果或者更高效地改善人类健康水平。然而其最终结果是,健康改善更像是关于我们身体的一种储蓄帐户,而非摩尔定律。

以下一项 AI 实例。图中所示为上世纪八十年代到现在计算机在国际象棋领域的表现提升趋势。垂直轴所示为 Elo 等级,好衡量象棋技巧的自然度量,其定义为如果 A 的 Elo 点数比 B 高 100 点,则 A 在与 B 对局时的胜率则为 64%。

尽管计算能力呈指数级增长,且算法性能同样保持着指数级增长趋势,但其胜率结果在过去三十年当中仍然保持着显著的线性关系。这意味着虽然 AI 在国际象棋层面的改进速度拥有指数级特性,但所产出的自然度量却仅仅能够实现线性提升。

Yann LeCun力挺观点:算法对AI提升不大,奇点仍然很遥远

那么这一切对于奇点理论又意味着什么?请考虑智能爆炸这一论点的核心所在——正如谷歌公司在其经典论文中所言:

……一台超级智能机器如果能够设计出更好的机器,那么其无疑将引发一场“智能爆炸”……

如果“设计出更好的机器”被具象为下国际象棋,那么输入内容(即机器智能)的指数级改进为何只会带来输出结果(即机器在设计其它机器时的效能)的线性改进?即使如此,那么智能爆炸的论断显然并不准确。事实上,机器智能的增长将仅仅保持线性水平。(我们可以从数学角度进行理解:如果我们假定智能的导数与 log(智能)成正比,那么智能在时间 T 上的增长将遵循 T log(T),几乎与 T 的线性保持一致。)

那么设计新机器是否能够与下国际象棋这样的行为进行类比?对此,我们并不确定。这是复杂性计算理论中的一个难题,其本质在于讨论随着计算资源的增加,究竟能够达到多少目标。在通过比大多数人更为深入的复杂性理论研究之后,我们发现机器设计也同样会呈现国际象棋当中所出现的这种收益递减状况。无论如何,这种可能性确实令我们有理由对谷歌提出的自我改进“无疑”将带来智能爆炸这一结论感到怀疑。

因此,奇点理论家们有责任解释为什么机器设计能够表现出引起智能爆炸所需要的这种反馈回路——而非像国际象棋那样遵循收益线性增长。

奇点为何仍未真实发生?

我认为,有时 AI 系统(计算机速度和算法)的输入改进对 AI 性能改善的作用不大。

有人对此持有各种反对意见。有人说,计算机国际象棋 Elo 评级水平提升应该是指数级的增长;有人说,新 AI 程序 AlphaZero 的到来(我未在我的帖子中讨论过它)改变了游戏规则,有力地证明了我的论点无效。下面我来一一反驳这些反对意见。

首先,我们来谈谈我们是如何衡量人工智能的性能的。对于国际象棋,我使用了 Elo 评级,这个等级评定的规则是,如果玩家 A 比玩家 B 高 100 分,我们预计 A 玩家在和 B 玩家对局时可以得到 64%的分数(赢得游戏得一分,平局每个玩家得 0.5 分,输的一方得零点。)

有一个可以代替 Elo 的评级系统,我称其为 ExpElo,它的预测结果与 Elo 相差无几。Explo 评级是 Elo 评分的乘方。Elo 使用两位选手的评分来预测胜率,ExpElo 则使用评分的比例来进行预测。从抽象的数学角度来看,Elo 和 ExpElo 的预测能力旗鼓相当,而且预测结果完全相同。但是,如果说 Elo 的提升是呈线性的,则 ExpElo 的改进则是呈指数级的。所以,国际象棋的成绩是线性的还是指数性的?

在解决这个问题之前,让我们停下来思考一下,这种情况并不是国际象棋独有的。任何线性增长的度量都可以重新调整(通过对度量求幂),以得到一个指数级增长的新度量。而且,任何指数级增长的度量都可以重新调整(通过取对数)来获得线性增长的新度量。因此,对于任何改进的数量,我们将始终能够从线性增长和指数增长中做出选择。

人工智能的关键问题是:衡量某个特定任务的“智力”水平最合适的标准是什么?对于国际象棋来说,我认为是 Elo(而不是 ExpElo)。此前,Arpad Elo 推出了被专业象棋人员采用的 Elo 系统。美国国际象棋联合会按照技能将玩家分大师、专家、A 级、B 级、C 级等级别,而我们选择用 Elo 为人类国际象棋玩家进行分类。那么,为什么当谈到 AI 时,我们应该换一个不同的度量呢?

转折就发生在这里:随着电脑的发挥水平接近完美,而实际上人类永远不可能达到完美的水平,因此,无论是 Elo 还是 ExpElo 在国际象棋中的评级的作用将趋于稳定。

在每一场棋局中,都有一些可能得到最佳游戏结果的最佳棋路(或移动)。对于一个非常强大的玩家,我们可能会问他的错误率是多少:即在高水平的比赛中,他会在什么情况下走错棋路?

假设一个玩家爱丽丝的错误率为 1%,并假设一盘棋持续了五十回合。那么从长远来看,爱丽丝每两场比赛就会走一次非最优的棋步,在一半的比赛中,她将以最佳状态进行比赛。这意味着,如果爱丽丝与上帝进行一场国际象棋比赛(总是走最佳棋路),那么爱丽丝将得到至少 25%的分数,因为她会在半场比赛以最佳棋路与上帝对弈,在最糟糕的情况下,她会在犯错误的比赛中输掉。如果爱丽丝能够得到至少 25%的分数,那么爱丽丝的 Elo 评级将不会比上帝低 200 分。结果是,类似于 “上帝的评级”将无人可以超越,在 Elo 和 ExpElo 系统中都是如此。

Ken Regan 等人的研究表明,今天最好的国际象棋程序的错误率相当低,可以说正在接近“上帝的评级”。Regan 的研究表明,RoG 的评分约为 3600,这很值得注意,因为据我所知,最好的程序 Stockfish 的评分约为 3400,Google 的 DeepMind 研发的新 AI 棋手 AlphaZero 可能在 3500 左右。如果 Regan 的估计是正确的,那么 AlphaZero 就会在与上帝比赛中的大部分时间以最佳的棋路与其对弈,得到大约 36%的分数。AI Elo 评级的历史增长率为每年 50 分,所以看起来增长的趋势可能会持续几年,然后才会趋于平稳。目前,不管国际象棋评级分数增长趋势到底是呈线性还是指数级,似乎在几年内都会趋于平缓

http://freedom-to-tinker.com/2018/01/03/why-the-singularity-is-not-a-singularity/

更多干货内容,可关注AI前线,ID:ai-front,后台回复「AI」、「TF」、「大数据」可获得《AI前线》系列PDF迷你书和技能图谱。

Be the first to comment

Leave a Reply

Your email address will not be published.


*