Keras之父历时2年力作,64页论文探讨智能如何评估

来源:QQ快报
责任编辑:鲁晓倩
字体:

新智元报道

来源:Twitter、arXiv

编辑:肖琴

【新智元导读】谷歌AI研究员、Keras之父Fran?ois Chollet历时2年的力作近日发布,在长达64页的论文中,他深入分析、阐述“智能的定义和测量”,引起AI研究社区大量关注。你赞同Chollet的观点吗?来新智元 AI 朋友圈和AI大咖们一起讨论吧。

谷歌AI研究员、Keras之父Fran?ois Chollet近日发表一篇长达64页的论文,深入分析、阐述“智能的定义和测量”,引起AI研究社区大量关注。

与此同时,Chollet还发布了一个新的AI评价数据集“抽象推理语料库”(Abstraction and Reasoning Corpus),简称ARC。Chollet表示,在过去的2年里,他一直断断续续地在做这件事。

在新智元小程序获取论文:

论文的主要内容包括:

1) 回顾历史,我们如何定义和评估AI

2) 对“智能”(Intelligence)的新的正式定义,以及对“通用AI的基准”(general AI benchmark)应该是什么样子的具体指导原则

3) 介绍ARC的目标及其背后的逻辑。

Chollet说,这个定义是他试图将过去10年来的思考和讨论(演讲、Twitter、对话等等)正式转化为一些有用、可行的东西的尝试。ARC这个新的AI评价数据集引导他朝着非常有趣的研究方向发展,因此也希望读者发现它有用。

Chollet强调,论文中提供的定义并不是“唯一正确的”定义。那不是重点。因为智能是复杂的,在不同的背景中可能意味着不同的东西。“智能”或“人工智能”的多种定义都可能是有效的。

Chollet最近还在一个算法上取得了很好的进展,这个算法至少能够解决部分ARC,基于一个他研究了很长时间的认知理论(autonomous abstraction)。Chollet表示将尽快分享这些想法和代码。

这个理论自2009年以来一直在酝酿之中。它借鉴了ONEIROS项目(开放终端神经电子智能机器人操作系统)的重要元素,这是Chollet从2009年到2012年(在2014年短暂地再次参与)一直在开发的一个通用AI架构,但后来大部分都被放弃了。

ONEIROS是从一个经典的RL思想开始的,集中于1)学习时空特征的模块化层次“maps”(使用PMI矩阵分解而不是梯度下降),2)通过注意力机制的形式进行上下文切换,以及3)内在动机(好奇心)

其基本想法是“认知是一种感知运动信息空间的动态的、层次-模块化的地图”。因此,Chollet还把它称为map theory”

Chollet认为ONEIROS做了很多正确的事情(特别是考虑到当时的情况——主要是在2010年设计,并在2012年尝试对其进行简化),但最终它没有触及最重要的一点:抽象的本质

这就是“The Measure of Intelligence”这项工作正在做的,ARC正是触及了“抽象的本质”。

有意思的是,“Keras”这个名字来自ONEIROS:

“Chollet 创建了 Keras 作为开放式神经电子智能机器人操作系统 (ONEIROS) 机器人研究项目的神经网络的 API。ONEIROS 这一名称是对古希腊史诗《奥德赛》的致意,在这部史诗中,神话人物Oneiroi(Oneiros 的单数形式)为人类指明了两条进入梦境的路:一条路穿过宏伟的象牙之门进入噩梦,另一条路则穿过低矮的兽角之门,最终呈现一片神圣的景象。Keras 在希腊语中意为角,这个名称非常合适,因为 Keras API 旨在为与神经网络协同使用提供一条捷径。”

“The Measure of Intelligence”论文发表后,在Twitter、Reddit等社区得到很多关注,有人评价“有趣”、“必读的好文章”,也有人质疑这项研究是否必要。

论文内容结构

Google机器学习研究员Emil Wallner带来了不错的总结和解读,一起来看。

为了推进AGI,我们需要量化和评价其技能获取效率

Fran?ois Chollet的核心观点是:我们不能通过衡量其对特定技能的掌握程度来评价一个AI系统的适应性和灵活性

只要数据足够多,模型就能靠“记忆”实现决策。为了推进AGI,我们需要量化和评价其***技能获取效率***。

在20世纪70年代,许多人认为国际象棋反映了人类理性思维的全部范围。用计算机下棋就能达成认知理解的重大飞跃。但是,在IBM的DeepBlue之后,他们意识到计算机并没有更好地理解人类的思维。

IBM的DeepBlue并不“智能”,但我们认为掌握国际象棋的人是有智能的。这是因为我们将国际象棋与一种元技能(meta-skill)联系在一起,元技能是一种用于数学和推理等逻辑任务的能力。我们经常以类似的方式将AI系统拟人化:掌握任务= AGI。

同样,Chollet认为DeepMind的围棋AI AlphaZero既不灵活也不通用。他将其与使用局部敏感哈希函数的哈希表进行比较,通过无限的模拟,你可以用动作来映射棋盘的位置。

Chollet认为,当前的以任务为中心的智能观点是推进AGI的瓶颈所在。相反,我们应该采用Hernandez-Orallo的观点:

“人工智能是一门让机器完成它们从未见过、也没有事先准备好的任务的科学和工程技术。”

当人类接受不同的认知测试时,得到的结果是彼此相关的。这表明人类具有学习技能的基本元技能,即“g因子”(g-factor)。这些是Chollet认为评价AI需要衡量的能力,从Broad Generalization开始。

在II.2节, Chollet 正式阐述了他的中心思想:

“一个系统的智能是对其在一定任务范围内的技能获取效率的衡量,与先验、经验和泛化难度相关。”

下面是“技能获取效率”的概述。“Task”可以是国际象棋,“Situation”是一个棋盘位置,而“skill program”是一个固定的国际象棋引擎。可以将智能系统看作是不同任务的程序综合引擎。

Chollet使用算法信息论(Algorithmic Information Theory)来量化程序和交互:

“智能是学习者将自己的经验和先验知识转化为新技能的速度,这种新技能的价值在于不确定性和适应性。”

为了避免局部通用系统人为地“购买”特定任务的表现,Chollet将先验知识限制在发展科学理论中发现的“核心知识”:比如基础物理、算术、几何学和对意图的基本理解。

Chollet根据他概述的最佳实践ARC创建了一个数据集。该数据集模拟了IQ测试(流体智能)中的抽象和推理部分

下面是几个例子:

ARC数据集包含400个训练任务和600个评估任务。

主要特点:

评估集中只有新的任务

高度抽象

类似于人类智商测试

每个任务有3个演示

固定/有限的训练数据

一组明确的先验条件

https://github.com/fchollet/ARC

向@fchollet致敬,感谢他为AGI的发展提出了清晰可行的建议。这是一篇必读论文!

请注意:本文转载自QQ快报,并不代表本网赞同其观点,版权归原作者所有,本网不承担任何责任,特此声明。

声明:以上内容由用户提供,并不代表本网赞同其观点。如有任何不妥,请与不良与违法信息举报中心联系:513175919@qq.com

www.book1234.com true http://www.book1234.com/q/20191124/20191124A07FRL00.html report 14291
娱乐时尚
科技资讯
历史文化
真视界
旅游美食
精彩图文
我爱我车
母婴健康
关于本站 | 广告服务 | 手机版 | 商务合作 | 免责申明 | 招聘信息 | 联系我们
Copyright © 2004-2018 book1234.com All Rights Reserved. 布客网 版权所有
京ICP备10044368号-1 京公网安备11010802011102号