重磅清单当前AI领域尚未攻克的29个难题及进展评估(附百篇文献)

更新时间:2023-07-03 12:28:00 阅读: 评论:0

重磅清单当前AI领域尚未攻克的29个难题及进展评估(附百篇
⽂献)
引⾔
本⽂列出了⼈⼯智能中的开放性问题,根据⼈⼯智能路线图研究所重点关注的“ 开放性研究问题 ”主题,简要介绍该领域的最⼤挑战和现有技术⽔平。(译者注:⼈⼯智能路线图研究所是⼀个旨在研究和⽐较由⼈⼯智能领域⼯作者提出的各种⼈⼯智能路线图的新机构。)
这些挑战可分为:⼈⼯智能完备(AI-complete)问题,封闭域问题,以及常识推理、学习和感觉运动能⼒的基本问题。(译者注:对于计算机来说最困难的问题,被⾮正式地称为“⼈⼯智能完备”(AI-complete)的,以此说明解决了这些计算性问题就相当于解决了⼈⼯智能的核⼼问题——让计算机和⼈类或者强⼈⼯智能⼀样聪明。)
可以预见的是,作为第⼀次对⼈⼯智能开放性问题的调研,下⾯的清单难免有疏漏之处。欢迎读者提供反馈。
来源,⽅法和相关⼯作
本⽂罗列的⼈⼯智能问题来源于以下领域的⽂献:
●机器学习
●机器感知和机器⼈
●开源⼈⼯智能问题
带班
●⼈⼯智能系统的评估
●测试⼈类⽔准的⼈⼯智能的实现
●基准和竞赛
筛选本⽂研究问题的三个标准如下:
1. 必须与强⼈⼯智能的实现⾼度相关
怀孕能剪头发吗
2. 问题有封闭的范围,不接受开放式扩展
3. 可被测试
这些问题所在的范围不同但常有交集。其中⼀些问题可以被完全包含在其他问题中。第⼆个标准(封
闭范围)排除了⼀些有趣的问题,⽐如学习⼈类的所有职业;⼏个这种类型的问题将列在主要问题之后。为了确保问题具有可测试性,每个问题之后都附有⽰例测试。
下⾯列出的⼏个⽹站提供了⼀些具有挑战性的⼈⼯智能问题:
⼈⼯智能的挑战
本⽂剩下的部分将按下⾯的顺序列出⼈⼯智能领域的⼀些挑战:
1. ⼈⼯智能完备问题
2. 闭域问题
3. 共同推理
4. 学习
5. 感觉运动问题
⼈⼯智能完备问题
⼈⼯智能完备问题包含了所有或绝⼤多数符合⼈类智⼒⽔平的强⼈⼯智能问题。这个类别中的⼀些问题如下所列:
1. 开放领域对话(Open-domain dialog)
2. ⽂本理解
3. 机器翻译
4. ⼈类智⼒和能⼒测试
个人网站设计
5. 核⼼解析(Winograd构架)
6. 复合词理解
(1)开放领域对话
开放领域对话是指与⼈进⾏事先未知话题的讨论。这⾥的挑战包括语⾔理解、对话语法和探索世界。任务的版本包括⼝头和书⾯对话,并可扩展⾄多模式交互(例如姿势输⼊和多媒体输出)。可能成功的标准包含有⽤性以及执⾏对话贴近⼈类对话的能⼒(“ 图灵测试 ”)。(译者注:图灵测试是图灵于
鹌鹑好养吗
1950年提出的⼀个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与⼈等价或⽆法区分的智能。)
测试
对话系统通常由⼈⼯进⾏评估。此过程已实现的事件包括:
1. Loebner奖(译者注:纽约的慈善家Hugh Loebner组织了⾸次正式的图灵测试。从1991年起,每年举⾏⼀次这样的竞赛,其中机器反应与⼈类反应最难区别的计算机将获得100000美元的奖⾦和⼀块⾦牌。)
(2)⽂本理解
重阳节吃啥⽂本理解是⼀个尚待解决的问题。尽管问题解答领域已取得了显著的进展,但当需要使⽤超越⽂本的常识或世界知识去理解时,现有的⼈⼯智能⽂本理解系统就会⾯临问题。
测试
2.    Brachman(2006)提出了阅读教科书和解决教科书练习的问题。
(3)机器翻译
机器翻译是⼈⼯智能完备的,因为它包括那些有关认知世界的问题(例如下⾯将讨论的核⼼解析问题)。
测试
虽然翻译质量可以使⽤平⾏的语料库进⾏⾃动评估,但最终仍需要⼈⼯来判定测试的结果。例如当代美国英语语料库(Davies,2008)包含了来⾃不同类型的⽂本样本。翻译质量可以使⽤以下样本进⾏评估:
1.    报纸⽂本
2.    ⼩说
3.    ⼝语翻译
(4)智能测试
测试
Coreference resolution
The overlapping problems of coreference resolution, pronoun disambiguation, and Winograd schemas require picking out the referents of pronouns or noun phras.
Tests
1.    Davis (2011) lists 144 Winograd schemas.
2.    Commonn Reasoning (2016b) lists pronoun disambiguation problems: 62 sample problems and 60 problems ud in the first Winograd Schema Challenge, held at IJCAI-16.
(5)核⼼解析
核⼼解析、代词消歧和Winograd构架的重叠问题需要⼈⼯智能系统能指出代词或名词短语所指代的内容。
测试
Tests
1.    “The meaning of noun phras” at (Commonn Reasoning, 2015)
(6)复合词理解
多种语⾔存在具有特定含义的复合词,⽽我们也擅于猜测新出现的复合词的意思。⽐如我们知道⽔鸟是⼀种⽣活在⽔⾯附近的鸟类,⽽不是由⽔构成的。
测试
电脑设置屏保密码
闭域问题
闭域问题是将重要的智⼒因素结合起来、并通过将⾃⼰限制在⼀个特定的知识领域来降低难度的问题。游戏玩家代理是其中的⼀个例⼦。⼈⼯智能代理已经在围棋和最近的扑克上实现了超越⼈类的表现。尚待解决的问题有:
1. 从描述中学习玩棋盘、卡⽚和砖⽡游戏
2. 根据描述⽣成程序
3. 源代码理解
(7)从描述中学习玩棋盘、卡⽚和砖⽡游戏
与专业游戏玩家不同,⼈⼯智能系统需要从对规则的描述中学习新游戏,并且不能依赖于针对特定游戏预先设计的算法。
测试
2.    更具挑战性的是从⾃然语⾔描述中学习游戏; 这样的卡⽚和⽡⽚游戏的描述可从许多⽹站获得。
(8)根据描述⽣成程序
⽤编程语⾔来⽣成程序,例如C语⾔显然是实际应⽤中的⼀个兴趣点。
测试
(9)理解源代码
测试
国际模糊C代码竞赛(OCCC,2016)发布了“难以理解”的代码。源代码理解可被认为是⼀种由⼈⼯评判的提⾼代码可读性的能⼒。
常识推理可以说是通⽤⼈⼯智能的核⼼要素。该领域主要问题如下:
1.因果推断
2.反事实推断
3.直觉物理
4.直觉⼼理学
(10)因果推断
因果推断需要识别并应⽤原因-结果之间的联系。
测试
1.“证据的可信度”(可查看Commonn Reasoning, 2015)
2.“狼和兔⼦”(可查看Commonn Reasoning, 2015)
(11)反事实推断
反事实推断被⽤以回答假设问题。它使⽤因果推断和系统中的其他模拟及推理能⼒,来考虑事实与现
实相反的情境。(译者注:反事实推断的例⼦:⼩明有⾼⾎压,现在想要知道⼀种降压药对降⾎压有没有因果效应。如果⼩明吃了药,那么此时,事实是⼩明吃了药,结果是⼩明吃了药之后⾎压有没有下降。反事实就是,⼩明没有吃药,因为不是事实所以我们⽆法观察到没有吃药对⼩明有什么影响。⽆法观察到反事实时的结果也被称为因果推断关键问题(fundamental problem of causal inference)。)
测试
1.“残酷且不寻常的耶鲁射击问题” (可查看Commonn Reasoning, 2015)
(12)直觉物理
对物质世界的基本理解,包括物体存继性和预测可能轨迹的能⼒,能帮助智能体更快的学习并做出预测。
测试
1.“物理推断”(可查看Commonn Reasoning, 2015)
2.“把⼿问题”(可查看Commonn Reasoning, 2015)
(13)直觉⼼理学
直觉⼼理学,亦称⼼灵理论,能够让智能体理解⽬标和信念,并且从其他智能体的⾏为中做出推断。
测试
1.“朴素⼼理学”(可查看Commonn Reasoning, 2015)
学习
除了在机器学习领域巨⼤的发展,很多和学习相关的重要问题依然尚未解决。它们包括:
1.渐进学习
2.⽆监督学习
3.强泛化
4.从少数样本中类别学习
5.学会学习
7.不遗忘学习
8.转移学习
9.知道何时你不知道
10.经由⾏动学习
(14)渐进学习
·  成分学习
搜狗怎么打繁体字
·  学会学习
· 学习并不忘记
· 转移学习
测试
应⽤于家⽤机器⼈学习家务和翻屋保养的⼀个可能测试,包括取得⼯作所需的⼯具和材料。该测试通
过两个准则来评价智能体:持续的⾏动,其中智能体需要⾃主运⾏,寿命之内不再重新编程;改善能⼒,其中智能体必须在其演化不同的时间点展⽰出在之前所不具有的能⼒。
(15)⽆监督学习
测试
除了在视觉领域可能的测试,语⾳识别也为⽆监督学习提供了⼀展拳脚的机会。虽然现在最先进的语⾳识别器基本都是依靠对⼤语⾳资料库的监督学习,⽆监督学习需要在没有监督的情况下,探索⾳素,单词分割,和词汇汇编。该⽅向限于少量词汇下的识别进来已有所进展,见如下论⽂(Riccardi and Hakkani-Tur, 2003, Park and Glass, 2008, Kamper et al., 2016)。
(16)强泛化
⼈类可以在看似不同却有着内在相似性的情形下转移知识和技能,在调整到⼀个新环境时保留技能的核⼼部分,该能⼒被如下论⽂(Tarlow, 2016; Gaunt et al., 2016)称作强泛化。如果我们学习怎么打扫房间,我们就知道怎么打扫其他⼤部分房间。
测试
1.⼀个通⽤集成机器⼈能够学会⽤⼀种材料构建⼀个玩具城堡(⽐如⽤乐⾼玩具),然后测试能不能也⽤其他材料(⽐如沙⼦,⽯头,⽊棍)建筑城堡。
2.家务机器⼈在⼀个环境中进⾏打扫和烹饪训练,并在⾼度陌⽣的环境下测试。
(17)从少数样本中进⾏类别学习
测试
(18)学会学习
学会学习,亦称元学习是技能的习得,并趋于促进未来的学习。具体考虑的情形是⼀个更⼀般更缓慢的学习过程产⽣了⼀个快速的更专门的学习过程。例如,⽣物进化产⽣了像⼈类这样⾼效的学习者。
测试
学习玩雅达利电⼦游戏是进来取得⾮常可观的成功的领域,包括了转移学习(见论⽂Parisotto et al., 2016)。然⽽,不存在任何系统能够在学习玩电⼦游戏中像⼈类⼀样经过⼀段时间的操作便可获取新游戏的玩法(见论⽂Lake et al., 2016)。
(19)组成学习
组成学习(见论⽂de Freitas, 2016; Lake et al., 2016)是⼀种能够重新结合原始表达来加快新知识获取的能⼒。它和获悉如何学习紧密相关。郭姓起名
测试

本文发布于:2023-07-03 12:28:00,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1065957.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:问题   学习   智能   领域   理解   测试   游戏
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图