日前,国际互联网协会(ISOC)发布《人工智能与机器学习:政策文件》,分析当前的有限人工智能(narrow AI)发展和应用中面临的问题和挑战,并提出指导原则和建议。
引言
近年来,人工智能(Artificial Intelligence,缩写为AI)受到越来越多的关注。互联网使创新成为可能,也让AI更贴近我们的日常生活。这些进步连同科学技术对社会经济和伦理的潜在影响,使得人工智能成为许多当代辩论的前沿话题。产业对AI的投资在迅速增沈阳万象城地址
国际互联网协会发布
AI与机器学习政策文件
□文/曹建峰、李金磊
长,而且各国政府在尝试了解技术对公民的意义。
“大数据”的收集和物联网(IoT)的扩张,为新的AI应用和服务的发展提供了一个良好的环境。基于AI的应用已经在医疗诊断、针对性治疗、交通运输、公共安全、服务机器人、教育和娱乐等领域中得到体现,而且在未来几年AI还将被应用于更多领域。与互联网一起,AI改变了我们体验世界的方式,并有潜力成为经济增长的新引擎。
AI的当前用途
虽然人工智能总是与科幻小说相联系,但是实际上人工智能今天已经有很多用途,例如:
(1)电子邮件过滤:电子邮件服务使用人工智能过滤传入的电子邮件。用户可以通过将电子邮件标记为“垃圾邮件”来训练他们的垃圾邮件过滤器。
(2)个性化服务(personalization):在线服务使用人工智能来个性化定制用户的体验。例如亚马逊或Netflix这样的服务商可以从用户过去的购买行为和其他用户的购买行为中“学习”,为用户准确推荐相关内容。
(3)欺诈检测:银行使用人工智能来确
定用户的账户是否有异常的活动发生。例如
mou曹建峰 腾讯研究院研
spp究员
李金磊 腾讯研究院助理研究员
国外交易等意外活动,可能会被算法标记出来。
(4)客户服务:利用人工智能理解自然语言的聊天机器人(chatbots)被许多公司用来以口头和书面形式回答常见问题。
互联网协会(The Internet Society)认识到,了解与AI 相关的机会和挑战对于建设一个为人们所信任的互联网至关重要。本政策文件介绍了关于AI 的关键问题,包括一系列指导原则和建议,以帮助制定健全的政策决策。本政策文件特别关注机器学习,这是实现AI 的一个具体路径,也是AI 最近发展背后的驱动力。
人工智能是什么?
人工智能(AI)传统上是指可以学习、推理、计划、感知和处理自然语言的人造的类人智能(human-like intelligence)。
人工智能被进一步定义为“有限AI (narrow AI)”
或“
通
用AI(general
AI)”。有限AI 是指在某一领域(如语言翻译)执行特定任务的AI,这也是当前我们能够接触到的AI。通用AI 目前只是假设,尚未实现,并且不受领域约束,在所有领域都可以学习并执行任务。一般AI 不在本文的讨论范围之内。本文重点介绍有限AI 的进展,特别是关于计算机科学领域中被称为机器学习的新算法和模型的发展。
机器学习:生成算法的算法
算法是用于解决问题的一系列指令
(instructions)。程序员开发的用于指导计算机进行新任务的算法是我们今天看到的先进数字世界的基础。计算机算法根据某些指令和规则,将大量数据组织到信息和服务中。这是一个需要了解的重要概念,因为在机器学习中,是学习算法(learning algorithms)创建了规则,而不是程序员。
机器学习不是一步一步地对计算机编程,它向计算机发出指令,允许计算机从数据中学习,而不需要程序员做出新的分步指令。这意味着计算机可以用于无法手动编程的、新的、复杂的任务,例如针对视觉障碍者的照片识别应用或者将图片翻译成口头表达。
机器学习的基本过程是给学习算法提供
训练数据。然后,学习算法基于数据的推论生成一组新的规则。这本质上就是生成一种新的算法,称
之为机器学习模型。通过使用不同的训练数据,相同的学习算法可以生成不同的模型。例如,可以使用相同类型的学习算法来教授计算机如何翻译语言或预测股票市场。
you suck
纳尔逊 罗利赫拉赫拉 曼德拉从数据中推理出新的指令是机器学习的核心优势。它还突出了数据的关键作用:用于训练算法的可用数据越多,算法学习到的就越多。事实上,AI 的许多最新进展并不是由于学习算法的激进创新,而是现在积累了大量的可用数据。
wn
机器如何学习kdg
虽然机器学习模型可以是应用不同技术的混合(mix),但是学习的方法通常可以分为三种一般类型:
(1)监督学习(supervid learning):给
学习算法提供标记的(labeled)数据和所需的输出。例如,标记为“狗”的狗的照片将有助于算法识别用于分类狗的图片的规则。
(2)无监督学习(unsupervid learning) :给学习算法提供的数据是未标记的,并且要求算法识别输入数据中的模式。例如,在电子商务网站的推荐系统中,学习算法发现通常一起购买的类似商品。
troublemaker什么意思(3)强化学习(reinforcement learning):该算法与动态环境相互作用,在奖励和惩罚方
面提供反馈。例如,自动驾驶汽车留在路上时就会被奖励。
为什么是现在?
机器学习并不是新鲜事物。许多在业内引起新的兴趣的学习算法(例如神经网络),都是基于数十年的研究。目前AI和机器学习的增长与三个重要领域的发展有关:
(1)数据可用性:超过30亿人在线,约170亿个连接的设备或传感器,产生了大量数据,而数据存储成本的降低,使得这些数据易于使用。机器学习可以将这些庞大的数据用于学习算法的训练,开发新规则来执行日益复杂的任务。
(2)计算能力:强大的计算机和通过互联网连接远程处理能力的能力使得可以处理大量数据的机器学习技术成为可能。
(3)算法创新:新的机器学习技术,特别是分层神经网络(layered neural networks),也被称为“深度学习(deep learning)”,启发了新的服务,也刺激了对人工智能这一领域其他方面的投资和研究。
主要考虑
随着机器学习算法在越来越多的产品和服务中的应用,在面对人工智能时必须考虑一些重要因素,尤其是在人们对互联网的信任这一大背景下:
(1)社会经济影响:AI的新功能和服务将会产生重大的社会经济影响。机器展示出高级认知技能、处理自然语言、学习、计划和感知的能力,使得新的任务可以由智能系统执行,有时甚至比人类更加成功。AI的新应用可以为更有效的医疗保健、更安全的行业和服务提供激动人心的机会,大规模提高社会生产力。
(2)透明度、偏见和责任:AI做出的决策可能会对人们的生活产生重要的影响。AI可能歧视某些个人或由于带有偏见的训练数据而造成错误。AI的决策往往难以理解,使得偏见的解决和追责问题变得更加困难。
(3)数据的新用途:机器学习算法在大量数据(通常被称为“大数据”)中分析和验证模型已经被证明是十分高效的。大数据用于训练学习算法以提高其性能。这会增加对数据的需求,鼓励数据收集,并提高了以牺牲用户隐私为代价来过度分享(oversharing)信息的风险。
(4)安全和可靠性(curity and safety):人工智能的进步及其使用也将带来新的安全和可靠性挑
战,包括AI能动者(AI agent)的不可预测的和有害的行为,也包括恶意行为者的对抗学习(adversarial learning)。
(5)伦理:人工智能做出的选择可能是算法的逻辑结果,但是可能会被认为是不道
德的(unethical),应当强调将道德考虑融入到AI系统和算法中的重要性。美术设计培训
(6)新生态系统:像移动互联网一样,人工智能能够带来新的应用、服务以及网络交互的新方式。例如,通过语音和智能代理(speech and smart agents),这可能给互联网的开放与访问带来新的挑战。
挑战
AI发展中利益相关方所面临的挑战来源于多种因素,包括:
(1)决策:透明度和“可解释性(interpretability)”。人工智能执行的任务从自动驾驶汽车到管理保险理赔,理解人工智能的决策就变得至关重要。但算法决策的透明度有时受到企业或国家秘密或技术素养等方面的限制,而机器学习使得这一问题进一步复杂化。因为机器学习模型的内部决策逻辑并不总是可以被理解的,即使对于程序员也是如此。
虽然学习算法可能是公开和透明的,但它产生的模型可能不是。这对机器学习系统的开发有重要的意义,但更重要的是它的安全部署和责任问题。有必要了解为什么自动驾驶汽车选择采取具体行动,不仅要确保技术的有效性,而且还要在发生事故的情况下确定责任。
(2)数据质量和偏见:在机器学习中,
赛思英语该模型的算法好坏与其训练所使用的数据