knowledge is power

更新时间:2022-12-27 05:23:02 阅读: 评论:0


2022年12月27日发(作者:2020语文答案)

KnowledgeisthepowerinAI--基于知识图谱的认知智能

KnowledgeisthepowerinAI--by图灵奖获得者,知识⼯程的⿐祖费根鲍姆

知识图谱

随着硬件计算能⼒的爆炸,⼈类社会已经进⼊智能化时代。各⾏各业纷纷踏上智能化升级与转型的道路,各类智能化应

⽤需求⼤量涌现。这些智能化应⽤需求对于机器认知⽔平提出了全新要求。实现机器认知智能的关键技术之⼀是知识库

技术。知识图谱作为⼤数据时代的重要的知识表⽰⽅式之⼀,为机器语⾔认知提供了丰富的背景知识,使得机器语⾔认

知成为可能,因⽽也成为了⾏业智能化转型道路上的关键技术之⼀。

知识图谱⾃2012年提出⾄今,发展迅速,如今已经成为⼈⼯智能领域的热门问题之⼀,吸引了来⾃学术界和⼯业界的⼴

泛关注,在⼀系列实际应⽤中取得了较好的落地效果,产⽣了巨⼤的社会与经济效益。

2016年AlphaGo战胜了⼈类围棋冠军;再到2017年AlphaZero战胜了AlphaGo,以及DeepMind去尝试星际争霸游戏,

这⼀波⼈⼯智能热潮是在⼤数据所给予的海量标注样本以及超强计算能⼒这两个强⼤的⽀撑作⽤下所形成的。

在各⾏业的智能化发展进程中,AI+或者AI赋能成为了传统⾏业智能化升级和转型的⼀个基本模式。在AI的赋能下,传

统⾏业⾯临着⾮常多的机遇,其所关⼼的⼀系列核⼼问题,⽐如增加收⼊、降低成本、提⾼效率和安全保障等,都将显

著受益于智能化技术。⽐如智能客服系统已经在很多⾏业⼤规模应⽤,⼤⼤降低了⼈⼯客服的巨⼤劳动⼒成本;⽹感的

智能数据治理系统TMLSmartData对企业内部⽣成数据和外部销售数据进⾏⾃动对齐,补全,统计,及时⽣成业务报表

以供决策。智能化的升级和转型对整个传统⾏业产⽣的影响将是颠覆性的。

前⼏年在深度学习的推动下,机器感知能⼒显著提升。但以深度学习为代表的统计学习严重依赖⼤样本,这些⽅法只能

习得数据中的统计模式。然⽽,现实世界很多实际问题的解决单单依靠统计模式是不够的,还需要知识,特别是符号化

的知识。我们⼈类的语⾔理解、司法判案、医疗诊断、投资决策等等很多领域都是显著依赖我们的知识才能实现的。⽽

知识图谱就是这种不可或缺的知识的重要表现形式之⼀。

认知智能

机器认知智能的发展过程本质上是⼈类脑⼒不断解放的过程。认知智能的第⼀个应⽤就是⼤数据的精准与精细分析。越

来越多的⾏业或者企业积累了规模可观的⼤数据,但是很多时候这些数据⾮但没有创造价值,还成为了⼀笔负资产。这

⼀现象的根本原因在于,当前的机器缺乏诸如知识图谱这样的背景知识,机器理解⼤数据的⼿段有限,限制了⼤数据的

精准与精细分析,从⽽⼤⼤降低了⼤数据的潜在价值。⽐如,王宝强离婚案刚刚开始的时候,新浪微博的热搜前三位分

别是“王宝强离婚”、“王宝宝离婚”和“宝强离婚”。也就是说,当时的微博平台还没有能⼒将这三件事⾃动归类到⼀件事。

⽹感的智能数据治理系统TMLSmartData可以⾃动识别相似字段,⽐如对于药⼚客户在统计销售流向数据时,可以⾃动

识别“解放军总医院”,“301医院”,“解放军301医院”等不同字段对应的是同⼀家医院,并⾃动对齐,统计,⽣成报表。

认知智能的第⼆个⾮常重要的应⽤是智慧搜索。下⼀代智慧搜索对机器认知智能提出了需求。智慧搜索体现在很多⽅

⾯。⾸先,体现在搜索意图的精准理解⽅⾯。⽐如现在的百度已经具备了⼀些智能搜索功能,搜索“北京⼤学”,除了含

有“北京⼤学”字段的内容被搜出,含有“北⼤”字段的内容也会被搜出。⽹感的智能法律助⼿TMLSmartLawyer,搜索“两

有“北京⼤学”字段的内容被搜出,含有“北⼤”字段的内容也会被搜出。⽹感的智能法律助⼿TMLSmartLawyer,搜索“两

个⼩孩”,搜出的相关判例⾥⾯会有“两个⼉⼦”,“两个⼥⼉”,“⽣育⼀⼉⼀⼥”等各种对于两个孩⼦的不同表述。其次,搜

索的对象越来越复杂多元化。以前搜索的对象以⽂本为主,现在⼤家希望能搜索图⽚和声⾳,甚⾄还能搜代码,搜视

频,搜设计素材等等,要求⼀切皆可搜索。第三、搜索的粒度也越来越多元化。现在的搜索不仅能做篇章级的搜索,还

希望能做到段落级、语句级、词汇级的搜索。尤其是在传统知识管理领域,这个趋势已经⾮常明显。

认知智能的第三个应⽤是智能推荐。智能推荐表现在很多⽅⾯。

⾸先是场景化推荐。⽐如⽤户在淘宝上搜“沙滩裤”、“沙滩鞋”,可以推测这个⽤户很有可能要去沙滩度假。那么平台是否

能推荐“泳⾐”、“防晒霜”之类的沙滩度假常⽤物品呢?

第⼆、任务型推荐。很多搜索背后的动机是完成特定任务。⽐如⽤户购买了“⽺⾁卷”、“⽜⾁卷”、“菠菜”、“⽕锅底料”,

那么⽤户很有可能是要做⼀顿⽕锅,这种情况下,系统推荐⽕锅调料、⽕锅电磁炉,⽤户很有可能买单。

第三、冷启动下的推荐。冷启动阶段的推荐⼀直是传统基于统计⾏为的推荐⽅法,难以有效解决的问题。利⽤外部知

识,特别是关于⽤户与物品的知识指引冷启动阶段的匹配与推荐,是有可能让系统尽快渡过这个阶段的。

第四、跨领域的推荐。⽐如,如果⼀个微博⽤户经常晒九寨沟、黄⼭、泰⼭的照⽚,那么为这位⽤户推荐⼀些淘宝的登

⼭装备准没错。实现这种跨领域推荐显然商业价值巨⼤,但却需要跨越巨⼤的语义鸿沟。

如果能有效利⽤知识图谱这类背景知识,不同平台之间的这种语义鸿沟是有可能被跨越的。⽐如⽹感的智能会员画像系

统TMLSmartMember,通过药店会员的药品购买记录,分析药品说明书的同时建⽴知识图谱,并推测会员得了什么

病,再通过推荐算法推荐关联药物。这些知识的推荐,将显著增强⽤户对于推荐内容的信任与接受程度。消费背后的内

容与知识需求将成为推荐的重要考虑因素。所以未来的推荐趋势就是精准感知任务与场景,想⽤户之未想。基于知识的

推荐,将逐步成为未来推荐技术的主流。

认知智能的第四个应⽤是智能解释。“why”和“how”问题在现实应⽤中越来越多。这⼀趋势实际上体现了⼈们的⼀个普遍

诉求,那就是希望智能系统具备可解释性。可解释性决定了AI系统的决策结果能否被⼈类采信。可解释性成为了很多领

域(⾦融、医疗、司法等)中阻碍AI系统落地应⽤的最后⼀公⾥。⽐如在⾦融领域的智能投资决策,即便AI决策的准确

超过90%,但是如果系统不能给出作出决策的理由,投资经理或者⽤户恐怕也是⼗分犹豫的。再⽐如在医疗领域,即便

系统判断疾病的准确率在95%以上,但是如果系统只是告诉病患得了什么病或者开了⼀个药⽅,却不能解释为什么作出

这类判断的话,病⼈是不会为此买单的。智能系统的可解释性体现在很多具体任务中,包括解释过程、解释结果、解释

关系、解释事实。事实上,可解释⼈⼯智能最近受到了越来越多的关注。在学术界,机器学习,特别是深度学习的⿊盒

特性,⽇益成为学习模型实际应⽤的主要障碍之⼀。越来越多的学术研究项⽬旨在打开深度学习的⿊盒。

智能系统另外⼀个⾮常重要的表现⽅式就是⾃然⼈机交互。越⾃然简单的⼈机交互⽅式越依赖强⼤的机器智能⽔平。⾃

然⼈机交互包括⾃然语⾔问答、对话、体感交互、表情交互等等。特别是⾃然语⾔交互的实现需要机器能够理解⼈类的

⾃然语⾔。我们的BOTs(对话机器⼈)将代替我们阅读⽂章、新闻,浏览图谱、视频,甚⾄代替我们看电影、电视

剧,然后回答我们所关⼼的任何问题。⾃然⼈机交互的实现显然需要机器的较⾼认知智能⽔平,以及机器具备强⼤的背

景知识。

认知智能还体现在机器的深层关系发现与推理能⼒⽅⾯。这⾥举例⼀个著名的娱乐圈图谱(王菲)。更多类似例⼦发⽣

在⾦融领域。在⾦融领域,我们可能⼗分关注投资关系,⽐如为何某个投资⼈投资某家公司;我们⼗分关注⾦融安全,

在⾦融领域。在⾦融领域,我们可能⼗分关注投资关系,⽐如为何某个投资⼈投资某家公司;我们⼗分关注⾦融安全,

⽐如信贷风险评估需要分析⼀个贷款⼈的相关关联⼈物和关联公司的信⽤评级。

知识图谱与认知智能

所以问题来了:如何实现机器的认知能⼒?以知识图谱为代表的这⼀波知识⼯程的⼀系列技术,在认知智能的实现中起

到⾮常关键的作⽤。从2012年Google提出知识图谱直到今天,知识图谱技术发展迅速,知识图谱的内涵远远超越了其

作为语义⽹络的狭义内涵。当下,在更多实际场合下,知识图谱是作为⼀种技术体系,指代⼤数据时代知识⼯程的⼀系

列代表性技术进展的总和。

知识图谱是⼀种⼤规模语义⽹络,与上世纪七⼋⼗年代的各类语义⽹络相⽐较,最显著的差异就是规模差异。推⽽⼴

之,以知识图谱为代表的⼤数据时代的各种知识表⽰与传统的知识表⽰的根本差别⾸先体现在规模上。传统知识⼯程⼀

系列知识表⽰都是⼀种典型的“⼩知识”(smallknowledge)。⽽到了⼤数据时代,受益于海量数据、强⼤计算能⼒以及

群智计算,我们如今能够⾃动化构建、或者众包构建⼤规模、⾼质量知识库,形成所谓的“⼤知识”(bigknowledge)。所

以知识图谱与传统知识表⽰在浅层次上的区别,就是⼤知识与⼩知识的差别,是在规模上的显⽽易见的差别。Small

knowledge+Bigdata=Bigknowledge。

为什么知识图谱对于机器实现⼈⼯智能如此重要呢?我们来看机器认知智能的两个核⼼能⼒:“理解”和“解释”。⾸先,机

器认知的核⼼能⼒之⼀:⾃然语⾔理解。⾃然语⾔是异常复杂的:⾃然语⾔有歧义性、多样性,语义理解有模糊性且依

赖上下⽂。机器理解⾃然语⾔困难的根本原因在于,⼈类语⾔理解是建⽴在⼈类的认知能⼒基础之上的,⼈类的认知体

验所形成的背景知识是⽀撑⼈类语⾔理解的根本⽀柱。实现机器⾃然语⾔理解所需要的背景知识是有着苛刻的条件的:

规模⾜够⼤、语义关系⾜够丰富、结构⾜够友好、质量⾜够精良。以这四个条件去看知识表⽰就会发现,只有知识图谱

是满⾜所有这些条件的:知识图谱规模巨⼤,动辄包含数⼗亿实体;关系多样,⽐如在线百科图谱DBpedia包含数千种

常见语义关系;结构友好,通常表达为RDF三元组,这是⼀种对于机器⽽⾔能够有效处理的结构;质量也很精良,因为

知识图谱可以充分利⽤⼤数据的多源特性进⾏交叉验证,也可利⽤众包保证知识库质量。所以知识图谱成为了让机器理

解⾃然语⾔所需的背景知识的不⼆选择。知识图谱在司法、⾦融、医疗等知识密集型的应⽤领域已经体现的⾮常明显

了。⽐如在司法领域,如果不把司法背后的事理逻辑、知识体系赋予机器,单纯依赖字符数据的处理,是难以实现司法

数据的语义理解的,是难以满⾜司法⽂本的智能化处理需求的。

知识图谱对于认知智能的另⼀个重要意义在于:知识图谱让可解释⼈⼯智能成为可能。“解释”这件事情⼀定是跟符号化

知识图谱密切相关的。因为解释的对象是⼈,⼈只能理解符号,没办法理解数值,所以⼀定要利⽤符号知识开展可解释

⼈⼯智能的研究。可解释性是不能回避符号知识的。我们⽬前的互联⽹推荐,只能给我们推荐结果,却⽆法解释为什

么。可解释推荐将是未来推荐研究的重要领域,将是具有巨⼤商业价值的研究课题。

知识图谱的另⼀个重要作⽤体现在知识引导将成为解决问题的主要⽅式。⽤户对使⽤统计模型来解决问题的效果越来越

不满意了,统计模型的效果已经接近“天花板”,要想突破这个“天花板”,需要知识引导。⽐如“张三把李四打了,他进医

院了”和“张三把李四打了,他进监狱了”,⼈类很容易确定这两个不同的“他”的分别指代。因为⼈类有关于打⼈这个场景

院了”和“张三把李四打了,他进监狱了”,⼈类很容易确定这两个不同的“他”的分别指代。因为⼈类有关于打⼈这个场景

的基本知识,知道打⼈的往往要进监狱,⽽被打的往往会进医院。很多任务是纯粹的基于数据驱动的模型所解决不了

的,知识在很多任务⾥不可或缺。⽐较务实的做法是将这两类⽅法深度融合。

知识对于认知智能⼜⼀个很重要的意义就是将显著增强机器学习的能⼒。机器学习与⼈类学习的根本差异可以归结为⼈

是有知识的且能够有效利⽤知识的物种。机器智能的实现路径之⼀是习得数据中的统计模式,以解决⼀系列实际任务。

另⼀种是专家系统,专家将知识赋予机器构建专家系统,让机器利⽤专家知识解决实际问题。如今,这两种⽅法有合流

的趋势,⽆论是专家知识还是通过学习模型习得的知识,都将显式地表达并且沉淀到知识库中。再利⽤知识增强的机器

学习模型解决实际问题。这种知识增强下的学习模型,可以显著降低机器学习模型对于⼤样本的依赖,提⾼学习的经济

性;提⾼机器学习模型对先验知识的利⽤率;提升机器学习模型的决策结果与先验知识的⼀致性。

KnowledgeisthepowerinAI,知识的沉淀和传承不仅铸就了⼈类⽂明的辉煌,或许也将造就机器智能的全新⾼度。

本文发布于:2022-12-27 05:23:02,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/fanwen/fan/90/38371.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:约翰特里
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图