英皇体育App-英皇体育首页

全国加盟咨询热线:

+852 2506 1668

当前位置:主页 > 客户评价 >

Google发布“知识图谱”

文章出处:未知 浏览次数:发表时间:2021-09-17 00:05

上周三,Google低调推出了一项被称为“知识图谱”的新技术。当输入奥郎德,法国新任总统,你就会得到一段简史(链接),有关他的孩子,伴侣,,生日,教育背景等等。短期内,知识图谱不会对你的认知有多大的改变—因为可能通过访问奥郎德wikipedia的主页,你也能得到同样的信息,很多人甚至更愿意询问周围的朋友。但是,在引擎盖下所隐藏的才是这家世界上最大的搜索引擎公司展示的一个重大改变。不仅如此,在一二十年后,科学家和新闻记者很可能会回过头来将现在这一刻定为一个分水岭-一个无规律的海量数据挖掘的机器与一个有一些像人类一样开始思考的机器的分水岭。

自公司成立起,Google就采用Brute Force算法作为其主要战略来组织互联网知识,并非没有道理。Google拥有世界上最大的并行计算机群,提供世界上最大的数据库。你的搜索请求可以被如此迅速的响应是因为他们外包给庞大的数据中心,数据中心利用大量预编译数据,这些数据是由数百万虚构的google“蜘蛛”一样的东西在网上监听收集而来的。在许多方面,Google的操作都能让人联想到IBM的深蓝,深蓝在象棋比赛中最终战胜了所有人类挑战者,不是靠它比人类聪明,而是比人类计算的更快。深蓝的获胜是通过Brute Force算法而非像人类一样的思考。计算机有蛮力,但无策略。

当然有时蛮力也有它的优势。Google巨大的计算源革新了人工智能中经典问题的解决方法。比如拼写检测过程,最早让文字处理流行起来的功能之一是自动拼写检测。微软工程师的做法是:将大部分人常犯的错误归类,比如字母重复或换位,从而建立各种模式来试图猜测用户的意图。Google对于这种拼写更正采用了完全不同的解决方案,且更高效,即通过简单的查看一个数据库让用户自己来更正其错误。用户在找不到自己想输入的单词“peopple”后接下来会输入什么呢?啊哈,原来是“people”。

Google的算法并不关注字母重复了,换位了,或人们在拼写时的心理,而只关注用户拼写出错后会改成什么。做到这些只需足够大的数据库和足够快的计算机,问题的解决并不需要深入洞察人类的心理。

在过去的十年间,人工智能的大部分工作的处理都类似Google所采用的方法,即在更大更快的机器配上海量的数据库。然而,无论数据库容量如何扩展,世界是复杂的,仅靠数据挖掘是不够的。深蓝可以战胜世界象棋冠军,但是人类依然可以在一个古老的围棋游戏Go中痛击计算机,因为这种游戏有一个更大的棋盘和更多可能的走法。甚至在Google最擅长的网页搜索中,Brute Force算法经常因为同音的问题而导致其不管用。比如单词“Boston”,可以指马萨诸塞洲的一个城市,也可以是一个乐队。Paris可以是一个城市,也可能是好出风头的社交名流。

为了处理类似“Paris”一词多义这样的问题,Google知识搜索重新使用了在上世纪五六十年代首次提出的的语义网络的想法,那是对人类意识在大脑中可能的编码信息做出的最早猜测。取代词与词之间简单的关联,采取信息编码上的唯一的对应实体。比如,指代地方的Paris和指代人的巴黎分配不同的ID号-某种类似于条形码或者社保号的东西,这样简单的关联被一种有注解的分类取代,这种分类基于实体之间的编码关系。因此,Paris1(城市)通过一个包含的关系连接到埃菲尔铁塔,Paris2(人)则通过一个取消的关系连接到各种真人秀中。当所有的地点,人物和关系相互关联,这些网络便开始像一个巨大的蜘蛛网。从本质上讲,Google正试图重塑互联网,提供一个更加智能的信息获取渠道。

尽管语义网络在上世纪七十年代相当流行,但到了八十年代中研究逐渐停止,而被神经网络所取代,神经网络把大脑看做简单的统计积累来给其建模。神经网络应用覆盖认知规则,这个规则将所有的联系视为对等,差异仅在于出现在世界上的频率。作为地点的Paris和作为人的Paris这一例子用它是区分不了的。这场结构化的知识和庞大的统计数据库之间的战争呼应了心理学和哲学史上最长的争论之一。即先天论者(代表人物:柏拉图,康德和近代的诺姆-乔姆斯基以及史蒂芬-平克)和经验论者(代表人物:约翰-洛克和斯金纳)之争。先天论者认为头脑人来就有重要的基本知识。经验论者则认为人的大脑最初是空白的,所有知识的获取都来自于关联和经验。

Google曾经在本质上是一部经验主义者的机器,最初没有任何的内在的知识,只是被赋予一种巨大的能力来学习建立事物之间的关联。(这是导致Google对信息无限的吸收能力,从而引发了对个人隐私的侵犯问题。) 如今,Google正在转变,在先天主义和经验主义之间寻求平衡。从而成为一部结合有着结构化分类,诸如人物,地点的内建数据库的统计经验主义和先天主义的机器。Google的搜索引擎依然跟踪所有出现的数万亿次的词条Paris和用户提问及文档中的关联,然而这次试图连接起的信息不是简单的对应,而是将他们根据人物,地点,企业目录化。

这有一个很好的理由来支持Google朝这个方向转变。作为心理学家的先锋Elizabeth Spelke(纽约时报最近报道的)声称:“如果孩子被赋予天生感知物体,人物,组件,地点的能力,那么他们可以使用自身的感性经验来了解这些实体的属性和行为。但是,根本不清楚儿童如何认知一个范围内的实体,如果他们还不能把这些实体从他们周围分辨出来”。计算机也是同样的道理。

从算法到编码和检索庞大的信息仓库,计算机变得比我们更快,更可靠。我个人一直羡慕Google和它主要竞争对手,微软的bing能够在虚拟指尖间获取如此多的信息。但是我们人类还是留了一手的。看到计算机工程师偶尔也需要从人类的意识中偷取一个页面,让人颇感振奋。

本文编译自:qh_yw,原文地址。

译文出处:译言网

下一篇:没有了 上一篇:360N4今日官方接受预约抢购 899元起

回顶部