作者:DIGITIMES陈宜君
凭借中、英文之间的语言差异,国内搜寻引擎巨擘百度在一项人工智能(AI)自然语言处理竞赛中,击败微软(Microsoft)和全球搜寻引擎龙头Google,夺得冠军。
在自然语言理解的通用语言理解评估(General Language Understanding Evaluation;GLUE)基准与分析平台上,百度的ERNIE模型获得最高的90.1分,超越微软的89.9分和Google的89.7分。
ERNIE模型最初是为理解中文语言而开发,不过百度研究人员很快就发现此模型也能更正确理解英语。
ERNIE是受Google用来训练AI理解人类语言的BERT模型启发而来。BERT是一种屏蔽式语言模型,会在给定的每份文本中遮隐15%的单词,然后尝试根据上下文进行预测。
不过许多汉字唯有与其他汉字组合在一起时,才会有明确的内在含意,这是中、英文的一项重要语言差异。百度团队必须训练其AI模型理解如何先隐藏一串有意义的汉字,再预测这些被遮隐的内容。
百度团队在其原始码代管平台Github页面上说明ERNIE所采用的技术时,以哈利波特(Harry Potter)是英国小说家罗琳(J. K. Rowling)所写的系列奇幻小说,作为说明范例。
该说明指出,BERT模型能透过文本中同时出现的J、K和Rowling等单词,确定K在这份文本中所代表的意思,却无法学习和J. K. Rowling有关的任何知识;ERNIE则能透过分析单词和实体所隐藏的知识,推论Harry Potter和J. K. Rowling之间的关系,进而推论Harry Potter是J. K. Rowling所写的小说。
随着百度算法开始能理解有意义的单词,不再只是识别单一汉字后,ERNIE模型在中、英文理解上都有更好的表现。此后百度就将ERNIE应用于实际生活中,利用此AI模型提供更好的搜寻结果。人工智能促进协会(Association for the Advancement of Artificial Intelligence)曾在2019年2月的年会中,接受一篇以ERNIE模型为主题的报告在会上发表。
自Google在2010年退出国内后,国内搜寻引擎市场一直由百度独霸,囊括70%的市占率。不过网际网络使用模式的改变,让百度的优势开始松动。包括腾讯微信在内的自成一体超级应用程序(App)生态体系在中国崛起,意味民众观赏影片、阅读新闻、在在线购物或下单美食外送时,都不必再仰赖传统搜寻引擎。
此外,因短片App抖音风靡全球而崛起的字节跳动公司在2019年推出头条搜索,在国内搜寻引擎市场掀起新一波竞争。字节跳动声称,正在打造一个通用搜寻引擎,以提供更理想的用户体验。
推荐阅读:240hz显示器
-
你的高筋面粉,真的是高筋面粉吗?| 烘焙小课
之前有个朋友一直跟我说做面包非常不理想。我帮她分析了很多原因,后来问她用的是什么面粉,她说:“就是在超市买的XX牌的高筋小麦粉啊。”今儿我逛超市的时候,特意看了...
2019-12-18 -
当年到底生产了多少瓶“82年拉菲”,到现在都
从古至今,在中国人的饭桌上,从来就少不了酒,无论是经商贸易,还是红白喜事,饭桌上推杯换盏,已经是一种常态,无论是王宫贵族还是平民百姓,都对酒有一种浓厚的感情,中...
2019-12-18 -
别再买酵母了,教你自己在家做,简单易学,做啥
导读:别再买酵母了,教你自己在家做,简单易学,做啥都香在平时的时候,我们无论做什么面食,通常会用到发酵这一步,而且发酵的时候自然会借助一些发酵的东西,比如说酵母...
2019-12-18 -
面食大全之细说绣球,儿子吃下去1分钟,为娘做
北方面食花样多,说起馒头,只要会做白面的,花样的也能很快上手!问我为啥要做花样的?好看呗!关于整形花式馒头,还是需要一些耐心的,比如如何给面团上色?做造型时怎样...
2019-12-18 -
想学做酸酸甜甜又开胃的山楂糕吗?快来看看吧,
应季水果在我们的心里又便宜又新鲜好吃,因此总会在当季大量频繁的购买。但有这么一个水果,人们都变着花样地吃它,却很少有人买它,没错,它就是山楂。山楂季又到了,说起...
2019-12-18 -
怎样用英语买咖啡点心?掌握这个万能的点餐公式
下面我们来介绍一个点单公式,有了这个公式,你只需要把你想要的东西一一套用进去,便可以得到最符合你口味的咖啡!你要知道自己的5个需求如下你要的杯子尺寸size +...
2019-12-18