趣AI | 谷歌新AI工具可能让未来在线搜索像和朋友聊天一样

2022-08-02 0 1,149

二十多年来,谷歌一直提供优质的网络索引服务。现在这家公司正试图让人工智能理解人类语言的细微差别,以便提供更好的搜索体验。

那么互联网搜索的未来会是什么样的?谷歌设想它看起来更像是与朋友的一次随意交谈。最近,该公司宣布了一种名为 MUM 的新人工智能系统,它代表多任务统一模型。MUM 旨在在全球范围内了解人类语言的细微差别,这可以帮助用户更轻松地找到他们搜索的信息,或允许用户提出更抽象的问题。

谷歌已经在一项独立任务中使用 MUM 来了解人们搜索COVID 疫苗的不同方式,当然这项新技术尚未成为谷歌搜索系统的一部分。尽管目前还不确定功能何时会应用在实时搜索中,但谷歌团队正在积极开发其他一次性任务完善 MUM系统。

趣AI | 谷歌新AI工具可能让未来在线搜索像和朋友聊天一样

以下是关于 MUM 是什么,以及它有什么不同等知识点的介绍。

MUM解决疫苗名称搜索问题

早些时候,新冠疫苗刚上市的时候,谷歌搜索副总裁 Pandu Nayak 及其同事设计了一种“体验”,当用户搜索的时候,向人们提供有关 COVID 疫苗的信息,内容包括——从哪里获得、工作原理以及在哪里可以购买疫苗。

这种体验将所有这些重要的相关信息拼凑在一起,并将其展示在搜索结果第一页的顶部。想要实现这样的效果,需要团队对其进行编程,以便这样的内容仅在查询 COVID 疫苗时才会弹出。而这可能会成为一个问题,因为全球各地的人们可能以不同的方式和不同的名称提及 COVID 疫苗。

去年,该团队花了数百个小时梳理资源,以确定COVID疫苗各种不同名称。但现在,则有了MUM系统。Nayak表示:“我们能够用MUM建立一个非常简单的实验,在几秒钟内就能够用50种不同的语言为17种不同的疫苗产生800多个名字。”“我们有很多语言任务需要解决,无论是分类、排名、信息提取,还是一大堆其他任务。在短期内,我们希望使用MUM来改善这些问题。这并不是说它会带来新的功能或新的体验,而是说,能够让现有的功能和体验会更好。”

在Google I/O 上亮相

在春季的 Google I/O 开发者大会上,Google 高级副总裁 Prabhakar Raghavan 揭开了MUM 的面纱。

这项新技术是基于机器学习的搜索的自然进化,谷歌在过去十年中一直在完善和改进这一项技术。谷歌自夸称,MUM 能够获得对世界的深度知识,理解并生成语言,并同时训练75种语言。另外,还有内部试验,测试它是否可以是多模式的,也就是说,能够同时理解不同形式的信息,如文本、图像和视频。

所有这些复杂性都可以通过会议上的一个简单示例说明。假设你问谷歌,“我已经爬过亚当斯山,现在想在明年秋天去爬富士山,我应该做哪些不同的准备?”

大多数人在网上搜索信息的时候是不会输入这样的句子的。Raghavan 在 I/O 上解释道“这是一个你会随便问朋友的问题,但当下的搜索引擎无法直接回答这样的问题,因为它无法理解这种对话和语言的细微差别。”

但理想情况下,MUM 则会理解你想要比较两座山峰的区别,也会理解想要爬这两座山需要做的准备可能包括针对地形的健身训练和适合秋季天气的徒步装备。它将能够剖析你的问题并将其分解为一组查询,了解问题的各个方面,然后将其重新组合在一起。用户可以点击了解更多与问题的各个方面相关的搜索结果,也可以获得原始查询整体的解释。

MUM 工程师的长期目标就是让用户可以获得这样的搜索体验,不过实现这一目标所需的时间尚不清楚。从中期来看,谷歌的工程师正在训练 MUM 识别文字和图像之间的关系,并且进展顺利。Nayak 称,当他们要求 MUM 为他们输入的一段新文本生成图像时,比如“西伯利亚哈士奇”,它确实“做得非常出色”。

搜索简史

自1998年成立以来,谷歌一直在不断地绘制网络地图,收集大量的内容,并创建索引来组织所有信息。

你可以把谷歌搜索索引想象成一本书的索引。它会告诉你某个特定单词出现的所有页面。除了互联网,还有两个重要的区别。第一,一本书可能有300到1000页,与网络上数万亿的页面相比,这不算什么。第二个重要的区别是,有了书后的索引,你一次只能查找一个单词,而在网络上,你能查找单词的组合。“基于这种规模和组合,我们每天都会收到来自世界各地的数十亿次查询,”Nayak说。“值得注意的是,我们每天获得的15% 的搜索是以前从未见过的。查询流中有令人难以置信的新奇之处。”

Nayak 补充说,部分新奇的内容是由于拼错单词,而部分原因是世界在不断变化,人们要求新的(有时是非常具体的)事物。

为了尽可能把所有可能的网络信息精简化,并且与你的查询信息是相关的。谷歌使用一种算法,根据新鲜度和位置等因素,以及不同页面之间的链接方式,将它认为最有用的页面排在顶部

Nayak说道,“到目前为止,最重要的一类因素与语言理解有关,语言理解确实是搜索的核心,因为你需要了解查询的含义和文档的含义,以及这两者如何相互匹配。”

当然,软件无法像人类那样真正理解语言,包括它所有的细微差别。但是程序员可以开发各种策略,尽量接近我们理解语言的方式。

就在16年前,谷歌建立了同义词系统的第一个版本,它解释了不同的单词在不同的上下文中具有不同的含义。因此,当您谈论笔记本电脑的亮度时,“change”可以表示“adjust”。如果不能理解这一点,由于单词选择的变化,许多相关页面将被排除在搜索结果之外。

机器学习进化

大约六年前,谷歌推出了其第一个基于机器学习的搜索版本。然后,基于深度学习社区围绕自然语言算法开展的大量研究,它继续对其进行改进,这些算法可以查看单词用于理解其含义的上下文,并找出上下文的哪些部分需要注意。

2019年,谷歌推出了用于搜索的BERT架构。它的训练算法实际上是一系列“填空”练习。你可以用一个常用短语,屏蔽掉随机单词,然后让网络预测这些单词是什么。它也被称为掩码语言模型。

对于像“你能在药房为某人买药”之类的查询,以前搜索者会得到一个关于在药房取药的结果。而BERT 架构则能理解,它不仅是拿一张处方,还能理解到这是为朋友或家人开处方。Nayak 说道,“我们能够得出一个相关性更高的结果”。

展望未来,MUM 不仅能够像 BERT 这样理解语言,还能够生成语言。相比之下,MUM 比 BERT 功能更强大得多,(谷歌说它的功能大约是 BERT 的1000倍)。

MUM在谷歌提供的所有不同语言的公共网络语料库的高质量子集上接受训练。搜索团队会删除低质量内容、成人内容、露骨内容、仇恨言论,因此 MUM 学习的语言在某种意义上是更为积极的。

但 Nayak 承认,像 MUM 这样的大型语言模型肯定存在巨大的挑战需要团队努力解决。“例如,一个是偏见问题。因为这是从网络语料库中训练出来的,所以人们担心它是否反映或加强了网络中存在的偏见。Nayak希望,它是在语料库的高质量子集上训练的,这一事实将消除一些最严重的偏见。

注:文章资料来自popsci,原文链接:https://www.popsci.com/technology/google-mum-ai/

收藏 (0) 打赏

感谢您的支持,我们会继续努力的!

打开支付宝/微信/QQ扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

1. 本站所有教学内容和资源均来源于本站原创和网络收集以及用户自主上传,如有侵权请带证联系本站客服进行处理!邮箱:team@lcwl.fun
2. 对于非本站原创的资源不保证所提供下载资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系本站客服处理,有奖励!
3. 除本站原创教学或资源外其余资源您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!
4. 本站原创资源如需商用还请申请商业授权,否则本站有权追究其法律责任!
5. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有学币奖励额外收入!

凌晨资源网 IT资讯 趣AI | 谷歌新AI工具可能让未来在线搜索像和朋友聊天一样 https://www.lingchenw.cn/zixun/6935.html

常见问题
  • 本站所有付费教程均可单独付费或者开会员学习,自己购买或者开了会员就可以学习,来凌晨学院报名学习送会员,并且有讲师一对一辅导培训教学,师生互动化,定期布置作业等
查看详情
  • 本站所有资源版权均属于原作者所有,资源中标注可商用的可以商用的代表是本团队自主研发公布可商用的产品,未标注可商用所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。
查看详情

相关文章

官方客服团队

为您解决烦忧 - 24小时在线 专业服务

学习手机编程软件开发
手机编程软件开发

你知道吗?用手机也能开发制作软件,满足自己的编程心,做属于自己的软件

报名学习
自媒体短视频
副业做自媒体短视频

想做自媒体短视频剪辑给自己多一份副业,只需一部手机你也可以

报名学习
搭建网站必备云互联主机
链未云互联

搭建网站,后台云服务等必备云服务器互联主机,IDC云主机

现在使用
Fa快捷助手
用手点一点就能开发做软件

不用记编程语法,不用一行一行手敲代码,用手点一点就能开发制作软件

点击下载