当前位置:首页>> 谷歌要将人类的多重感官赋予人工智能系统

谷歌要将人类的多重感官赋予人工智能系统

发布时间:2017-02-23作者:林静

在人工智能的世界中,还有很多不足之处有待解决。大多数 AI 解决方案并不能处理多种类型的输入。具体来说,大多数人工智能工具只能专注一个方向,比如声音、视觉或文字。目前,还鲜有人去尝试将三方面结合起来去构建一套 AI 解决方案,为什么?因为以目前的技术水平,我们离创建一套完整 AI 系统还差很远。

谷歌要将人类的多重感官赋予人工智能系统

但现在,有人终于开始尝试,谷歌和麻省理工学院一个新项目正在向一个多功能完整 AI 方案迈出第一步。更具体地说,双方将合作开发出能同时处理声音、文本和图像的 AI 解决方案。可以想象,一旦研究项目有所突破,将赋予人工智能以类似人类的多重感官,这将是一个极具野心的研究项目。

对于我们人类来说,在任何给定的时间,我们几乎都不可能只使用一种感官。另一方面,而人工智能却完全不具备这种能力。将所见所闻相匹配是人类的第二天赋,但对机器来说,能够实现一种“感官”已经非常难了。

所以,仅仅是在感官方面,让 AI 具备人类的某些功能其实已经是一项看上去不可能完成的任务,更不必说机器的智能水平了。

不论以何种方式,创建一个能够像人类一样学习和适应的算法并不容易。麻省理工学院和谷歌发布的全新研究报告则为这一尝试指明了道路,让人们看到了赋予 AI 系统多重“感官”的可能性。新的论文概述了如何 AI 如何调节自己听到和看到的东西,并将其同步,这非常类似人脑的运作方式。

谷歌要将人类的多重感官赋予人工智能系统

图丨麻省理工学院博士后研究员 Yusuf Aytar

论文的联合作者、麻省理工学院博士后 Yusuf Aytar 表示:“不管你是听见了了引擎声,还是看到了汽车,这都无所谓,因为你马上能识别出这是同一概念。这些信息已经在你的大脑中被统一起来。”

这里的关键词就是协调与统一。研究人员并没有教会算法新的东西,而是创造了一种方式让算法将一种感官与另一种感官连接统一起来。Aytar 举了一个例子来说明:当一辆自动驾驶汽车听见救护车的声音时,就能将其与救护车的样子联系在一起,即便因为视线受阻没有看见救护车,也能提前做出避让。

为了训练这套 AI 系统,麻省理工学院的研究人员首先向神经网络展示了一些带有音频的视频文件,当神经网络接收到这些视频和音频后,就会开始尝试预测物体与声音之间的联系。然后,研究人员开始同一算法中输入带有文字说明的图像,让神经网络将图片中的物体与其文字说明联系起来。以此类推,这样就完成了视频、声音、图像、文字间的相互转换与识别。

谷歌要将人类的多重感官赋予人工智能系统

图丨将声音、图像、文字输入同一神经网络

培训这个系统将需要大量的工作,尽管已经证明了几个测试已经相当成功。现在,算法只是提供“简单”的信息,但没有理由认为它不能处理更复杂的事情。使用这种开创性的技术将在未来几年为人类发展世界带来新的生命。

尽管已经进行过的测试都非常成功,但训练这个系统还有很多额工作要做。目前,研究人员只为算法提供了相对简单的信息,以后的训练数据将会越来越复杂。为 AI 系统赋予多重感官,这种开创性的研究方向势必将在未来几年内为人工智能领域的研究带来新的突破。(生物谷 Bioon.com)

公司简介

宜科(天津)电子有限公司是中国工业自动化的领军企业,于2003年在天津投资成立,销售和服务网络覆盖全国。作为中国本土工业自动化产品的提供商和智能制造解决方案的供应商,宜科在汽车、汽车零部件、工程机械、机器人、食品制药、印刷包装、纺织机械、物流设备、电子制造等诸多领域占据领先地位。宜科为智慧工厂的整体规划实施提供自系统层、控制层、网络层到执行层自上而下的全系列服务,产品及解决方案涵盖但不局限于云平台、MES制造执行系统、工业现场总线、工业以太网、工业无线通讯、机器人及智能设备组成的自动化生产线、自动化电气控制系统集成、智能物流仓储系统等,以实现真正智能化的生产制造,从而带来生产力和生产效率的大幅提升,以及对生产灵活性和生产复杂性的管理能力的大幅提升。多年来,宜科以创新的技术、卓越的解决方案和产品坚持不懈地为中国制造业的发展提供全面支持,并以出众的品质和令人信赖的可靠性、领先的技术成就、不懈的创新追求,在业界独树一帜。帮助中国制造业转型升级,加速智能制造进程,成为中国工业4.0智慧工厂解决方案当之无愧的践行者。

更多详情>>

联系我们

  • 联系人:章清涛
  • 热线:18611695135
  • 电话:
  • 传真:
  • 邮箱:18210150532@139.com

Copyright © 2015 ilinki.net Inc. All rights reserved. 智汇工业版权所有

电话:010-62314658 邮箱:service@ilinki.net

主办单位:智汇万联(北京)信息技术有限公司

京ICP备15030148号-1