视觉技术赐予机器设备一双“慧眼”

来源:工控中国

点击:2284

A+ A-

所属频道:新闻中心

关键词:机器视觉

    “眼镜是心灵的窗户,打开心灵之窗请到XX眼科医院”这是一则广告语,但我并不是来打广告的,我只是想通过它,说明眼睛对人类的重要性。不仅人类需要眼睛,机器人同样需要一双能看清一切的明眸。

      看清一切的明眸
      机器视觉给机器人一双“慧眼”
      
      看清楚是做好一件事情的基础,人工智能没有视觉也就不可能成为真的智能。机器视觉系统便是让这一切变成现实的的神奇发明。
      
      当前,面向特定领域的专用人工智能技术取得了突破性进展,甚至可以在单点突破、局部智能水平的单项测试中超越人类智能。比如日本仿人机器人、美国猎豹机器人、德国工业机器人,还有我国的人脸识别、虹膜识别、步态识别等人工智能发展很快。
      
      但是就目前水平来看,距离我们理想中的机器人差的还是太远。作为人类理想中的机器人,就应该是《我,机器人》中的桑尼那样,具备一切人类拥有而更出色的本领。人工智能的目的是帮人类解决更多更复杂的问题,那才能算得上成功,但是如果连“看”都做不到,你还能指望他们做好更难的事情吗?这是作为智能机器人的基础条件之一,也是十分关键的一点。不仅如此,大量的工业检测系统也需要机器人能看的见,比如颜色、图形检测,你说盲人能完成这份工作吗?大概傻子都不会信!
      
      基于机器视觉对人工智能发展的重要意义,一些科技公司已经提前布局视觉技术研究。
      
      谷歌最新发布的机器视觉工具Cloud Vision API,可以帮助开发者构建能够“理解”图像内容的应用,也就是图像识别。这款视觉工具的应用体现在四个方面:一是安全搜索检测工具(Safe Search Detection)是为那些开发大众图片分享应用准备的,而此工具的作用就是让开发者利用谷歌的Safe Search安全搜索技术,屏蔽一些内容不符合规定的图片内容;二是特性脸部检测(Facial Detection)。关于这个应用,中间也发生过一个小插曲,不久前有新闻报道称谷歌的人脸识别误将一位黑人判定为大猩猩,谷歌也为此做出道歉;三是地标检测(Landmark Detection),可让应用识别照片中的标志性建筑,比如艾弗尔铁塔,而且能明确标出这就是艾弗尔铁塔,而不只是说那是个塔,同时定位照片拍摄所在位置,自然景观也是适用的;四是实体检测(Entity Detection),可用于识别照片中主体内容,并且识别那是什么,比如农场的照片就可自动贴上“生产”的标签了。
      
      从上面不难发现,这些都还只是一些简单的图片识别功能,距离达到人类水准并超越人类的标准差距甚大。
      
      机器视觉是一门涉及了人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。一个典型的工业机器视觉应用系统,包括数字图像处理技术、机械工程技术、控制技术、光源照明技术、光学成像技术、传感器技术、模拟与数字视频技术、计算机软硬件技术、人机接口技术等。这其中涉及到的技术大多还处于发展阶段,受此类因素影响,机器视觉研究的进程也十分缓慢。
      
      要实现高层度的人工智能,让机器人能够看见是最基本的条件之一。机器视觉的研究当前还面临着大量的障碍,看见并识别物体也需要其他技术的支撑,所以这必将是一个漫长的过程。

    (审核编辑: 智汇先锋)