发布时间:2018-02-09作者:智汇张瑜
顾 问
潘云鹤 中国工程院院士
指导单位
工业和信息化部信息化和软件服务业司
指导委员会
谢少锋 工信部信软司司长
李冠宇 工信部信软司副司长
徐晓兰 中国电子学会副理事长兼秘书长
张宏图 中国电子学会总部党委书记兼副秘书长
商 超 工信部信软司软件处处长
傅永宝 工信部信软司软件处调研员
专家委员会(排名不分先后,按姓氏笔画排序)
王士进 科大讯飞研究院副院长
韦 青 微软中国公司首席技术官
宋 波 国安瑞(北京)科技有限公司总经理
刘志坚 京东金融总法律顾问
吴甘沙 驭势科技联合创始人兼CEO
季向阳 清华大学自动化系教授
陈丽娟 阿里巴巴人工智能实验室负责人
梁家恩 云知声信息技术有限公司董事长兼CTO
崔 岩 中德人工智能研究院院长
蔡雄山 腾讯研究院法律研究中心副主任
编写单位
中国电子学会
编写人员
李 颋 周岷峰 马 良 凌 霞
李 岩 张雅妮 许华磊 张 婵
张 力 陈濛萌 樊江洋 朱 毅
李俊平 阎德利 谢中业 陈 岩
1、编制背景
自1956年概念得以确立以来,人工智能发展至今已逾60年,随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展阶段,呈现出大数据、跨媒体、群体性、自主化、人机融合的发展新特征,从学术牵引式发展迅速转变为需求牵引式发展,相比历史上的任何时刻,都要更加接近于人类智能,既能为进一步掌握城市发展、生态保护、经济管理、金融风险等宏观系统提供指导,也能为设计制造、健康医疗、交通管理、能源节约等微观领域提供解决方案。我国正值工业化、城镇化、信息化、农业现代化的攻坚阶段,迫切需要加快推动人工智能在国民经济社会各行业、各领域的创新应用,促进产业提质增效,改善人民生活水平,切实解决经济运行的重大结构性失衡。针对于此,有必要研究编制新一代人工智能发展白皮书,明确人工智能在新时期、新形势下的技术框架、关键环节、应用前景,为推动人工智能关键技术进步和产业化应用推广提供措施建议,进一步推动我国智能相关的前沿新兴产业持续健康快速发展,有力支撑我国信息化和工业化深度融合迈上新台阶。
2、编制目标
(1)明确新一代人工智能的主要发展方向,系统归纳其主要驱动因素及最具典型意义的特征。
(2)研究新一代人工智能的技术框架,梳理技术演进轨迹,提出基础性、通用性技术体系。
(3)探索新一代人工智能的产业边界,划分产业类别和应用场景,研判相关的投融资特征及趋势。
(4)提出促进新一代人工智能及相关技术及产业发展的可行性措施建议,为相关行业主管部门提供决策参考,为行业健康有序发展提供指导依据。
3、编制方法
(1)研究学习国内外相关战略政策文件,充分借鉴参考国内外主要研究动态和成果。主要包括:美国白宫发布的《为人工智能的未来做好准备》、《国家人工智能研究与发展战略规划》;英国下议院科学和技术委员会发布的《机器人和人工智能》、英国政府科学办公室发布的《人工智能对未来决策的机会和影响》,以及英国政府在2017年1月宣布的《现代工业战略》和3月公布的《数字战略》;日本政府制定的《人工智能产业化路线图》;我国出台的《国务院关于积极推进“互联网+”行动的指导意见》和《“十三五”国家战略性新兴产业发展规划》中关于人工智能的部分。同时,针对欧盟的“人脑项目”、德国的“智慧数据项目”、日本的“超智能社会”和“高级综合智能平台计划”进行了学习了解。
(2)访谈国内知名专家学者,围绕新一代人工智能的内涵、外延及特征趋势展开充分研讨。新一代人工智能既有创新性又有继承性,与过往所谈论的人工智能既有联系又有区别,在研究内容上既要有突破又要有充分吸收和借鉴。通过与国内人工智能相关领域的知名院士、高校学者、行业专家的座谈交流,尤其是围绕中国工程院潘云鹤院士《人工智能迈向2.0》一文进行的深入学习研讨,为白皮书的编制奠定了系统的理论基础。
(3)调研国内外知名人工智能企业,汇集整理和分析来自实践应用的典型案例。高度重视人工智能领域的具体产品、服务及解决方案提供方式,走进国内外一批在技术或产业方面具备领先水平和特色优势的人工智能企业展开深度调研,并邀请部分企业的技术或战略负责人共同参与了白皮书的编制工作。
4、特别声明
(1)研究主题充分考虑了与国家规划的互动和呼应
人工智能的概念从诞生之日开始计算,已经超过60年,并非横空出世的新兴事物。只不过受近年来算法模式持续优化、数据信息海量增长、运算力大幅提升的影响和带动,表现出了不同以往的发展水平和特征。本白皮书一开始研究主题名为“人工智能2.0”,目前已更改为“新一代人工智能”,是为了呼应院士研究文章、部委领导讲话,以及即将出台的国家级规划,重点针对人工智能的新趋势、新特征、新模式展开研究,并非是要提出一个全新的研究对象。
(2)研究范围聚焦技术和产业发展
在人工智能领域,正孕育着堪与相对论、量子理论、计算机、互联网相提并论的重大创新、变革及突破。人工智能历史性地站在了时代的风口,将对人类经济社会发展带来智能化浪潮的颠覆性猛烈冲击。研究人工智能,就要研究其在人类生产生活中的详细地位和作用,涉及到方方面面,包括了道德、法律、伦理、文化等领域。本白皮书的编制,主要是为了给相关行业主管部门和企业提供决策参考依据,集中在技术和产业两大层面展开研究,暂未涉及其他方面。
(3)研究内容仍有待进一步丰富完善
当前,各类研究咨询机构纷纷推出围绕人工智能主题的相关报告,各自观点既有一致性,也存在部分不同意见。本白皮书的主要观点和内容仅代表编制组在目前对人工智能的研判和思考,欢迎各方专家学者和企业代表提出宝贵意见,共同推动白皮书的及时更新和纠偏。同时,随着人工智能技术的进步、产业的发展、模式的变革,白皮书的内容将得到进一步丰富完善。
第三章 新一代人工智能的产业化应用
(一)新一代人工智能的产业边界
一般认为,人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的科学。迄今为止,出现了机器定理证明、机器翻译、专家系统、机器学习、机器人与智能控制等一系列研究成果。随着人工智能理论和技术的日益成熟,应用范围不断扩大,既包括城市发展、生态保护、经济管理、金融风险等宏观层面,也包括工业生产、医疗卫生、交通出行、能源利用等具体领域。专门从事人工智能产品研发、生产及服务的企业迅速成长,真正意义上的人工智能产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。
目前,对人工智能的认识相对较为统一,但人工智能产业的概念有待进一步明确,对人工智能的核心产业和人工智能带动的相关产业也需要进行有效区分。我们认为,可以将围绕人工智能技术及衍生出的主要应用形成的具有一定需求规模、商业模式较为清晰可行的行业集合,视为人工智能在当前的核心产业,也即本报告所关注的主体。随着潜在需求的逐渐明确和商业模式的日渐成熟,人工智能核心产业的边界与范围将逐步扩展。而通过人工智能核心产业发展所形成的辐射和扩散效应,获得新提升、新增长的国民经济其它行业集合,均可视为人工智能带动的相关产业。
通过梳理从研发到应用所涉及的产业链各个环节,我们进一步将新一代人工智能在当前的核心产业分为基础层、技术层和应用层,结合目前常见应用场景,依据产业链上下游关系,再将其主要划分为既相对独立又相互依存的若干种产品及服务,如下图所示。
图4 新一代人工智能当前核心产业链
2017年,全球人工智能核心产业规模已超过370亿美元。其中,我国人工智能核心产业规模已达到56亿美元左右。在下一阶段,得益于技术持续进步和商业模式不断完善,全球人工智能市场需求将进一步快速释放,带动2020年全球人工智能核心产业规模超过1300亿美元,年均增速达到60%;其中,我国人工智能核心产业规模将超过220亿美元,年均增速接近65%。
图5 全球人工智能核心产业规模及年增长率
图6 我国人工智能核心产业规模及年增长率
(二)基础层
基础层主要包括智能传感器、智能芯片、算法模型,其中,智能传感器和智能芯片属于基础硬件,算法模型属于核心软件。随着应用场景的快速铺开,既有的人工智能产业在规模和技术水平方面均与持续增长的市场需求尚有差距,倒逼相关企业及科研院所进一步加强对智能传感器、智能芯片及算法模型的研发及产业化力度。预计到2020年,全球智能传感器、智能芯片、算法模型的产业规模将突破270亿美元,我国智能传感器、智能芯片、算法模型的产业规模将突破44亿美元。
图7 2020年全球及我国人工智能基础层各产业规模占比
1、智能传感器:智能转型引领行业发展
智能传感器属于人工智能的神经末梢,是实现人工智能的核心组件,是用于全面感知外界环境的最核心元件,各类传感器的大规模部署和应用是实现人工智能不可或缺的基本条件。随着传统产业智能化改造的逐步推进,以及相关新型智能应用和解决方案的兴起,对智能传感器的需求将进一步提升,预计到2020年全球智能传感器的产业规模将超过54亿美元,其中我国智能传感器的产业规模为11亿美元。
核心技术。智能传感器本质上是利用微处理器实现智能处理功能的传感器,必须能够自主接收、分辨外界信号和指令,并能通过模糊逻辑运算、主动鉴别环境,自动调整和补偿适应环境,以便于大幅减轻数据传输频率和强度,显著提高数据采集效率。目前,智能传感器集成化、小型化的特点愈发突出,更多的功能被集成在一起,控制单元所需的外围接插件和分立元件越来越少,促使其通用性更强,应用范围更宽广,制造成本也进一步下降。同时,原子材料、纳米材料等新材料技术也在智能传感器领域得到日益广泛的应用,使其表现出更为灵敏的物理性能。
主要产品。智能传感器已广泛应用于智能机器人、智能制造系统、智能安防、智能人居、智能医疗等各个领域。例如,在智能机器人领域,智能传感器使机器人具有了视觉、听觉和触觉,可感周边环境,完成各种动作,并与人发生互动,包括触觉传感器、视觉传感器、超声波传感器等。在智能制造系统领域,利用智能传感器可直接测量与产品质量有关的温度、压力、流量等指标,利用深度学习等模型进行计算,推断出产品的质量,包括液位、能耗、速度等传感器。在安防、人居、医疗等与人类生活密切相关的领域,智能传感器也广泛搭载于各类智能终端,包括光线传感器、距离传感器、重力传感器、陀螺仪、心律传感器等。
典型企业。智能传感器市场主要由国外厂商占据,集中度相对较高。由于技术基础深厚,国外厂商通常多点布局,产品种类也较为丰富,较为典型的有霍尼韦尔、美国压电、意法半导体、飞思卡尔。如霍尼韦尔生产的产品包括了压力传感器、温度传感器、湿度传感器等多个产品类型,涉及航空航天、交通运输、医疗等多个领域。美国压电生产的产品涵盖了加速度传感器、压力传感器、扭矩传感器等,并涉及核工业、石化、水力、电力、和车辆等多个不同领域。相比之下,我国厂商经营内容仍较为单一,如高德红外主要生产红外热成像仪,华润半导体主要生产光敏半导体,但其中也出现了华工科技、中航电测等少数企业试水扩大布局范围。人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。
表6 主要智能传感器及生产企业
2、智能芯片:初创企业蓄势待发
智能芯片是人工智能的核心,与传统芯片最大的差别在于架构不同,传统的计算机芯片均属于冯·诺依曼体系,智能芯片则仿照大脑的结构设计,试图突破冯·诺依曼体系中必须通过总线交换信息的瓶颈。当前各大科技巨头正积极布局人工智能芯片领域,初创企业纷纷入局,随着市场将进一步打开,预计到2020年全球智能芯片的产业规模将接近135亿美元,其中我国智能芯片的产业规模近25亿美元。
核心技术。深度学习已成为当前主流的人工智能算法,这对于处理器芯片的运算能力和功耗提出了更高要求,目前软件企业采取的主流方案是通过应用GPU和FPGA提高运算效率,与CPU少量的逻辑运算单元相比,GPU就是一个庞大的计算矩阵,具有数以千计的计算核心,可实现10-100倍应用吞吐量,而且支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。同时,一些针对深度学习算法而专门优化和设计的芯片也已经面市,由于是量身定制,运行更为高效。
主要产品。数据和运算是深度学习的基础,可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片。2015年以来,英伟达公司的GPU得到广泛应用,并行计算变得更快、更便宜、更有效,最终导致人工智能大爆发。同时,与人工智能更匹配的智能芯片体系架构的研发成为人工智能领域的新风口,已有一些公司针对人工智能推出了专用的人工智能芯片。如IBM的类脑芯片TureNorth及神经突触计算机芯片SyNAPSE、高通的认知计算平台Zeroth、英特尔收购的Nervana、浙江大学与杭州电子科技大学的学者合作研制的类脑芯片“达尔文”,中国科学院计算技术研究所的寒武纪芯片。
典型企业。作为核心和底层基础,智能芯片已经成为各大公司布局的重点领域。目前传统芯片巨头如英特尔、英伟达,大型互联网公司如谷歌、微软已经在该领域发力,这些公司资金实力雄厚,除了自行研发外,通常也采用收购的方式快速建立竞争优势。例如,谷歌继2016年发布第一代TPU 后,于今年谷歌I/O大会上推出了第二代深度学习芯片TPU,英特尔则以167亿美元收购FPGA生产商Altera公司。由于智能芯片刚刚兴起,技术、标准都处于探索阶段,我国芯片厂商换道超车的机会窗口闪现,涌现出了一批优秀的创业型公司,如寒武纪、深鉴科技等。
表7 主要智能芯片及生产企业
3、算法模型:通过开源构建生态已是大势所趋
人工智能的算法是让机器自我学习的算法,通常可以分为监督学习和无监督学习。随着行业需求进一步具化,及对分析要求进一步的提升,围绕算法模型的研发及优化活动将越发频繁。当前,算法模型产业已初具规模,预计到2020年全球算法模型产业规模将达到82亿美元,我国算法模型产业规模将突破8亿美元。
核心技术。算法创新是推动本轮人工智能大发展的重要驱动力,深度学习、强化学习等技术的出现使得机器智能的水平大为提升。全球科技巨头纷纷以深度学习为核心在算法领域展开布局,谷歌、微软、IBM、Facebook、百度等相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。
主要产品。目前,随着大数据环境的日渐形成,全球算法模型持续取得应用进展,深度学习算法成为推动人工智能发展的焦点,各大公司纷纷推出自己的深度学习框架,如谷歌的TensorFlow,IBM的System ML,Facebook的Torchnet,百度公司的PaddlePaddle。更为重要的是,开源已成为这一领域不可逆的趋势,这些科技巨头正着手推动相关算法的开源化,发起算法生态系统的竞争。与此同时,服务化也是算法领域未来发展的重要方向,一些在算法提供商正将算法包装为服务,针对客户的具体需求提供整体解决方案。
典型企业。目前,在算法模型领域具备优势的企业基本均为知名的科技巨头,正在通过构建联盟关系,扩展战略定位等方式布局人工智能产业。2016年9月,Facebook、亚马逊、谷歌Alphabet、IBM和微软自发聚集在一起,宣布缔结新的人工智能伙伴关系,10月,谷歌公司更是调整战略方向从移动优先转变为人工智能优先。我国科技企业也纷纷落子人工智能,2017年3月,阿里巴巴正式推出“NASA”计划,腾讯成立人工智能实验室,5月,百度公司将战略定位从互联网公司变更为人工智能公司,发展人工智能已经成为科技界的共识。
表8 主要算法模型及相关机构
(三)技术层
技术层主要包括语音识别、图像视频识别、文本识别等产业,其中语音识别已经延展到了语义识别层面,图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识。随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势。预计到2020年,全球语音识别、图像视频识别、文本识别等人工智能技术层产业规模将达到342亿美元,我国人工智能技术层产业规模将突破66亿美元。
图8 2020年全球及我国人工智能技术层各产业规模占比
1、语音识别:正在步入应用拉动的快速增长阶段
语音识别(Speech Recognition,SR)技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品。在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入应用快速增长期,未来将代入更多实际场景,预计到2020年全球语音识别产业规模将达到236亿美元,国内语音识别产业规模达到44.2亿美元。
核心技术。语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操作的结构化语义,完成实时的人机交互功能。近年来,语音唤醒技术、声学前端处理技术、声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统,提高语音识别的准确率与响应速度,满足垂直领域对自然语义识别和声音指令的应用需求,为用户提供自然、友好和便捷的人机交互体验。
主要产品。伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式,语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品,可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径导航、会议记录等功能,优化了复杂的工作流程,提供了全新的用户应用体验。
典型企业。语音识别领域具有较高的行业技术壁垒,在全球范围内,只有少数的企业具有竞争实力。目前,Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品。Nuance曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案,随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案提供商;苹果公司以Siri语音助手为平台关联iOS系统相关应用与服务,倾向于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅5.9%,达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者,中文语音识别技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位一体的智能平台,垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人机交互系统,并通过有效接入第三方应用实现生活娱乐功能的进一步拓展。
图9 语音识别主要产品及典型企业
2、图像视频识别:在安防监控市场具有巨大增长潜力
图像识别(Image Recognition,IR)技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式状态下的目标和对象,包括人脸、手势、指纹等生物特征。视频从工程技术角度可以理解成静态图像的集合,所以视频识别与图像识别的定义和基本原理一致,在识别量和计算量上明显提高。随着人类社会环境感知要求的不断提升和社会安全问题的日益复杂,人脸识别和视频监控作用更加突出,图像视频识别产业未来将迎来爆发式增长,预计到2020年全球图像视频识别产业规模将达到82亿美元,国内图像视频识别产业规模达到15.2亿美元。
核心技术。图像视频识别是通过计算机模拟人类器官和大脑感知辨别外界画面刺激的过程,既要有进入感官的信息,也要有记忆中存储的信息,对存储的信息和接受的信息进行比较加工,完成图像视频的辨识过程。围绕以上特定需求,图像预处理技术、特征提取分类技术、图像匹配算法、相似性对比技术、深度学习技术等构成了图像视频识别的核心技术体系框架,能够对通过计算机输入和照相机及摄像头获取的图片视频进行变换、压缩、增强复原、分割描述等操作,显著提高图像视频识别质量和清晰度,有助于快速准确完成图像视频的响应分析流程。
主要产品。随着工业生产及生活消费领域影像设备的日益普及,每天都会产生海量蕴含丰富价值和信息的图片及视频,单靠人力无法进行分拣处理,需要借助图像视频识别功能进行集中快速获取与解析。目前,智能图片搜索、人脸识别、指纹识别、扫码支付、视觉工业机器人、辅助驾驶等图像视频识别产品正在深刻改变着传统行业,针对种类繁杂、形态多样的图形数据和应用场景,基于系统集成硬件架构和底层算法软件平台定制综合解决方案,面向需求生成图像视频的模型建立与行为识别流程,为用户提供丰富的场景分析功能与环境感知交互体验。
典型企业。近年来,国内外从事图像视频识别的公司显著增加,谷歌、Facebook、微软、旷视科技、图普科技、格灵深瞳等国内外知名企业重点集中在人脸识别、智能安防和智能驾驶等领域进行技术研发与产品设计。国外公司大多进行底层技术研发,同时偏重于整体解决方案的提出,积极建立开源代码生态体系,如谷歌推出Google Lens应用实时识别手机拍摄的物品并提供与之相关的内容,Facebook开源三款智能图片识别软件,鼓励研发者们围绕其图像视频识别技术框架开发各类功能丰富的应用产品;国内企业直接对接细分领域,商业化发展道路较为明确,如旷视科技目前重点研发人脸检测识别技术产品,加强管控卡口综合安检、重点场所管控、小区管控、智慧营区等领域的业务布局,图普科技在阿里云市场提供色情图像和暴恐图像识别的产品和服务,确定准确率超过99.5%,满足了云端用户的安全需求。
表10 图像视频识别主要产品及典型企业
3、文本识别:全面进入云端互联时代
文本识别(Text Recognition,TR)技术是指利用计算机自动识别字符,包括文字信息的采集、信息的分析与处理、信息的分类判别等内容。文本识别可以有效提高如征信、文献检索、证件识别等业务的自动化程度,简化工作流程,提高相关行业效率。随着政府、金融、教育、科技等领域需求的进一步上升,文本识别将在工业自动化流程与个人消费领域取得长足发展,预计到2020年全球文本识别产业规模将达到24亿美元,国内文本识别产业规模达到6.6亿美元。
核心技术。文本识别技术目前正由嵌入式设备本地化处理向云端在线处理全面演进发展,过去由鼠标与键盘输入的文本信息,现在则主要由摄像头、麦克风和触摸屏采集获取。在此基础上,以往的文本识别核心技术,如模版匹配技术、字符分割技术、光学字符识别技术(Optical Character Recognition,OCR)、逻辑句法判断技术等需要与应用程序编程接口(API)技术、智能终端算法技术、云计算技术等结合,衍生出面向云端与移动互联网的新型文本识别系统,通过开放的平台与服务为广大的企业及个人用户提供方便快捷的服务。
主要产品。当今信息社会背景下,文本信息不仅体量巨大,表现形式也日趋复杂,包括印刷体、手写体以及通过外接设备输入到计算机系统的字符图形。同时,随着世界不同语言文明地区交流逐渐增多,对实时语言文本翻译系统的需求更加强烈。目前,基于文本识别技术开发的文件扫描、名片识别、身份证信息提取、文本翻译、在线阅卷、公式识别等产品正在金融、安防、教育、外交等领域得到广泛应用,通过不同的授权级别,为企业级用户部署专业的文档管理、移动办公与信息录入基础设施,同时为个人用户提供个性化的人脉建立、信息咨询和远程教育服务。
典型企业。随着文本识别在各类垂直应用领域的应用逐渐普及,国内外企业也结合自身业务和区域发展特色积极展开布局。谷歌、微软、亚马逊等跨国科技巨头在自身产品服务中内嵌文本识别技术,以增强产品使用体验和用户粘度,如谷歌推出的在线翻译系统可提供80种语言之间的即时翻译,并将自身的语音识别技术与文本识别相结合,提高了翻译效率。国内公司在中文文本识别领域也有多年积累,具备良好的技术优势与产业背景,汉王科技、百度、腾讯等均有较为成熟的产品推出,如汉王正在构建以识别云和设备云为核心的文本识别2.0系统。
表11 文本识别主要产品及典型企业
(四)应用层
应用层主要包括智能机器人、智能金融、智能医疗、智能安防、智能驾驶、智能搜索、智能教育、智能制造系统及智能人居等产业。其中,智能机器人产业规模及增速相对突出;智能金融、智能驾驶、智能教育的用户需求相对明确且市场已步入快速增长阶段;智能安防集中于行业应用和政府采购,市场集中度相对较高;智能搜索、智能人居的产品尚未完善,市场正在逐步培育;智能医疗则涉及审批机制,市场尚未放量。预计到2020年,全球人工智能应用层产业规模将达到672亿美元,其中,智能机器人、智能驾驶、智能教育、智能安防及智能金融的产业规模将超过68%,同时我国人工智能应用层产业规模将突破110亿美元。
图9 2020年全球及我国人工智能应用层各产业规模占比
表12 智能机器人主要产品及典型企业
2、智能金融
金融行业与整个社会存在巨大的交织网络,每时每刻都能够产生金融交易、客户信息、市场分析、风险控制、投资顾问等多种海量数据。促进人工智能技术与金融行业相融合,在前端可以增强用户的便利性和安全性,在中台支持授信、各类金融交易和金融分析中的决策,在后台用于风险防控和监督。这将大幅改变金融行业现有格局,推动银行、保险、理财、借贷、投资等各类金融服务的个性化、定制化和智能化。受智能客服、金融搜索引擎及身份验证入口级产品的广泛普及和应用,智能金融全球产业规模在2020年会接近52亿美元,我国将达到8亿美元。
核心技术。当前,线上交易引发的隐私泄露及金融诈骗频出,同时随着移动终端和金融机构客户端的普及,提取的用户金融数据逐步丰富,金融机构线上服务能力和用户隐私和交易风控就变得至关重要,语音识别、自然语音处理、计算机视觉、生物特征识别和机器学习等技术得到了广泛应用。语音识别与自然语音处理技术可以为前端服务客户实现批量人性化和个性化的服务;计算机视觉与生物特征识别技术则为金融支付验证提供了保障;机器学习技术一方面通过导入海量金融交易数据,从中分析信用卡数据,识别欺诈交易,并提前预测交易变化趋势,另一方面通过构建金融知识图谱将不同来源的结构化和非结构化的数据整合到一起,建立基于大数据的完整征信授信体系。
主要产品。基于电话、网页在线、微信、短信及APP等多模式多频次的金融信息及服务获取渠道,相对较为成熟并已经逐步推广的产品包括智能客服、金融搜索引擎和身份验证,通过构建知识图谱实现理解答复及信息关联体系、提供远程开户和刷脸支付等便捷方式帮助金融机构节省人力成本。同时,随着用户消费及信贷能力的逐步提升,也涌现出一批征信和风险控制的产品,但受限于数据库的规模和数据源的相对难以获取,目前大部分集中在客观呈现款人、企业间、行业间的信息维度关联方面。此外,金融类或资产管理类公司为持续提供用户理财和升值的资产组合推出了智能投顾产品,可根据历史经验和新的市场信息来预测金融资产的价格波动趋势,以此创建符合风险收益的投资组合。
典型企业。智能客服、身份验证和金融搜索引擎领域创新企业较多,着重于引流扩量。智齿科技、网易七鱼及美国DigitalGenius均着重通过用户体验提升客户量,旷世科技、商汤科技及依图围绕着人脸识别的核心技术进入金融领域,融360、好贷网、资信客聚焦垂直领域打造金融服务的入口。征信及风控领域企业以大数据为壁垒,逐步出现行业龙头。启信宝和美国ZestFinance不断扩容数据基础,形成“平台黑洞”优势,启信宝通过提取100多家官方网站数据产品侧重呈现客观数据整合,ZestFinance则使用谷歌的大数据模型建立信用评分体系。智能投顾多为金融机构专业人才或者投资顾问公司转型而来,美国Wealthfront、弥财、财鲸等主要通过
投资ETF组合以达到资产配置,理财魔方、钱景私人理财则专注基金产品的覆盖,雪球和金贝塔等以对量化策略、投资名人的股票组合的跟投为内容展开资讯传递和信息交流。
表13 智能金融主要产品及典型企业
3、智能医疗
促使智能机器和设备代替医生完成部分工作,更多地触达用户,只是智能医疗功用的部分体现。运用人工智能技术对医疗案例和经验数据进行深度学习和决策判断,显著提高医疗机构和人员的工作效率并大幅降低医疗成本,才是智能医疗的核心目标。同时,通过人工智能的引导和约束,促使患者自觉自查、加强预防,更早发现和更好管理潜在疾病,也是智能医疗在未来的重要发展方向。
核心技术。医疗水平的提升和医疗设备的完善使得患者就诊过程会产生与日俱增的就诊数据,爆炸式信息增长让医生无法无差错的完成诊断和治疗,同时随着人们健康意识的加强,预防性和精准性治疗同时受到关注。图像识别、语音语义识别、深度学习技术在医疗领域得到广泛应用。图像识别、语音语义识别技术可充分获取患者的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息以对症下药,深度学习技术可通过计算机模拟预测药物活性、安全性和副作用,降低药物研发周期,并辅助医生工作实现更精准诊断和治疗。
主要产品。期待健康长寿的意愿随着人们生活质量的提高持续增强,适用于生活化的身体管理的智能健康管理产品率先成为热点,以数据形式引导个人生活习惯以达到基于精准医学的健康管理。同时,医生为能进行更精准并且效率更高的诊断和治疗,往往会围绕着医疗领域过往沉淀的大量病理案例,不断从预防的角度规避疾病或提前预测药物的可行性,智能影像、智能诊疗等智能医疗产品快速兴起,逐渐取代经验诊断,通过大量的影像数据和诊断数据模拟医疗专家的思维、诊断推理和治疗过程,从而给出更可靠的诊断和治疗方案。
典型企业。智能健康管理多面向消费端客户,创新企业大量涌现,大部分集中在美国。如Next IT、Sense.ly和AiCure均是从日常健康管理切入移动医疗,Welltok则通过可穿戴设进行健康干预。智能诊疗领域取得显著进展,IBM Watson以肿瘤为重心,在慢病管理、精准医疗、体外检测等九大医疗领域中实现突破,美国MedWhat、英国Babylon Health和中国拍医拍、康夫子正在聚焦智能诊疗的单个应用进入该领域。智能影像领域以创新企业为主,围绕影像数据源竞争激烈。美国Butterfly Network和中国推想科技着重打造影像设备,美国Enlitic则重点关注癌症监测,中国Deepcare围绕SaaS模式为行业提供“算法+有效数据”服务。
表14 智能医疗主要产品及典型企业
表15 智能安防主要产品及典型企业
表16 智能驾驶主要产品及典型企业
表17 智能搜索主要产品及典型企业
7、智能教育
智能教育侧重启发与引导,关注学生个性化的教育和交互,学生能够获得实时反馈和自动化辅导,家长可以通过更为便捷和成本更低的方式看到孩子实时学习情况,老师能收获更丰富的教学资源、学生个性化学习数据来实现因材施教,学校也能提供高质量的教育,政府则将更容易为所有人提供可负担、更均衡的教育。自动化辅导优先通过搜题的应用取得爆发式增长,预计2020年全球智能教育产业规模可达108亿美元,我国将接近10亿美元。
核心技术。智能教育建立在与学生充分的交互和数据获取的基础上,并在海量的教育数据中,匹配用户的学习需求,最终能够完成辅助教育和评估反馈,语音语义识别、图像识别、知识图谱和深度学习技术应用较多。语音语义识别、图像识别实现了规模化的自动批改和个性化反馈;知识图谱和深度学习技术搜集学生学习数据并完成自动化辅导和答疑,预测学生未来表现,智能化推荐最适合学生的内容,最终高效、显著地提升学习效果。
主要产品。对教师人力资源的过度依赖是教育行业问题根本所在,能够辅助教育过程、提升教师效率,同时激发学生自主学习兴趣的产品,率先得到市场的认可,目前相对成熟的产品有自动化辅导、智能测评和个性化学习。自动化辅导可在两秒内反馈出答案和解题思路,手写的题目的识别正确率也已达到70%以上,大幅提升学生的学习效率。智能测评不仅可以对用户跟读进行语音测评和指导,同时还能通过手写文字识别、机器翻译、作文自动评阅技术实现规模化阅卷的作业测评。个性化学习基于学习行为的数据分析,推荐适合学生水平的学习内容。
典型企业。从事自动化辅导和个性化学习的企业均聚焦单一产品功能和教育区间,目前主要通过融资方式持续补贴用户提升获客能力。美国的Volley 和中国的猿题库、作业帮、学霸君和阿凡题聚焦K12教育的题库辅导和答疑,均推出拍照搜题完成题库答疑或老师答疑,中国郎播网、英语流利说和多邻国等侧重语言辅导,美国Newsela、LightSail等建立阅读数据库个性化提供阅读材料。智能测评企业主要集中在英语科目,如中国科大讯飞以智能语音技术为核心推出智能阅卷系统,批改网和美国LightSide通过数据库匹配完成文本测评。
表18 智能教育主要产品及典型企业
表19 智能人居主要产品及典型企业
Copyright © 2015 ilinki.net Inc. All rights reserved. 智汇工业版权所有
电话:010-62314658 邮箱:service@ilinki.net
主办单位:智汇万联(北京)信息技术有限公司