首页 > 综合 > 金融资讯 > 正文

人工智能发展的热点透视 机器人与有机生命越来越接近

文章来源: 作者:
字体:
发布时间:2020-01-03 10:18:13

人工智能发展热点

近日,清华大学-中国工程院知识智能联合研究中心和中国人工智能学会吴文俊人工智能科学技术奖评选基地联合发布《2019人工智能发展报告》,评选出人工智能的13个关键领域,包括深度学习、计算机视觉、语音识别、机器人等前沿热点技术的基础、应用研究和发展趋势。

深度学习在诸如图像和语音等感知问题上取得突破

机器学习是一门多学科交叉的学科,专门研究计算机如何模拟或实施人类学习行为来获取新知识或技能。

1950年,艾伦·图灵创建了图灵测试来确定计算机是否智能。图灵测试认为,如果一台机器能与人类交谈而不能识别其身份,它就是智能的。这种简化使图灵能够令人信服地证明“思维机器”是可能的。

后来,由国际商用机器公司科学家阿瑟·塞缪尔开发的跳棋程序驳斥了普罗维登斯关于机器不能超越人类的断言。他像人类一样写代码和学习模式。他创造了“机器学习”这个术语。

然而,从20世纪60年代中期到70年代末,机器学习的发展几乎停止了。无论是理论研究还是计算机硬件限制,整个人工智能领域的发展都遇到了很大的瓶颈,神经网络学习机由于理论缺陷和未能达到预期效果而陷入低谷。直到Webbos在神经网络反向传播算法中提出多层感知器模型,机器学习才得以复兴,直到现在,反向传播算法仍然是神经网络体系结构的关键因素。

神经网络研究者先后提出了用BP算法训练的多参数线性规划的概念,这已成为以后深入学习的基石。在另一个谱系中,昆兰提出了一个非常著名的机器学习算法,特别是ID3算法,它仍然活跃在机器学习领域。

机器学习的爆发发生在2006年,当时神经网络研究领域的领导者韩丁提出了神经网络的深度学习算法(Deep Learning algorithm),大大提高了神经网络的能力。韩丁和他的学生萨拉赫库季诺夫(Salakhutdinov)发表了一篇关于《科学》的文章,这在学术界和工业界掀起了一股深入学习的浪潮。

2015年,为纪念人工智能概念60周年,乐村、本吉奥和韩丁发起了一项深入学习的联合回顾。深度学习使具有多个处理层的计算模型能够学习具有多个抽象层次的数据表示。这些方法在许多方面带来了显著的改进。深度学习的出现在图像和声音等感知问题上取得了真正的突破,它离实际应用如此之近,以至于人工智能被推向了一个新的时代。

计算机视觉已经产生了人脸识别和智能视频监控等应用

计算机视觉,顾名思义,是一门分析和研究计算机如何在智力上实现与人眼相似的“视觉”的研究科学。也就是说,对客观存在的三维世界的理解和认识依赖于智能计算机。

计算机视觉技术使用照相机和计算机来代替人眼,使计算机具有人眼所具有的分割、分类、识别、跟踪、辨别、决策等功能。

大卫·马尔(David Marr) 《视觉》的出版标志着计算机视觉已经成为一门独立的学科。在计算机视觉40多年的发展中,虽然人们提出了很多理论和方法,但总体上,计算机视觉经历了三个主要的过程:马尔科姆计算视觉、多视图几何和分层三维重建以及基于学习的视觉。

目前,在计算机上提高“深度网络”来提高物体识别的准确性似乎相当于从事“视觉研究”。Mal的计算愿景分为三个层次:计算理论、表达式和算法以及算法实现。由于马尔认为算法的实现不影响算法的功能和效果,马尔的计算视觉理论主要讨论“计算理论”和“表达式与算法”。

Mal认为大脑的神经计算和计算机的数值计算没有本质区别,所以Mal不这么认为

20世纪90年代初,计算机视觉从“萧条”转向“繁荣”,主要是由于以下两个因素:一方面,目标应用领域从要求过高精度和鲁棒性的“工业应用”转向要求过少的应用领域,特别是那些只要求“视觉效果”的应用领域,如远程视频会议、考古学、虚拟现实、视频监控等。另一方面,基于多视图几何理论的分层三维重建可以有效提高三维重建的鲁棒性和准确性。

多视图几何中最具代表性的人物是法国INRIA的奥·福杰拉斯、美国通用电气研究所的R·哈特利和英国牛津大学的阿·齐塞尔曼。哈特利和齐塞尔曼在2000年合著的这本书对这一方面进行了系统的总结。大数据需要全自动重建,而全自动重建需要重复优化,重复优化需要大量计算资源。举个简单的例子,如果要对北京中关村地区进行三维重建,为了保证重建的完整性,需要采集大量的地面和无人机图像。如果采集到10,000幅地面高分辨率图像(4,000 x 3,000)和5,000幅高分辨率无人机图像(8,000 x 7,000),三维重建应匹配这些图像,从中选择合适的图像集,然后校准摄像机位置信息并重建场景的三维结构。有了如此大量的数据,人工干预是不可能的,所以整个三维重建过程必须完全自动化。

基于学习的视觉(Learning-based vision)是指以机器学习为主要技术手段的计算机视觉研究。基于对学习的视觉研究,文献一般分为两个阶段:21世纪初以流形学习为代表的子空间方法和当前以深度学习为代表的视觉方法。

近年来,海量数据的不断出现和计算能力的快速提高给以非结构化视觉数据为研究对象的计算机视觉带来了巨大的发展机遇和挑战性问题。计算机视觉因此成为学术界和工业界公认的前瞻性研究领域。一些研究成果已经在实践中得到应用,产生了大量显示效果很好的商业应用,如人脸识别和智能视频监控。

语音识别应用于工业、通信和医疗等行业。

语音识别是一门允许机器识别和理解说话者语音信号内容的新学科。其目的是将语音信号转换成文本字符或命令。利用计算机来理解说话人的语义内容,使他理解人的言语,从而判断说话人的意图,是一种非常自然有效的人机交流方法。

语音识别的研究工作可以追溯到20世纪50年代。1952年,美国电话电报研究所(AT T Bell Research Institute)成功研究出世界上第一个能够识别10种英语数字发音的语音识别系统Audry系统。这个系统识别一个人所说的孤立数字,并且在很大程度上依赖于每个数字中元音共振峰的测量。

计算机的应用促进了语音识别技术的发展。电子计算机用于语音识别。动态规划线性预测分析技术提出了一系列语音识别技术的新理论,解决了语音信号生成模型的问题。20世纪70年代,语音识别研究取得了重大里程碑式的成果。随着自然语言理解的研究和微电子技术的发展,语音识别领域取得了突破性进展。这一时期的语音识别方法基本上采用了传统的模式识别策略。

后来,语音识别研究走得更远。这一时期的主要成就包括:隐马尔可夫模型(隐马尔可夫模型)技术的成熟和不断改进,最终成为语音识别的主流方法;基于知识的语音识别越来越受到重视。在连续语音识别的过程中,除了识别声学信息之外,更多的各种语言的知识,如构词法、句法、语义、对话背景等方面被用来帮助进一步的语音识别和理解。同时,在语音识别研究领域,一种语言

语音识别技术已经逐渐变得实用。在建立模型、提取和优化特征参数、提高系统适应性方面取得了突破性进展。许多发达国家和著名公司投入大量资金开发和研究实用的语音识别产品,由此产生了许多具有代表性的产品。例如,由IBM开发的中文语音系统(ViaVoice)和由Dragon开发的DragonGorder系统具有说话人自适应能力,能够在用户使用过程中不断提高识别率。

21世纪后,深度学习技术极大地推动了语音识别技术的进步,大大提高了其识别精度,并广泛发展了其应用。2009年,韩丁将深度神经网络(DNN)应用于语音声学建模,并在TIMIT上获得了当时最好的结果。2011年底,微软研究院的俞东和李征将DNN技术应用于大词汇量连续语音识别任务,大大降低了语音识别的错误率。从那时起,语音识别进入了DNN-隐马尔可夫模型时代。DNN带来的优势是不再需要假设语音数据的分布,相邻语音帧的拼接也包括语音的时序结构信息,从而显著提高了状态的分类概率。同时DNN还具有很强的环境学习能力,可以提高对噪音和口音的鲁棒性。

目前,语音识别技术已经逐渐应用于工业、通信、商业、家用电器、医疗、汽车电子和家庭服务等各个领域。例如,当今流行的手机语音助手是将语音识别技术应用于智能手机,可以实现人与手机之间的智能对话,包括Siri语音助手、intelligent 360语音助手、百度语音助手等。苹果公司的“机器人越来越接近有机生命”机器人广泛包括所有模拟人类行为或思想的机器以及其他生物(如机器狗、机器猫等)。)。目前,智能机器人已成为世界研究热点之一,并成为衡量一个国家工业化水平的重要标志。

机器人技术首次应用于工业领域。然而,随着机器人技术的发展和各行业需求的提高,在计算机技术、网络技术和微机电系统技术等新技术发展的推动下,近年来机器人技术正迅速从传统的工业制造领域扩展到医疗服务、教育娱乐、勘探测量、生物工程、救灾救援等领域。深入研究和开发了适应不同领域需求的机器人系统。在过去的几十年里,机器人技术的研究和应用极大地推动了人类的工业化和现代化进程,逐步形成了机器人产业链,使得机器人的应用范围越来越广泛。

当机器人出现在工业生产中时,机器人技术的研究正在深化。1961年,麻省理工学院林肯实验室(Lincoln Laboratory of Massachusetts Institute of Technology)将装有触摸传感器的遥控机械手的被驱动部分连接到计算机上,这样形成的机器人就可以通过触摸来确定物体的状态。后来,以电视摄像机为输入的计算机图像处理和物体识别的研究工作也相继取得成果。1968年,美国斯坦福人工智能实验室的麦卡锡(J.McCarthy)等人研究了一个新课题,开发了一个手、眼、耳的计算机系统。因此,智能机器人的研究形象逐渐变得丰满。

自20世纪70年代以来,机器人行业蓬勃发展,机器人技术已经发展成为一门专业。工业机器人首次大规模应用于汽车制造业的装配线生产。后来,日本、德国和美国等制造业发达国家开始在其他工业生产中使用机器人。

后来,机器人朝着越来越智能的方向发展。机器人具有多种传感器,能够融合多种传感器获得的信息,能够有效适应不断变化的环境,具有很强的适应能力、学习能力和自主功能。

智能机器人的发展主要经历了三个阶段,即可编程试教和复制机器人、具有感知能力的机器人和

世界上许多机器人技术公司都在大力发展机器人技术。机器人的特征越来越接近有机生命。最近,波士顿电力公司在机器人领域的成就已经成为人们关注的焦点。它的产品Spot和阿特拉斯令人惊叹。Spot的功能非常先进。在极端情况下,它可以去你告诉它去的目的地,避开障碍,保持平衡。Spot还可以携带多达四个硬件模块,为公司提供其他机器人完成特定任务所需的任何技能。阿特拉斯掌握了许多技能,如倒立、360度转身和旋转。在表演了跑酷和后空翻等特技后,阿特拉斯掌握了体操的一项新技能,这再次开阔了人们的眼界。

(记者杨舒采访整理)[主编:田伯群]