【经典案例】央视专访!交大教授用“一句话”颠覆未来

-回复 -浏览
楼主 2020-06-11 07:27:01
举报 只看此人 收藏本贴 楼主

近日,上海交通大学俞凯教授登上央视CCTV二台《经济半小时》节目,就“智能语音走向人工智能之路”主题接受了专访。

谈及智能语音,大家比较熟悉的是某款手机的Siri功能。着siri中文版以及其他语音的普及,智能语音已然走向国内人们日常生活,人们对于智能语音可以改变生活方式充满了期待。但智能语音发展的进程却不是所有人都所为知的,智能语音从纯粹的语音识别发展至今已经走向了识别、合成、语义理解、智能反馈等等。

你是否还经常经历这样的场景:在闲暇时听着音乐,你突然想起最近的一首新歌,若是想要听那首歌,还得去网上搜索和下载,过程虽不繁琐,却也耗费不少时间。然而,由上海交大电院俞凯教授担任首席科学家的思必驰创业公司,却让这个过程真正变成了一句话的事”。语音的“交互”与“识别”,将怎样颠覆我们的生活?


思必驰

语音创造价值

2007年,思必驰在英国剑桥正式创办,2008年在国内设立公司,是国内少数拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术(语音识别、语音合成、自然语言理解、声纹识别、性别及年龄识别、情绪识别等)的公司之一,已有的专利等各类知识产权近40项,。

公司首席科学家、联合创始人俞凯教授拥有剑桥大学语音识别和对话系统的专业背景,在上海交通大学创建了智能语音实验室。他曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者。


语音

通往人工智能之路

为什么选择从事语音“交互”与“识别”领域研究?俞凯教授认为,当下的三个科技热词:人工智能、大数据、云计算。它们共同涉及到了一个方面:人机交互。在互联网时代,人们用鼠标和键盘输入信息,实现交互;在移动互联网时代,人们则开始使用触摸屏,摄像头和语音;再到当下智能物联网时代,面对手表,车载系统等不适合使用触摸的设备,如何进行复杂的信息交互?显然,语音是信息输入的最好方式。基础设备的升级将引发技术革命,随着互联网从一个低级阶段向一个高级阶段发展,语音本身渐渐成为了人和智能进行信息交互的核心手段。因此,语音逐渐成为了一个入口,而任何的入口都具有巨大的研究价值。


俞凯教授说,语音不单单连接了人和机器,还连接了人的智慧和机器的智能。最难的思维是人的思维,围棋大师AlphaGo之所以能首先战胜人类,是因为它本身有确定的输入和输出,更多地偏向一个数学问题。而人类在进行信息交互的过程中,所听所见所感都带有不确定性。因此,机器研究的难度更上了一层,在语音这个领域,实验室所研究的不仅仅是声音,还包括语言。

梦想

在交大建立一个全国最好的语音实验室

“疏影横斜水清浅,暗香浮动月黄昏。”随着俞教授念出一句古诗,相应的文字迅速而准确地出现在了由他们开发设计的APP上。俞教授自信的告诉记者,除去一些相对偏门的领域,他们的语音识别已经能够在特定场合运用于记者采访。除去简单的语音识别,在更加重要的语义理解上,他们同样有着非常卓越的软件来实现。

更令人惊奇的是,目前的语音输入大部分还局限在一次性完全正确的输入,如果需要更改一个号码中的某个数字,只能全部重新输入。而在思必驰产品的demo中,使用者在输入一个号码后,重复并更改了中间四位数字,思必驰软件则非常迅速地相应更改了号码中间四位数字。在这样一个看似简单的过程中,涉及到了非常复杂的语义理解,也即如何根据使用者所说的部分数字定位需要更改的数字的位置。这于人来说是一个简单的过程,而对于语音的交互环节却是一个重大的突破。



人工智能是一个产业与学术高度融合的领域,有着剑桥大学十年研究经历的俞凯教授告诉记者,他梦想在交大建立一个全国最好国际领先的语音研究实验室。

俞凯教授领衔的智能语音实验室,创立于2012年3月,有四十位多学生。实验室的研究领域涵盖了语音识别、合成、语义理解和对话交互(涉及到机器决策)等,在各大权威刊物上发表的文章数居全国前列。此外,实验室在国际上的各大赛事中均取得良好的成绩,在2014年Dialogue State Tracking Challenge 中,俞凯教授所带领的团队在不同的任务项目中分别获得了一个第一,一个第二和一个第三。在语音识别和交互相关领域,实验室的许多研究成果从世界标准来看也是最为顶尖的。无论是语言识别的错误率还是识别速度,都是世界上最好的之一。考虑到即使人本身也会存在听错的现象,实验室语音识别方面的错误率甚至可以用“做爆了”(到顶了)来形容。

谈起自己实验室里的学生,俞教授同样满是自豪,除了在国际刊物上发表文章数这类直观的证明外,他还提到了自己的学生去海外实习时的出色表现。俞凯教授认为,重要的不是能发表多少文章,做出多少成果,而是在面对实际时,解决问题并不断改善的能力。

高校

如何从创新到创业

被问及高校学生如何将校内的研究成果应用于创新创业领域,俞凯教授认为,当下教授创业一般有三种模式:技术创新,模式创新和平台创新,是对已有产品的拓展和普及。对于技术驱动的平台型公司而言,雄厚的研究能力和一定规模的团队是实现公司不断发展的基础。对于绝大多数没有足够研究实力的学生团队而言,教授们所能采用的创业模式并不适合。学生团队创业可以应用创新为主,借助已有的平台,注重解决人们生活中的问题。

在当前市场中,由于门槛较高,技术含量大,对于人工智能的研发和推广仍是高科技创业公司的主流,在这样的前提下,和高校的实验室共享研究成果的知识产权毫无疑问是提高企业核心竞争力的关键,也是实现学术产业化和产业学术化的重要渠道。

(来源:上海交大微信公众号)

声 明

本微信转载目的在于传递信息、加强交流,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请立即联系我们,我们将在第一时间删除相关文章。


我要推荐
转发到