• 央视专访 | 上海交大的成果转化样本

    返回 学院新闻


    4月1日,CCTV二台《经济半小时》对俞凯教授做了一个专访

    视频地址:http://tv.cctv.com/2017/04/01/VIDEWLcocFas4KzwmhBlHjAn170401.shtml

     

    回想一下,在闲暇时听着音乐,你突然想起最近的一首新歌,若是想要听那首歌,还得去网上搜索和下载,过程虽不繁琐,却也耗费不少时间。然而,由上海交大电院俞凯教授担任首席科学家的思必驰创业公司,却让这个过程真正变成了“一句话的事”。语音的“交互”与“识别”,将怎样颠覆我们的生活?

     

     

    思必驰

    语音创造价值

     

     

    2007年,思必驰在英国剑桥正式创办,2008年在国内设立公司,是国内少数拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术(语音识别、语音合成、自然语言理解、声纹识别、性别及年龄识别、情绪识别等)的公司之一,已有的专利等各类知识产权近40项,分别被中国政府和英国政府评为高新技术企业。公司致力于为智能车载、智能家居、智能机器人三大垂直领域打造人性化的自然语言交互方案,目前已与阿里、腾讯、小米等多家企业建立了深度合作关系。

     

    公司首席科学家、联合创始人俞凯博士拥有剑桥大学语音识别和对话系统的专业背景,在上海交通大学创建了智能语音实验室。他曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者。

     

     

    近年来,思必驰获得阿里巴巴领投的2亿元人民币投资,以及联想之星、启迪创投等机构的数千万人民币天使轮融资。

     

    语音

    通往人工智能之路

     

    为什么选择从事语音“交互”与“识别”领域研究?俞凯教授认为,当下的三个科技热词:人工智能、大数据、云计算。它们共同涉及到了一个方面:人机交互。在互联网时代,人们用鼠标和键盘输入信息,实现交互;在移动互联网时代,人们则开始使用触摸屏,摄像头和语音;再到当下智能物联网时代,面对手表,车载系统等不适合使用触摸的设备,如何进行复杂的信息交互?显然,语音是信息输入的最好方式。基础设备的升级将引发技术革命,随着互联网从一个低级阶段向一个高级阶段发展,语音本身渐渐成为了人和智能进行信息交互的核心手段。因此,语音逐渐成为了一个入口,而任何的入口都具有巨大的研究价值。

     

     

    俞凯教授告诉记者,语音不单单连接了人和机器,还连接了人的智能和机器的智能。最难的思维是人的思维,围棋大师AlphaGo之所以能首先战胜人类,是因为它本身有个确定的输入和输出,更多地偏向一个数学问题。而人在进行信息交互的过程中,所听所见所感都带有不确定性。因此,它对机器的难度更上了一层,在语音这个领域,实验室所研究的不仅仅是声音,还包括语言。

     

    梦想

    为交大建立一个全国最好的语音实验室

     

    “疏影横斜水清浅 暗香浮动月黄昏”随着俞教授的一句古诗,相应的文字迅速而准确地出现在了由他们开发设计的APP上。俞教授自信的告诉记者,除去一些相对偏门的领域,他们的语音识别已经能够在特定场合运用于记者采访。除去简单的语音识别,在更加重要的语义理解上,他们同样有着非常卓越的软件来实现。

     

     

    更令人惊奇的是,目前的语音输入大部分还局限在一次性完全正确的输入,如果需要更改一个号码中的某个数字,只能全部重新输入。而在思必驰产品的demo中,使用者在输入一个号码后,重复并更改了中间四位数字,而思必驰的软件非常迅速地更改了号码中间四位数字。在这样一个看似简单的过程中,涉及到了非常复杂的语义理解,也即如何根据使用者所说的部分数字定位需要更改的数字的位置?这于人来说是一个简单的过程,而对于语音的交互环节确是一个重大的突破。

     

    人工智能是一个产业与学术高度融合的领域,有着剑桥大学十年研究经历的俞凯教授告诉记者,他梦想为交大建立一个全国最好国际领先的语音研究实验室。

     

    俞凯教授领衔的智能语音实验室,创立于2012年3月,有四十位多学生。实验室的研究领域涵盖了语音识别,合成,语义理解和对话交互(涉及到机器决策)等,在各大权威刊物上发表的文章数居全国前列。此外,实验室在国际上的各大赛事中均取得良好的成绩,在2014年Dialogue State Tracking Challenge 中,俞凯教授所带领的团队在不同的任务项目中分别获得了一个第一,一个第二和一个第三。在语音识别和交互相关领域,实验室的研究成果在世界的标准上看,很多研究成果都是世界最为顶尖的。无论是语言识别的错误率,还是识别速度,都是世界上最好的之一,考虑到即使人本身也会存在听错的现象,实验室语音识别方面的错误率甚至可以用“做爆了”(到顶了)来形容。

     

    谈起自己实验室里的同学,俞教授同样满是自豪,除了在国际刊物上发表文章数这类直观的证明外,他还提到了自己的学生去海外实习时的出色表现。俞凯教授认为,重要的不是能发表多少文章,做出多少成果,而是在面对实际问题时,解决问题并不断改善的能力。

     

    高校

    如何从创新到创业

     

    被问及高校学生如何将校内的研究成果应用于创新创业领域,俞凯教授认为,当下教授创业一般有三种模式:技术创新,模式创新和平台创新,是对已有产品的拓展和普及。对于技术驱动的平台型公司而言,雄厚的研究能力和一定规模的团队是实现公司不断发展的基础。对于绝大多数没有足够研究实力的学生团队而言,教授们所能采用的创业模式并不适合。学生团队创业可以应用创新为主,借助已有的平台,注重解决人们生活中的问题。

     

    在当前市场中,由于门槛较高,技术含量大,对于人工智能的研发和推广仍是高科技创业公司的主流,在这样的前提下,和高校的实验室共享研究成果的知识产权毫无疑问是提高企业核心竞争力的关键,也是实现学术产业化和产业学术化的重要渠道。

     

    记者手记

      对大学教授创业模式的思考

     

     

    近年,国家一直提倡的“大众创新,万众创业”,在政策上的直接体现之一,就是高校知识产权的处置权下放。以前,高校教授和学生的研究成果,理论上完全属于国家,也即高校并无相应成果的知识产权的处置权。而随着新政策的实施,高校能够处置其知识产权,基于国家政策,思必驰-上海交大智能人机交互联合实验室应运而生,合理且合法地将高校的知识产权运用到产业当中。

     

    联合实验室的建立,不仅代表了当下已有知识产权的共享,还包括未来研究成果的互通有无。这样一个全新的知识产权处置体系,是在新政策发行之后,交大最初成功的三个案例之一,是学校在创新创业路上走出的,最基础也是最核心的一步。

     

    业界只有两家公司成功实现产学研一体化:科大讯飞和思必驰。记者相信,在创新创业的浪潮推动下,携手交大研究力量的思必驰必能在攀登科技树的道路上飞奔驰骋。正如俞凯教授所说:“研究不是为了将研究成果束之高阁,而是为了改变世界。”

     


    撰稿 排版 | 楼建坤