当前位置 > 科技 > /文章内容

和车载语音探人机交互新方向

99.9%的人都看了

苹果全新Macbook产品27日发布?
苹果全新Macbook产品27日发布?

10月19日消息,苹果Macbook产品已经很长时间没有迎来重大的改变,现在的Macbook Pro笔记本外观一...

和车载语音探人机交互新方向

2018人工智能元年,想必AI不再是一个抽象的概念。当AI逐个落地到各个垂直领域,如家居、汽车、交通、教育等,一系列被大众所熟知的产品应运而生。例如,智能语音助手、智能音响、智能车载系统等。国内外也相继开放了“AI能力”平台,让更多开发者、硬件商共欢“新时代”盛会。与此同时,人工智能也“轰轰烈烈,风风火火”地进入我们的日常生活。

言归正传,下面我们来讨论汽车领域的“人工智能”

“解放双手”不再是一个传说!

10月19日,由上海希为主办的2018中国汽车联网国际峰会在上海圆满落幕。傲硕科技(Aoshuo Tech)总经理郑天堂先生和副总经理黄绍忠先生均参加会议,并就人机交互的未来和挑战做了分享。

黄绍忠先生从多年车载实战经验上分享了“语音如何有效帮助和提高车内交互体验”的演讲。比起近几年各科技公司“炫技”风,这个主题更像是一个深耕垂直领域、踏实务实企业的思索。

语音发展进程及傲硕的从“0”到“1”

从上世纪20年代的Rex,到1970年影响语音快速发展的隐马尔可夫模型(HMM)的诞生,再到80年代HMM模型正式引入语音识别技术。走了将近一世纪,2000年BMW推出了第一款配有语音识别功能的汽车。但这款汽车仅能就50个单词进行识别,无法满足车主日常交互需求。随着2010年深度神经网络(DNN)的引入,深度学习技术让语音识别在车内有了质的飞越。傲硕科技2012年成立,在2015年第一季度向市场推出了第一款纯本地的可以较自由表达的车载语音方案。傲硕科技的从“0”到“1”,弥补了国内市场的空缺,也因此拿下了国内No.1车厂的订单。

影响车内交互体验的因素

1、语音引擎

如今的语音识别率已达到97%、98%,但大部分车主仍表示“机器听不懂话”、“机器这么笨”等言论。这就要提起汽车行驶场景,来自车辆自身的胎噪、车噪,行驶环境的风噪及车内人员对话的噪声等。这些因素都直接影响了语音识别的准确性。为了让语音识别到“干净”的声音,前端声学处理技术尤为重要。“SSE”模块就是用于解决干扰声源的技术,通过麦克风阵列、声源定位、波束形成、回声消除、降噪等技术来提升语音识别的准确率。

同时,还有NLP、TTS等核心引擎上面临的困难,黄绍忠先生也提出了深刻的见解,在此小编就不一一赘述了。总之,一个稳定灵活的语音架构,可以相对好地处理本地和云端的关系,让语音能够产品化、用户能够得到一个良好的体验,是我们需要思考和解决的问题。

2、传统车厂和“互联网思维”的冲突和矛盾

众说周知,汽车是一个极度复杂而系统的产品。然而,随着汽车技术研发的革新以及用户对汽车的更高需求不断对车厂提出更高要求,为满足用户和通讯智能时代发展的需要,传统车厂近年来也在不断压缩造车周期,为汽车赋能AI能力,造车思维也都在矛盾中左顾右盼,寻找思路。然而,互联网的开发逻辑是以产品定义为主导,“我希望以产品开发为主导,以用户为主导”...但是在传统汽车组织架构里,怎么让产品的设计能够整体在现有框架下执行,这是有冲突的!在车厂传统架构里,时间控制和项目质量的保证,要远大于所谓的产品“亮点”。