科大讯飞携手达实智能，多模语音增强技术助力深圳12号线升级智慧交通体验

2023-01-04 14:35:32 来源 : 财讯界

11月28日，深圳地铁12号线正式开通！此次项目中，科大讯飞携手达实智能与深圳地铁深度合作，打造了一系列智慧化的应用场景。

1、多模语音增强技术率先用于深圳地铁语音购票

该项目智慧客服中心采用AI数字客服为乘客提供语音交互服务，可让乘客通过语音交互自助完成信息查询、车票购买。在过去因为地铁站点太多，乘客在售票机买票时很难快速找到要去的站点，而这对于不太会操作设备的老年人来说更是难上加难，一堆站点看花了眼。这些问题在加上语音购票的功能后迎刃而解，乘客只要说出想去哪里即可买票，大幅提升了乘客的购票体验。

深圳12号线智慧客服终端

在地铁站人声嘈杂的场景下，使用语音进行购票理论上交互体验并不好。以往常规方案受周边杂声影响较大，语音识别准确率相对较低，经常出现“答非所问”的情况。而在深圳地铁12号线智能售票机及智慧客服终端上，率先采用了科大讯飞最新发布的多模语音增强技术，该技术通过人脸唇形等多模信息的使用，能有效的抑制地铁环境噪音和后排说话人声，让嘈杂环境下机器的语音识别准确率大大提高，避免了语音交互时被旁边人说话带“跑偏”的尴尬，有效提升了嘈杂环境下的语音交互体验。在科大讯飞多模态语音识别技术的加持下，12号线地铁购票的体验提升显著，受到了很多乘客的好评。

科大讯飞多模态语音识别技术

2、从单模态到多模态，科大讯飞持续向新

人类通过眼、耳、鼻、舌等多个器官同时感知世界，而机器若想更自然地与人类交流，当然也需要通过多模态感知。多模语音增强技术，作为科大讯飞新推出的解决公共场景下语音交互难题的最新技术，打破以往纯声学降噪的方式，将机器视觉也融合到环境降噪技术中，使其能够在多人同时说话的嘈杂场景中，将其他人声和环境噪声进行过滤，准确地把目标说话人的声音分离出来进行识别。通过这种单模到多模的技术创新，使得在同方向有人说话干扰的场景下，多模语音增强技术的识别准确率对比传统语音识别技术相对提升70%以上。它不仅让设备能听见，还能看见你说话，就像武侠小说中的“读唇术”一样，知道你在说什么。

3、讯飞AIUI开放平台，致力AI技术落地更多场景

事实上，地铁智能售票机及智慧客服终端仅是科大讯飞AIUI开放平台支持合作伙伴打造的项目之一，平台开放的多模语音增强技术在医疗自助机、银行柜员机、取款机以及商用服务机器人等项目上也有相似的应用场景。在人声嘈杂的公共场所，通过多模态语音技术均可有效降低环境噪音的干扰，提高语音识别准确率，保障用户的对话交互体验。

截止目前，讯飞开放平台已开放545项AI产品及能力，聚集超过380.5万开发者团队，总应用数超过159.5万，累计覆盖终端设备数超过37.0亿，AI大学堂学员总量达到71.7万，链接超过500万生态伙伴，以科大讯飞为中心的人工智能产业生态持续构建。未来AIUI作为讯飞人机交互的开放平台，将通过更多AI技术赋能合作伙伴，在更多的场景落地多模态语音增强技术，为客户创造价值，也为用户带来更多新的体验。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。