搜索

用 AI 解决噪音环境下的语音识别难题,Yobe 获得 180 万种子轮融资

詹妮妮 · 2018-05-09
世界再喧嚣,也能找到你的声音

近日,美国语音技术公司 Yobe 宣布,获得了来自 Clique Capital Partners 的 180 万美元种子轮融资。此前,Yobe 曾于 2016 年获得美国国家科学基金会 SBIR 项目的 79 万美元资金支持。

Yobe 想解决的,是语音领域目前的一个困境,语音助手可以识别出用户在讲什么,准确度也不错,但假设有人和用户同时说话,其识别率就会大大降低,这被称为 “鸡尾酒会问题”。就像在一场宴会上,背景过于嘈杂,语音识别就难以正常工作。

为此,Yobe 建立了一个声音驱动系统,可以在嘈杂环境中,利用 AI 识别用户的生物特征,进而判断并分离特定的声音,自动提高这一特定声音的音量,帮助语音识别引擎更好地工作。

2017 年 6 月,Yobe 公布了一段非常简短的技术介绍视频

在应用上,Yobe 计划将技术授权给芯片或智能硬件制造商,第一步的推广会从声控设备开始。CEO Ken Sutton 认为,特定声音识别技术的应用场景很广,可以用于会议转录,帮助司法或鉴定,制造更好的助听器,以及完善声纹识别技术。

Sutton 表示,目前技术研发已经完成,下一步将简化产品并投入市场。新产品会在一个月内上线,将开发布会进行现场演示。

与 Yobe 想解决的问题类似,今年 4 月,Google 曾在博客上发文称,正试图复制 “人类大脑专注于某个声源,同时可过滤掉其他声音” 的能力。Google 的技术主要集中在视频处理上,让用户在一段视频中选择一个人脸,利用视觉组件观察这个人的嘴,从而创建出其个人语音轨迹。当然,谷歌的技术难度在于分离数段声音,而 Yobe 主要完成的,更类似于 AI 降噪。

锤子的坚果 3 就声称利用了 “AI 通话智能降噪技术”,其供应商大象声科是基于计算机听觉场景分析,通过深度学习技术,来实现和噪音环境下语音增强。大象声科表示,这项技术是世界第一款芯片级单音轨实时语音提取方案,已经开始在手机通讯行业实现商用。

作为一项利用了 AI 的产品,计算资源占用和性能之间的平衡或许是 Yobe 最需要做好的。而以单一辅助技术作为出发点,在开拓市场之后,Yobe 是给自己寻找一个好买家,还是以此为切入点进入更广的语音领域,也是我们接下来会关注的。

+1
2

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的机构

联想旗下全球科技产业基金,投资布局IT未来

下一篇

印度人眼中的阿里、腾讯和复星三驾马车深入印度,想打造当地创业生态系统。

2018-05-09

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业