36氪广东首发 | 从教育领域向适用人机交互的全行业延伸,AI语音及视频技术方案商声希科技完成数千万元融资

黄志敏2020-12-29
为新东方在线、百词斩、阿卡索、松鼠AI、51Talk等在线教育平台提供AI技术服务,向产业化布局迈进。

文丨黄志敏

编辑丨江倩君

36氪广东获悉,深圳市声希科技有限公司(下称“声希科技”)今年完成数千万元pre-A轮融资,投资方为YY欢聚时代,本轮资金将用于智能语音、智能图像&视频、自然语言处理等方面的深入研究,并继续拓展教育及其他有交互需求领域的市场。声希科技成立于2016年,此前已获得普禾资本1000万元天使轮投资。

人工智能无疑是近年来资本市场最热门的赛道之一。根据清科研究中心及艾瑞咨询的调研报告,超过68%的机构投资重点专注在人工智能赛道,仅2020年前三季度就有122起AI领域融资事件发生,而备受国内外关注的科创板更有53%的企业披露自身具有AI技术能力或AI业务。

2020年疫情发生后,人机交互及智能语音相关的AI技术及产品受到了前所未有的关注,特别是在教育、医疗、政务等领域得到了快速的发展。艾瑞咨询报告预计到2025年,人机交互与智能语音相关的核心产品及带动产业规模将达到约2400亿元人民币。

声希科技以少儿英语教育领域作为切入口,通过AI语音及视频合成技术解决目前在线教育课时费高、学习互动效果差、优秀教师不足的痛点,为教育领域提供“虚拟教师”的整套解决方案,并基于相关技术拓展包括虚拟客服、媒体主播、政务咨询等其他业务。声希科技联合创始人孙立发表示:“声希科技目前的核心业务是开发及运营自有产品「声希AI课」,此产品集成了声希科技对于AI人机交互系统的全套技术方案,并结合国内少儿教育现状做了诸多具体的本土开发和优化,以最终实现「AI老师如真人外教」的效果。”

孙立发表示:“通过人工智能技术去「合成」一个角色需要五个具体的部件构成,分别为「耳朵&眼睛、大脑、嘴巴和形象」,代表着输入、分析优化、输出和互动。”

首先是“耳朵”部分,声希科技在语音识别及发声纠错技术上,耗时6年收集超过10万小时有效数据,针对英语口语发音及少儿特性进行了相应的“错误发音检测与诊断”技术开发,解决传统语音识别准确度不理想的问题,并实现发音、重音、语调的智能测评和纠错。

英语发音纠错功能界面(图源:声希科技)

为了达到英语场景化应用及学习的效果,声希科技通过“大脑”——NLP对话系统,研发多模态情绪识别、跨场景意图识别以及基于Transformer自然语言生成模型,实现特定场景下接近真实、自然、有情绪反应的人机交流,达到模拟日常生活对话场景以提升学生的口语表达能力。声希科技针对儿童上课容易“走神”等情况,通过摄像头(“眼睛”)对学生进行动态监测,识别其情绪及注意力情况,在孩子走神时会及时调整进行中的课程,插入小游戏或其他互动方式对其加强引导。

声希科技多场景口语对话系统框架(图源:声希科技)

声希科技的技术优势在于其个性化语音及视频(形象)合成的研发。目前声希科技能够实现输入文本自动合成为语音并生成虚拟人物视频的功能,通过对模型优化和改进使得其能够以低算力完成实时的视频生产,达到低成本、高效率制作由“AI老师”授课的英语教学视频。为了增加学习趣味性,声希科技还通过大数据学习为老师及学生提供了实时3D卡通人像的输出功能,增加课程趣味性,并在场景化互动学习时也有效地保障了学员的隐私。


声希科技AI虚拟人原理图(图源:声希科技)

声希科技AI语音及虚拟人物合成演示(图源:声希科技):

左为AI合成虚拟人物,右为基于真人或虚拟人物的实时3D动画人像输出

 声希科技在技术方面的研发成果得到不少行业内的认可。声希科技的发声纠错技术作为IEEE Trans 2017封面文章发表,个性化语音合成技术及自然语言处理技术分别获得ICME 2016和CogInfoCom 2018的最佳论文奖,而情感识别技术则获得全球最大的语义评测大赛 — SemEval-2014第五名。

声希科技相关AI技术及成果 (图源:声希科技)

以英语教育相关技术及产品来看,目前市面上有包括科大讯飞、驰声、流利说等竞品存在,孙立发表示声希科技研发并掌握了更加有效的发音纠错技术及更真实自然的场景化对话学习系统,同时基于更低成本、低算力生成的“虚拟AI教师”能够为更多家庭提供高质量、低课时费的学习课程。“声希AI课”自2020年8月上线以来已拥有超过1.2万名付费用户,签约线下机构超过200家。

通过长期的人工智能研发积累,声希科技从教育领域深度切入,已开始产业化布局。目前“声希AI课”正以技术方案的方式向更多的教育行业B端客户输出赋能,已服务包括新东方在线、百词斩、阿卡索、松鼠AI、51Talk等46家知名教育企业,营收达到数百万。在政务、媒体、金融等领域,声希科技针对不同的需求优化出AI主播、AI讲解员、AI客服等产品,并成功服务了深圳税务局、广州日报一号互联等单位,受到包括国家科技部部长王志刚、深圳市委书记王伟中等领导肯定。

声希科技为广州日报提供的AI主播(图源:声希科技)

声希科技现有80余位员工,团队核心成员来自香港中文大学人机交互实验室,拥有智能语音、智能图像&视频、自然语言处理等技术背景,且具有来自苹果、微软、IBM、SAP等企业的丰富工作经验。其中联合创始人李坤博士为语音领域四大期刊审稿人,联合创始人孙立发博士曾荣获顶级国际会议ICME最佳论文奖。


36氪广东——在广东观察世界,在湾区链接全球

36氪广东作为广东地区领先的新商业媒体,以大湾区为核心,为各位创业者、投资人以及科技、财经、新经济领域从业者提供最前沿的深度商业报道,搭建最畅通的产业对接通道,让一部分人先看到未来。

如果你希望得到36氪广东的报道,或转载原创文章,请将你的需求和BP发送至指定邮箱:guangdong@36kr.com。如果你希望转载公众号原创文章,或进入社群(备注:社群),请联系小氪微信。我们将在24小时内回复。

小氪微信ID:gd36kr001  微信公众号ID:gd36kr  官方微博@36氪广东  抖音:湾区会氪

+1
14

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的机构

合创资本专注于ICT和医疗健康相关领域的早期风险投资。

文章提及的项目

下一篇

风险管理是金融业的核心工作,主要包括风险防范和风险化解两个方面。

2020-12-29

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业