苹果正在研发带有摄像头和语音识别功能的机顶盒据俄罗斯卫星通讯社报道,美国苹果公司正在研发一种将机顶盒“Apple TV”与摄像头和语音识别功能相结合的设备。消息指出,该设备尚处于早期研发阶段,其方案可能会发生变化。预计,新产品将兼备机顶盒、“智能”扬声器和摄像头的功能。通过扬声器可以播放音乐,使用Siri语音助手,摄像头则用于视频通话。消息称,这种设备上市后可能会成为最先进的智能家居系统。(第一财经)
2021-04-13
云知声推出AI开放平台36氪获悉,近日,云知声基于语音云平台,推出AI开放平台。云知声AI开放平台面向各行各业,为企业及个人开发者应用增加人机对话、多模态交互技术服务。除现已全面开放的语音识别、语音合成、口语评测之外,声纹识别、语音唤醒、多模态交互等技术,客服、会议等解决方案也在持续上线中。
2020-09-14
腾讯云发布专属语音识别模型:支持韩语、粤语36氪获悉,4月29日,腾讯云正式发布金融、音视频等多个领域专属语音识别模型,新增对粤语、韩语的支持,并将陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的支持。
2020-04-30
谷歌宣布开源Live Transcribe语音识别转文字工具昨日,谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎(Live Transcribe Speech Engine),它旨在将语音或对话实时转录为文字,还能够为听障人士提供帮助。(开源中国)
2019-08-18
云从科技时隔半年再次刷新语音识别世界纪录10月 29日,云从科技宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校。(亿欧)
2018-10-29
谷歌高管:语音识别将是科技的下一次飞跃谷歌搜索业务负责人戈麦斯表示,科技的下个飞跃将是语音技术的发展。他认为,更好地理解普通语言对互联网的未来至关重要。戈麦斯认为,语音识别和语言理解是未来搜索和信息的核心,然而还存在很多困难的问题,包括理解参照对象是什么,例如句子里的“他”、“她”和“它”指代的是什么。(新浪)
2018-09-25
腾讯地图8.0版本发布,智能语音助手正式上线36氪讯,在新发布的腾讯地图8.0版本中,智能语音助手正式上线。依托腾讯叮当的语音唤醒、语音识别、语义理解等全栈AI 能力,以及整个腾讯的内容和服务资源,智能语音助手能够实现全语音操控,无需按键操控;用户可随时与其问答出行、驾驶相关问题,也可语音指令“将我的行程分享给微信好友或者朋友圈”,快速便捷报平安。
2018-09-20
云知声联合平安好医生起草智能语音识别行业标准规范36氪讯,日前,云知声联合平安好医生共同起草了《中文语音识别难度分级认证规范》讨论稿,这是国内首个关于中文智能语音识别难度的标准规范。《认证规范》将中文语音识别难度分为L1-L4四个等级,并分别从声学和语言学两个维度确定了信噪比、普通话水平等十余个影响因素,对智能语音交互类产品在实际应用场景下的识别率提供了定级依据。
2018-09-12
Facebook正推进语音识别技术:未来会进化成语音助手据TechCrunch报道,Facebook正在测试一种叫做“Aloha”的语音识别技术。Facebook给新功能取名叫作“Aloha Voice Testing”,代码暗示语音功能可以支持外部WiFi或者蓝牙设备,也就是说Aloha有可能会成为跨平台语音助手,与Siri、谷歌助手一样。(新浪)
2018-08-22
阿里达摩院公布自研语音识别模型DFSMN并宣布开源阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%(这一数据测试基于世界最大的免费语音识别数据库LibriSpeech)。达摩院机器智能实验室的语音识别团队主导了这个模型的研发,并宣布向全世界企业与个人开源。(网易)
2018-06-07
康语发布首款基于语音识别的人工智能虚拟健康助手36氪获悉,健康保险科技创业公司发布了一款由Sensely提供技术支持的、首款基于语音识别的人工智能虚拟健康助手,可帮助保单用户进行初步症状的预判、提供自我诊疗的指引以及前往医疗服务的指南。据了解, 这个基于人工智能的症状预判分类功能将会正式在康语平台上线。
2018-05-17
罗永浩演示“革命性系统”现尴尬 语音识别出故障锤子科技今日发布了据称会重新定义下一个十年的个人电脑、Office办公套件、信息搜索的方式和即时通讯工具。不过在演示该产品时,遇到了一些尴尬。比如语音功能打开应用时,会存在识别不了的状况;在使用Excel时,语音输入数字也多次出现了识别问题。不过后来演示功能逐步恢复正常。(新浪)
2018-05-15
阿里研发高工业噪声环境下语音识别及传输技术,终结“耳聋工厂”阿里巴巴机器智能技术实验室消息,其正研发在高工业噪声环境下的语音识别及传输技术,以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字,让彼此心领神会。阿里巴巴AI语音工程师介绍,他们研究的语音交互技术,已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。(cnBeta)
2018-05-02
俄企推出面试机器人,集合多种语音识别技术俄罗斯圣彼得堡初创企业Strafory推出用于机构招聘的人工智能机器人。它名叫“薇拉”,不仅能从招聘网站筛选求职者简历,还能通过视频或语音电话同时面试多至数百名求职者。它结合了谷歌、亚马逊、微软和俄罗斯搜索引擎Yandex的语音识别技术,拥有庞大词库。(亿欧)
2018-04-02
中兴推出首款AI机顶盒 支持可视电话近日,中兴推出首款智能AI机顶盒S100,是业界首批自带AI功能的机顶盒设备,具备远场语音交互能力强,唤醒时延低,语音识别能力高的优点。S100可为用户提供丰富的应用,包括天气、新闻、股市等互联网交互服务和中兴通讯的智慧家庭业务,例如:多屏互动、可视通讯、智能家居等。(腾讯科技)
2018-03-07
深鉴科技语音识别加速系统上线AWS,为全球用户提供云加速服务36氪讯, 深鉴科技昨日宣布在亚马逊AWS正式上线基于深鉴Descartes稀疏神经网络处理架构的自动语音识别引擎DDESE (DeePhi Descartes Efficient Speech Recognition Engine), 开始面向全球用户提供加速试用服务。
2018-03-06
告别打字:谷歌前员工用AI开发语音识别App,“实时”记录文字谷歌的一名前员工Sam Liang与软件公司Nuance,共同开发了一款语音识别App“Otter”。这款软件利用人工智能学习来对文字进行转换,着超高的准确率,而且还能做到“实时”将语音转化成文字档。得益于近年来“语音助手”的蓬勃发展,Otter相较于其他语音识别软件,拥有一项独特的“声音辨识”功能。(IT之家)
2018-03-05
科大讯飞:腾讯小Q机器人采用讯飞语音识别技术11月8日,科大讯飞在互动平台上回答投资者询问时表示, 腾讯小Q机器人采用的是讯飞的语音识别技术。另外,相关负责人表示,科大讯飞面向全行业提供人工智能能力,目前累计终端数达15.7亿。公司的语音识别技术和图像识别技术处于国际领先水平,目前在包括教育、医疗等领域均有应用。
2017-11-08
微软语音识别出错率达5.1%创新低,比肩专业速录员微软公司在当地时间周日宣布,其对话式语音识别系统的出错率达到5.1%,创下目前为止的最低水平,超过了去年微软人工智能及研究事业部一组研究人员所实现的5.9%出错率,达到了专业速录员的同等水平。
在此次研究中,专业速录员具备重复收听录音等优势。这两次研究转录的是Switchboard语料库中的录音。Switchboard语料库包含了2400段电话对话,自上世纪90年代以来一直被研究人员作为测试语音识别系统的样本。
2017-08-21
火狐开发语音识别技术,挑战谷歌AI霸权负责开发火狐浏览器的Mozilla,已经开始测试一项功能,让用户通过语音而非在键盘上打字输入搜索关键字。此举有助于Mozilla提升火狐针对谷歌Chrome浏览器的竞争力。
2017-08-06
Mozilla基金会正筹建众包式语音识别库项目Common VoiceMozilla基金会正在酝酿一项名为Common Voice的众包式音源和识别库,该数据库将免费向三方测试开放,供那些需要在开发项目中应用语音识别(语音转文字)训练功能的开发商使用。该项目的目标是收集超过一万小时以上的音频音源,包括各种口音并且预计在今年晚些时候渐进式开放。而现在每个人都能够在该网站贡献上传自己的音源,通过自然地朗读指定陈述句,或者判断听到的他人录音口音及语调是否准确。还有相关的iOS应用供移动设备用户直接上传语音音源。当然Mozilla对项目贡献者做了非常严格的隐私保护。
2017-07-19
现代汽车在地图和语音识别领域与百度达成合作韩国现代汽车将与中国百度在地图和语音识别服务领域展开合作。作为第1项举措,现代将在2017年底之前,在面向中国销售的汽车的车载终端中引入与百度共同开发的导航软件“百度 MapAuto”和对话型语音识别服务软件“OS Auto(度秘)”。双方希望将来在确立自动驾驶技术等方面加强合作。
2017-06-16
哈曼发布远程语音识别解决方案 SONIQUETM6月8日,哈曼国际发布全新的远程语音识别解决方案 SONIQUETM。该解决方案将面向快速发展的消费类语音电子产品、企业及机器人语音应用市场,提供有别于传统手动输入的新型语音输入技术。
2017-06-08
腾讯 AI Lab 副主任俞栋:语音识别的研究从近场麦克风转向远场麦克风腾讯 AI Lab 副主任、西雅图人工智能研究室负责人俞栋博士表示,如今我们研究的语音识别问题越来越没有环境、说话风格、口音、词汇等限定(不像以前有非常多的限制),这极大地增加了语音识别的难度,同时研究的前沿也从近场麦克风转向远场麦克风。两者的区别在于,在远场情况下,当人的声音传达到麦克风时,声音衰减很厉害。所以以前在近场麦克风很难见到的一些困难,在远场麦克风场景下就变得很明显。如果不解决这些问题,用户在很多的应用场合仍然会觉得语音识别效果欠佳。
2017-06-01
腾讯西雅图人工智能研究室负责人探讨语音识别的四个前沿问题5月27日,腾讯AI LAB副主任、西雅图人工智能研究室负责人俞栋博士出席在京举办的GMIS,发表了主题为《语音识别领域的前沿研究》的演讲,探讨分享了语音识别领域的四个前沿问题。第一是更有效的序列到序列直接转换的模型。第二是鸡尾酒会问题,即屏蔽掉周围的说话声或噪音,非常好地听懂他/她要关注的那个人的说话声音。第三是持续预测与适应的模型。第四是前后端联合优化的问题。
2017-06-01
谷歌云端语音识别服务上线,能识别80种语言谷歌公司近日正式推出了旗下云端语音识别服务(Cloud Speech API),其能够识别全球超过80种语言,并能将语音转换为文字。其中,中文也在被支持之列,包括繁体中文、粤语、普通话。据介绍,谷歌的云端语音识别服务采用与Google Now、Google搜寻及Google Assistant相同的语音辨识技术。在刚刚上线的正式版本中,谷歌加强了长句子的识别和转换精度,新增支持WAV、Opus和Speex文件格式。而且识别处理速度比2016年推出的测试版快了3倍。
2017-04-21
麻省理工学院新芯片助力AI助手,语音识别功耗最多降低99%据外媒报道,AI语音助手必将成为今年科技界的“爆款”产品,不过一直在后台待机的它们功耗可不小。麻省理工学院(MIT)的研究者就针对该问题拿出了新的解决方案,他们开发的低功耗芯片最高能把语音识别的功耗降低99%。MIT的研究人员表示,现有手机分给语音识别的电量高达1瓦特,如果用上他们的新芯片,电量消耗能直接降到0.2-10毫瓦。
2017-02-15
用AI分析销售电话 Chorus.ai获1600万美元A轮融资一般来讲,通用语音的识别要比销售领域中的常用语音识别更难。即使在语音识别问题已经基本解决的今天,许多系统仍然无法克服语言的复杂性问题,Chorus.ai 公司以销售领域中的常用语音识别为切入点,致力于通过 AI 为销售团队提供解决方案。近日,Chorus.ai 公司获得 1600 万美元 A 轮融资,由 Redpoint领投,Emergence Capital Partners 参投。截止目前,该公司累计融资 2230 万美元。此外,Emergence Capital Partners 还领投了该公司去年 10 月获得的 630 万美元种子轮融资。
2017-02-10
谷歌自2012年以来已把语音识别词错率降低逾30%据科技博客VentureBeat报道,谷歌高级研究员杰夫·迪恩(Jeff Dean)周三在人工智能前沿峰会(AI Frontiers)上表示,自2012年以来,谷歌已经把语音识别的词错率(WER)降低了30%以上。谷歌发言人证实了这一数据。迪恩称,词错率的下降得益于神经网络的使用,后者是谷歌和其他公司在深度学习中使用的一种系统。
2017-01-12
IBM 语音识别新方向:仿生蝙蝠耳能用声纳精准“聆听”IBM 学院奖获得者 Rolf Müller 教授协同他在弗吉尼亚理工学院(Virginia Tech)的团队,设计了一种人造蝙蝠耳。IBM 专家韩金萍(音译)的神经计算团队希望借该项技术提高人类语音理解的能力。他们把原始语音数据和经人造耳处理的声音数据,放入分类器( classifier )中进行识别。67% 的语音信号能被成功识别出来。而在没有动态外耳的对照组中,只有 35% 的声音数据被识别。
2016-11-29
百度搜狗讯飞语音识别准确率达到97%11月21日到23日,搜狗、百度和科大讯飞三家公司接连召开了三场发布会,向外界展示了自己在语音识别和机器翻译等方面的最新进展。值得注意的是,这三家公司几乎在同一时段宣布了各自中文语音识别准确率达到了97%。
2016-11-24
三星Galaxy S8将推语音识别AI助手功能韩联社报道,三星电子4日在收购美国人工智能(AI)公司Viv Labs后举行的记者会上表示,将于明年上市的三星新一代智能手机Galaxy S8将搭载语音识别人工智能功能。三星方面表示,Galaxy S8将成为三星电子首个配置语义识别人工智能的平台,与以往的人工智能助手将有显著不同,性能优越。此次Galaxy S8推出的语音识别AI助手属于对话型服务。如同苹果(108.84, -0.99, -0.90%)的智能语音控制功能“Siri”一般,在识别用户语音后,提供所需的信息。
2016-11-06
计算机语音识别率首次媲美人类,语音识别率增至94.1%据麻省理工学院网站近日报道,微软雷蒙德研究院开发出一种机器学习算法,使计算机对指定主题对话的语音识别率增至94.1%,首次与人类水平相当;对亲戚朋友日常对话的识别率达88.9%,甚至比人类略胜一筹。
2016-10-29
微软语音识别机器出错率首次小于人类据外媒报道,人工神经网络研究迎来新进展,微软声称其所训练的神经网络在人声语音识别上已经媲美人类。在周一发布的公告中,微软表示其用NIST 2000自动化系统来同专业笔记员进行能力对比,首次实现了机器出错率小于人类的突破。微软CEO萨提亚·纳德拉对语音识别不吝赞美之情,称语音识别的突破意义不亚于当初图形界面(GUI)被引入电脑。并预言语音识别技术将在未来几年迅速普及。
2016-10-19
微软语音识别错误率6.3%为行业最低近日,微软首席语音科学家黄学东在论文中表示,他们在近期产业标准Switchboard语音识别基准测试中,实现词错率(WER)低至6.3%的这一技术突破,这比IBM上周达到的6.6%WER下降了0.3%,达到目语音识别领域错误率最低的水平。微软的语音识别技术已较为成熟,在不断突破语音识别基础技术的前提下,其继续提升以语音识别技术为基础的各种应用服务,包括Cortana以及Skype翻译等。
2016-09-16
百度宣布免费开放两项语音识别技术6 月 23 日下午消息,百度语音技术媒体开放日上,百度方面宣布免费开放语音唤醒和自定义语义 2 项技术。百度表示将为开发者提供百度大脑的声学模型和语音模型,基础服务免费,可永久使用。百度语音唤醒技术目前主要应用于百度小度机器人和百度车联网 CarLife/Codriver,唤醒率达 95%,支持自定义唤醒词和连续表达。自定义语义技术则主要应用于方言、口音识别。据了解,语音技术是百度目前主要专注的人工智能研究方向之一,2015 年 11 月,百度首席科学家吴恩达领导的百度硅谷实验室开发的新一代语音识别技术 Deep Speech2,被美国权威杂志 《麻省理工评论》 列为 2016 年十大突破性技术之一。
2016-06-23
语音识别公司Semantic Machines获得1230万美元B轮融资Semantic Machines成立于2014年,总部位于麻州。 Semantic Machines是一家专注于语音识别同步的人工智能公司。据悉,该公司目前的CTO Larry Gillick曾任苹果Siri语音研发的首席语言科学家。而创始人兼CEO Dan Roth曾经创立Voice Signal Technologies但公司在2007年被Nuance Communications以3亿美元收购。公司在网站上写到:我们目前研发的人工智能将使电脑正常交流和了解彼此。据了解,人工智能在近年来受到了多家公司的关注。Google最近推出了 更为精准的语音搜索软件;Facebook也在今年年初收购了一家语音识别创业公司Wit.ai来支持公司的人工智能研发。本轮投资的公司为Bain Capital Ventures和 General Catalyst Partners。
2015-12-24
Google 发布最新语音识别技术Google的语音研发小组在公司的Research Blog上称,公司的语音识别搜索技术目前有了新的进展。新的技术能够识别说话者的短暂停顿,并且反应更快速、准确和有效。Google称,即使在嘈杂的环境下,这项功能也将有较好的表现。目前,iOS和Android版的谷歌搜索app已经开始使用这项新的语音识别成果了。
2015-09-25
NTT 开放语音识别API NTT是日本最大电信服务提供商日本电信电话株式会社的全资子公司。NTT 开放的语音识别API支持 Chrome、Firefox 和 Opera三种浏览器。开发者可以在 SkyWay(NTT的免费网页实时通信平台)找到该 API。
2015-07-29