微软用AI为Word和PPT增加解读图像能力,让盲人也能“看”图

boxi · 2016-12-03
对于盲人来说,图片的可选文字应该是必选的。

对于盲人来说,辅助性技术对电脑使用起到了关键作用。比如,TTS(文本转语音)技术对盲人就很关键,这让他们可以阅读文章。但是媒体不仅仅是由文字构成的,图像也是很重要的一部分。而图像和视频在数字世界中正日益占据着更显著的位置。视力受损者看不到这部分内容实在是一件憾事。不过微软正在为他们弥补这一遗憾,近日Office 官方博客宣布,已经增强了该办公套件的辅助选项功能,其中就包括利用人工智能来描述Word和PowerPoint文档中的图像,让盲人也能“看”到图片的内容。这些新特性将会在2017年初正式推出,Office 365订户可以在PC版的Word和PowerPoint先睹为快。

PPT或Word的图片原来都有一项Alt Text(可选文字,右键图片—设置图片格式—可选文字可以设置)功能,通过它可以设置图片的标题和描述,目的就是为了让视力或者认知能力存在障碍的人能理解图片而设计的。遗憾的是,绝大部分人都不会输入这部分的信息。而对于盲人来说,可选文字其实应该是必选的。

微软用AI为Word和PPT增加解读图像能力,让盲人也能“看”图

为了改变这一现状,微软决定自动完成这个图片描述的过程。其解决方案是利用自己的认知服务计算机视觉(Cognitive Services Computer Vision)API,通过这项API将图片自动用文字描述出来,文档作者只需右键点击图片然后勾选“自动完成可选文字(Automatic Alt Text)”即可。该API就会自动对图片做出描述,然后再由屏幕阅读器把图片标题和描述读出来。

微软的图像识别技术为深度学习技术,它可以识别图片当中的对象,然后想出最适当的文字来表述整幅图像。鉴于这项技术背后采用的是机器学习技术,所以使用这项功能的人越多,其表述能力就会越强。

除了微软以外,Google、Facebook、苹果、Twitter等也都开发了类似的图片描述技术。比如Facebook就利用了类似技术给用户分享的图片添加标题,这样盲人用户通过iPhone手机浏览新闻流时,内嵌的VoiceOver屏幕阅读器就会把图片的标题读出来,帮助盲人用户更好地理解相关内容。

 

+1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

三方拟分别出资1.5亿元、1亿元、0.5亿元作为该基金的基石投资者。

2016-12-03

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业