据微软官方博客透露目前该公司已经开发新的图像字幕算法,该公司希望借助人工智能实现各类产品的无障碍化。
在某些有限的测试中这种新的图像算法准确率已经超过人类,对微软实现自家产品的无障碍化将会有明显的帮助。
微软在2017年推出Seeing Ai应用程序,这款应用程序背后利用人工智能算法识别用户拍摄的内容并语言描述等。
而新的图像算法也会也会提供给 Seeing Ai 应用程序 , 用于提高其物品识别率帮助视障人士通过摄像头了解世界。
微软办公软件套件目前已经提供部分无障碍措施,例如附带的读屏软件可以逐行逐字朗读内容帮助视障人士识别。
新的图像字幕算法在办公软件内的应用则是为图片创建替代文本,替代文本又可以被读屏软件识别转为语音内容。
所谓替代文本主要指的是图片的ALT属性,该属性原本是用来描述图片内容的 , 但是文本内容依赖用户手工编辑。
而新算法则可以自动识别图片内容并创建替代文本,替代文本交给读屏软件变成语音后即可让视障人士了解内容。
据悉以上新功能将逐步在Word、PowerPoint、Outlook等组件中到来 , 其他办公软件组件预计也会支持该功能。
此次微软也重点提到该公司在2017年开发的Seeing Ai 应用 , 这款应用在苹果已经连续三年被评为最佳辅助应用。
视障人士借助该应用安装在智能手机上,然后通过智能手机摄像头拍摄周围的事务即可经由算法处理并给出描述。
能够识别的内容通常是各类常见的物体例如桌椅板凳或者家用电器,不过微软目前正加强其算法支撑提高友好性。
新的图像算法不仅可以帮助该应用提高识别效率,还可以更精准的描述其关系,例如一个人坐在椅子上拉手风琴。
而不是像以前那样识别单个物体简单输出描述人、椅子和手风琴,这即极大地改善用户通过摄像头看世界的体验。
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/31587.html