对于视觉障碍人士来说现在许多软件可以实现文字的自动朗读,因此想要阅读网页内容的话比以前是要方便许多。
不过朗读软件只能识别文字内容而不能识别图片和富媒体内容,所以视觉障碍人士想要明白图片的内容并不容易。
作为全球用户量最多的浏览器,目前谷歌浏览器开发团队正在利用机器学习技术识别图像内容并给出对应的反馈。
这样朗读软件在朗读网页的图片时会遇到谷歌添加的图片描述,然后将谷歌添加的图片描述转述给视觉障碍人士。
谷歌机器学习对上图给出的描述是:似乎是市场上的水果和蔬菜
基于云端的机器学习技术:
为实现这项功能谷歌已依靠其强大的计算能力构建基础设施,谷歌在这些基础设施里部署机器学习技术识别图片。
据谷歌称在过去这段时间开发团队运行测试时已经成功识别数千万张图片的内容并为这些图片提供自动化的描述。
当然识别图像内容并为其配备描述需要消耗巨大的计算能力,因此谷歌并不是依靠爬虫抓取到图片立即进行识别。
而是当开启辅助功能和无障碍的用户访问网站时,谷歌浏览器自动为其空缺的图片描述添加数据并保存到数据库。
相同的图片数据已经被保存到谷歌云端数据库存储,下次有用户需要朗读页面时就会从数据库检索对应图片描述。
而且还不是单纯的识别图片:
谷歌开发者分享的内容表明在云端服务器机器学习不是单纯识别图像内容,而是综合网页信息给出最匹配的描述。
谷歌浏览器遇到空白描述的图片会将其信息发送至云端,机器学习软件会读取网页内容、图片以及相关标签数据。
然后再根据这些信息为图片提供更精确的描述,如果机器学习软件认为图片不太好描述的话就会留空防止会误导。
遗憾的是此服务必须能连接谷歌服务器才可使用,同时现阶段返回的图片描述仅英文,因此国内用户还无法使用。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/31576.html