Common Voice 项目是 Mozilla 发起的倡议,旨在帮助教会机器真人的说话方式。昨天发布了最大的人类语音公共数据集,称为Common Voice。该数据集由18种不同的语言(包括英语,法语,德语,普通话,威尔士语,卡比尔等)组成,并增加了来自42000多名贡献者的约1,00小时录制的语音片段。
Mozilla团队表示:“在这个版本中,不断增长的Common Voice数据集现在是同类中最大的,有成千上万的人将他们的声音和最初写的句子贡献给公共领域(CC0)”。
Common Voice数据集独特且丰富多样,因为它代表了语音贡献者的全球社区。这些贡献者还可以选择提供其他信息,如年龄,性别和口音,以便他们的语音剪辑附加到训练语音引擎有用的数据。
Mozilla在2018年6月启用了多语言支持,使Common Voice更具全球性和包容性。 Mozilla还涉及为该项目做出贡献的不同社区,他们帮助以22种不同语言开展数据收集工作,并在共同语音网站上开展了70多项正在进行的工作。
在这些社区的帮助下,Mozilla对Common Voice数据集进行了最新增加,包括荷兰语,Hakha-Chin,世界语,波斯语,巴斯克语和西班牙语等语言。它还计划继续与这些社区合作,以保持所代表的声音的多样性。根据Mozilla团队的说法,这些公共贡献者不仅能够跟踪记录和验证中每种语言的进度,还改进了不同剪辑的提示。
Mozilla还添加了一个新选项来创建保存的配置文件,这有助于贡献者跟踪他们在不同语言中的进度和指标。它还提供可选的人口统计资料信息,进一步帮助改善用于训练语音识别准确性的音频数据。
除数据集外,Mozilla还致力于在未来为更多样化和创新的语音技术生态系统做出贡献。它旨在发布支持语音的产品,同时确保支持研究人员和小型企业。
“对于Common Voice,我们在2018年的重点是构建这个概念,使其成为任何语言社区使用,优化网站和构建强大后端的工具。我们的总体目标仍然是:为寻求构建和使用语音技术的世界上每个人提供更多更好的数据,“Mozilla团队表示。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/124363.html