愿得一人心,白首不相离。今天,2 月 14 日,是万千情侣翘首以盼的情人节。但因为疫情,我们不能出门欢聚;因为疫情,我们不能花前月下;因为疫情,我们不能去做太多我们想做的事儿……
自疫情以来,我们的中央政府做了很多的部署抗击疫情,各大公司开发了很多和疫情有关的工具,海内外的各界人士纷纷捐款捐物抗击疫情,各地的志愿者纷纷成立各种小组服务大家。疫情的发展牵动每一个中华儿女的心,涌现出了许多可歌可泣的感人事迹。
我们都知道,新型冠状病毒肺炎的最大特点是传染性强,潜伏周期长。我们是一个有着 14 亿人口的大国,每个人都需要做好疫情防护工作,为自己负责,为家人负责,更是为国家和社会负责。千里之堤溃于蚁穴,一点点的疏漏就会给疫情防治带来巨大的挑战。
然而,口罩该怎么选择?在医疗物资紧缺的当下,有什么办法来提高口罩的利用率?经常要去医院该怎样做防护?家里有老人孩子需要做哪些事情?复工在即,怎样防护才安全?出入公共场所又该怎样防护?怎么正确选择和使用消毒产品?身体不适,担心自己中招,该怎样求助?自己周边有哪些地方确诊了病例?国家发布了哪些疫情有关的措施?如此这般,一系列问题摆在了大家的眼前。如何在浩如烟海的信息中快速地找到这些问题的靠谱答案呢?
我们看到有很多的文章在传播错误的防护知识;我们看到权威机构发布的疫情防护手册内容需要被更多人使用;
我们可以做点什么呢?
我们认为权威可靠的疫情防护知识应该传递给每一个人;我们认为国家及各单位开发的疫情工具应该一站式提供给每一个人;我们认为普通百姓应该通过简单的问答方式获得准确的权威答案。
经过深入的思考,我们决定做一个关于新型冠状病毒疫情防护的开源语料库。如果把智能问答机器人比喻成汽车,语料库就是汽车启动需要的油。没有油,车是无法启动的,没有语料库,智能问答机器人是不能工作的。人工智能近几年如火如荼,有非常多的公司和科研机构在从事相关研究。我们的目标是提供一个权威可靠的疫情防护语料库开放给这些公司和科研机构。这些公司和科研机构,可以基于该语料库发布各自的疫情安全防护问答机器人,提供给他们的用户使用。
因为是做疫情相关的语料库,对用户的生命健康有重大影响,所以我们对语料的来源进行了精心甄选。我们只采用来自国家权威机构发布的资料,如国务院的中国政府网发布的权威回应、中国疾病预防控制中心发布的《新型冠状病毒感染的肺炎公众防护指南》、中国医学科学院北京协和医学院的相关专家编写的《协和新型冠状病毒肺炎防护手册》、人民日报的相关问答等。
除疫情防护的知识语料外,疫战 2020 疫情防护语料库还整理了疫情相关工具的语料,如国务院疫情督查、征集肺炎求助者、密切接触者测量仪、疫情实时地图、疫情心理援助电话、防疫物资供求等疫情工具。
疫战 2020 疫情防护语料库是由用友员工白清杰发起的个人公益项目。语料由志愿者根据国家权威机构发布的资料共同编辑整理完成。志愿者有来自北师大、北航、北邮、浙大、重大、武汉理工等高校的学生和老师,有来自上海计算所、共致开源等组织的热心人士。志愿者在很短的时间自发自愿的聚集在一起,借助网络的力量分工协作,通过众包方式完成语料库的整理。百科名医的 CTO 赵鑫磊先生提供了大量技术支持。
我们是临时拼凑起来的一个志愿者团队,起初只有两三个人,后来变成十几个、几十个。我们都没有语料整理经验,爱因互动提供了语料建设规范,对志愿者进行了培训,帮助志愿者构建对智能问答服务友好的知识库。
语料库的整理工作是非常枯燥乏味和艰辛的。志愿者们凭着一腔热情,用业余时间,你一砖我一瓦,夜以继日地对语料进行丰富完善。我们从 3 号开始整理,到 7 号的时候已经初具规模。8 号、9 号,我们组织志愿者进行了集中突击,整理了大量的语料。11 号时,语料建设的第一阶段已经接近完工。之后我们组织大量的志愿者对答案进行检查核对,更新过时的答案,规范答案的格式,我们抓取了百度知道的 5000 多个疫情相关问题做测试。我们的志愿者将来自百度知道的 2200 多个问题通过人肉分拣,更新到了我们的语料中。针对疫情实时数据,我们将 69 种咨询方式和 369 个区域,按照排列组合方式,将生成的超过 25000 多个问题,加入到了语料中。我们精心挑选了一些和疫情防护有关的短句,附在每一条答案的后面,帮助更多的人了解如何做好安全防护。
为了传递权威可靠的疫情防护知识,为了传递国家权威机构发布的疫情政策和措施,为了向所有人提供一站式的疫情防护服务,经过志愿者们近半个月的努力,经过和各个合作机构的协同作战,疫战
首先,我们感谢参与项目的 50 多位志愿者,感谢所有为这个项目贡献过力量的人!
感谢所有支持我们的合作伙伴,感谢他们向社会发布疫情防护智能问答服务!
感谢我所在的单位用友对我所做的这个公益项目的支持!
- 用友旗下协同平台友空间,面向所有企业及组织提供统一数智化工作入口、协同办公、社交沟通、业务协同等核心解决方案。友空间内置智能机器人“小友”,搭载了疫情防护问答服务。用友人工智能团队基于该语料库发布了疫情智能问答 API,该 API 发布在了用友 APILink 开放平台上,API 免费向社会开放。
- 微信对话开放平台是腾讯微信AI团队打造的一款智能对话机器人配置平台,为疫情助手机器人提供了强大的自然语言处理的技术支持。同时,利用微信对话开放平台的开放能力,将疫情助手机器人相关的技能开放到了平台内技能商店中,可供所有开发者免费使用,助力其在公众号、小程序以及第三方 web、app 等渠道,为有需要帮助的广大群众提供更加方便的疫情查询渠道。微信 AI 团队秉持“以人为本,科技向善”的理念,联合所有开发者,用 AI 的方式,为抗击疫情作出一点绵薄贡献。
- 开源社基于该语料库发布疫情智能问答服务,目前已在开源社微信公众号后台提供服务,开通了和开源社疫情微信聊天机器人服务。句子互动为微信聊天机器人提供接入服务和技术支持,后台的智能对话平台,由微软(亚洲)互联网工程院的商业人工智能团队提供技术支持以及 Azure 云资源。
- 爱因互动作为第一家向项目提供对话机器人技术支持的公司,派出了产品经理和工程师给予支持。爱因互动使用志愿者建设的语料,训练智能问答机器人模型,向公众免费提供疫情知识问答机器人服务。微信公众号作者可以利用爱因互动提供的微信公众号集成服务在自己的公众号中向订阅者提供疫情问答服务,第三方开发者也可以利用爱因互动提供的 API 服务为自己的应用增加疫情问答功能。
- 句子互动是一家基于微信生态,为企业提供营销销售自动化和社群管理工具的公司。配合微信对话开放平台,快速创建了疫情小助手,用户添加疫情小助手为好友后,私聊直接提问或添加进入任意群并@小助手,小助手便可回答关于疫情相关的问题,缓解用户紧张情绪。同时,句子互动也将功能集成到管理系统中,方便企业快速集成,为公众提供疫情知识问答服务。
疫战 2020 疫情防护语料库基于木兰宽松许可证第 2 版(MulanPSL v2)开源,社会各界都可以基于该语料库,发布疫情智能问答服务和 API,共同为抗击疫情而战斗!疫战 2020 也需要更多的志愿者参与完善该语料库。
岂曰无衣、与子同袍,王于兴师,修我戈矛。
在这个美好浪漫的日子,我们向战斗在抗击疫情一线的医务工作者和社会各界人士致敬!一切终将过去,我们静待春暖花开!
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/51516.html