电子病历业务并不是所有的应用场景都适用。当时我们认为将语音转成医疗文本的书写格式,任务就已经完成。在产品实际落地的过程中,我们发现与原先的设想大相径庭,医院在使用产品的时候有其独特的场景需求。——杨文骥
机器学习领域学术界的大神Michael Jordan曾说,“如果你有10亿美元,应该投入到自然语言理解的研究中。”
如果将眼光聚焦到医疗流程的最初阶段,医生职业生涯大约35%- 40%的时间都用在了病历书写及相关的文案工作上,50%以上的住院医生每天用于写病历的时间平均超过4小时。所以,如果将语音识别技术应用到医疗垂直领域,医生工作流程中的一大痛点就可以被满足。
近日,雷锋网与中科汇能的创始人杨文骥进行了一次深入对话。中科汇能2016年9月成立,是一家专注在智能语音、自然语言理解前沿技术的人工智能公司。杨文骥是人大商学院企业管理硕士,同时也是一位创业老兵,曾任上市公司龙旗控股品牌事业部总经理,同时也是中国医疗器械行业协会医疗人工智能专业委员会的秘书长。
大鱼吃小鱼?
杨文骥向雷锋网(公众号:雷锋网)介绍,近几年语音识别技术的成熟带动了一批创业公司的成长,目前市面上单做语音识别的公司也有几十家,但是语音识别技术一定要和行业场景相结合,普适性的识别技术并不能给垂直行业带来实质性变革。基于这样的思考,杨文骥选择了从医疗行业入手,这其中包括语音电子病历和工作医生移动平台。
以语音电子病历为入口,可获取大量的医疗文本用于模型训练,“目前我们公司获得的文本数据大概有30G。同时相关的词条、句式这些方面,将近1亿条。”
在他看来,医疗行业完全不像互联网行业纯粹的大鱼吃小鱼,快鱼吃慢鱼的生存法则,比拼的是服务、产品,还有建立渠道的能力。
杨文骥认为,医疗行业是一个很传统的行业,行业细分很多,每个人在这里面都能找到自己的着力点。“语音识别切入医疗行业的时间也不长,大家其实在同一条起跑线上。我们决定先以语音病历为入口打入这个市场。”
我们都知道,谈到语音识别的时候,就不能避开“科大讯飞”这些巨头,但是杨文骥并没有“被巨头支配的恐惧”。他表示。科大讯飞是一个全方位布局的公司,在AI应用在医疗方面的八个应用场景里,至少占了六个。“据我所知研发团队也只有一百多人左右。而理论上具有相同智慧大脑的我们,规模虽小,但专注在某一个具体的方向上,无论从深度还是专业度来讲都要更扎实。”
从医院的服务需求来看,近一两年医疗行业云计算机的布局速度明显加快,杨文骥表示,尽管医疗机构对云计算的顾虑在逐渐消弭,对云计算的了解、认可和接纳程度在不断提高。但是考虑到医疗行业的特殊环境,即使是私有云,医院对数据安全等问题也会有所顾虑,因此,“医院更希望我们企业是产品提供商,而不是云服务商”,基于这点考虑,中科汇能和大公司的平台化逻辑也是相差甚远。
语音工具和移动工作平台
在杨文骥看来,电子病历越来越具备结构化的趋势,但是有一部分东西是难以结构化的,例如CT报告。“CT报告包含大段表述性文字,表述性的东西本质上来说很难进行结构化,不是说不能够结构化,而是结构化后的需求点在哪里。”
杨文骥强调,医院使用语音电子病历的过程中,并没有一种场景需要创造一份新的病历。大量的病历都基于原有模板进行修改,据杨文骥统计,不用修改的内容占到70%,只有30%左右的内容需要重新编辑和修改。如果利用语音转文字的特殊方式,让医生创作一份新病历会带来两个问题,一个是占用大量时间,还有一个就是对医生的口述水平形成压力,在转录过程中出现失误,文本转写的内容就会乱套。
他认为,全结构化形式的电子病历不能满足需求,因为医生对于结构化的需求就像“搭积木”一样,所以企业需要思考的产品思路应该是基于对自然语言的理解。在无法预见文本归档形式时,就只能利用知识图谱的方式对无结构化的数据进行整理。
鼠标、键盘、触屏这些交互模式都在效率上有缺陷,语音是一种更高效的方式。雷锋网了解到,公司的第一款产品医语通主要是在医院场景下帮助医生提高工作效率,从而间接增加了医疗资源的供给。语音录入也不是在医院的任何场景下都能发挥出效率效能,最适合应用在在交互场景、标准化程度不高的地方,如病程记录、各种讨论记录(死亡、疑难等)、上级查房、医护交接班、远程医疗等。
医语通的这款产品进入到医院后,通过医院的私有云,布局到医院的子系统,同时为医生开通不同数量的端口。不同科室的人员可以选择对应科室的语音识别模型,以提升语音识别准确率。在医院的较多医技科室,医生双手被占用去操控仪器和设备,无法腾出手采用键盘输入同步完成病历,比如口腔、B超、病理切片等场景都存在类似问题,这些领域的特性对电子病历诉求明确,将成为其重点开拓的领域。。那么语音输入的价值就不仅是在效率上了,对工作流的优化也起到了很大作用。针对影像科室的实际需求,杨文骥提出用语音的方式去驱动光标定位,并且可以语音控制模板功能。完全脱离键盘和鼠标,做相应的光标下的修改、删除、增添。“这一项技术的尝试才算真正切入了医生的工作流程当中,在市场上还没有看到其他入局者。”
在技术方面,医语通主要有几个特点:基于特定的医疗场景,产品的识别准确率达到97%,每分钟可识别300字左右;具备抗噪能力和地方口音普通话的识别能力;不需要开放接口,可自适应多个终端如移动手机、移动PAD、外置麦克风等。
公司的另一款产品是“移动工作平台”,最终解决的是医生在任何场合条件下对数据的读和写的问题,给医生提供了一种在院外同样可完成在院内才能实现的各类相关操作,比如,信息查询、线上问诊,病人加号等。中科汇能开发该产品的用意非常明显,因为原本移动端存在屏幕小操作不便利、不易进行文本录入等缺陷,经用语音识别技术扩展应用为语音命令及语音输入,给医生提供更好的使用体验。
AI只是手里的一把钥匙
虽然在语音行业有类似科大讯飞这类巨头公司存在,可是模型训练中大量的医疗语料的搜集获取及标注整理,对于他们来说仍有不小的开拓难度。把以语音技术见长的公司在医疗领域的竞争又拉回统一起跑线。
杨文骥认为,“医疗领域是一个高度碎片化的行业,能够全心全意服务好这一批用户已经非常不容易”,所以他希望专门做好一个领域,在用户体验和场景上做更多拓展。
医疗行业的特性限制了一部分创业型公司的进入,资质审批已经成为对不少AI+医疗的创业型公司商业化落地的一堵墙,而中科汇能本质上是一个助推医疗信息化的效率工具,而不像其他具有“辅助诊断”属性的工具需要介入医学诊断流程中,因此在落地过程中要轻松得多。杨文骥认为,以此为切入口,不仅免去了资质认证的时间和精力成本,同时还是一个可迅速变现的赛道。
杨文骥认为,任何的AI技术进入医疗行业,最终解决的都是医生的痛点,至于用什么样的方式去解决医生痛点问题,和技术根本没关系。“AI+医疗的本质是改变医疗习惯,AI体现的价值应该是为医生所用。”现阶段,AI就是手上的一把钥匙,医生更加信任的是产品究竟好用不好用,根本不关注是不是用了AI技术,所以从这个逻辑上来说,要思考AI技术的真正买单者是谁,对医疗信息化的理解更深厚才能够胜出。“我们本质上是一个应用人工智能的医疗信息化的技术性公司,随着数据的不断积累和训练,加快产品和服务能力的迭代速度,别人同时管着六条赛道,而我们只管一条来精耕细作,别人做专我们做精。
从商业应用上来看,中科汇能首先考虑在三甲医院推广,然后逐步向下层医院推进。“从我们的调查来看,医院对语音识别的兴趣是比较高的。”杨文骥表示,具体的付费模式与信息化厂商比较类似,都包括前端产品和后续服务两个部分。
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/66401.html