众所周知,警方会通过网络上的文字信息来协助破案,比如之前雷锋网就曾报道过,为了揪出色情黑产从业者,鹅厂会同警方合作,通过对一些 QQ 群名称和简介来进行识别。
放眼国外,无论是 Facebook 还是 Twitter,也都曾出于“反恐”的目的出台过对策,比如禁止有关“支持”恐怖组织和“赞美”恐怖主义组织领导人的言辞,或者“纵容”暴力恐怖行为的表达内容。
不过,这些更多的还是来自文字信息。你有没有想过,可能你的音频甚至是视频等多媒体信息,也会成为被监控的目标?例如,机器可能会通过语音录音与存储在海量数据库中的语音样本进行匹配,来锁定异常人群,即以声识人。
不是小打小闹,可能被大规模应用
我们都有过打客服电话的经历,在接通人工客服后,会有一句“为保证服务质量,本次通话将会被录音”的提示。
那在众多的录音素材中,如何能通过一些音频标签来识别出关键信息?一家名为“Verint”的以色列的公司,正是瞅准了音频识别和监控的生意,从商业通话录音识别起家,慢慢将触角延伸到警务领域,这意味着,普通人的声音信息未来也可能处于被监控的范围。
雷锋网(公众号:雷锋网)发现,这家以色列公司也在。。。天chao(你懂的)。。。也开展业务。
最近,Verint与来自奥地利、瑞士、荷兰、英国等非盈利研究组织,公开了他们的扬声器识别集成项目平台(SIIP),并发表了一篇极具争议性的论文↓↓↓
参与这篇论文的研究者来源庞杂,除了Verint,还有 SingularLogic 和 Nuance 等商业公司,并联合了一些非盈利性的研究机构做关键字识别研究和伦理道德道德的研究,更为重要的是,论文中还征集了多个执法机构的意见,包括国际刑警组织、意大利警察局、英国大都会警察局、德国联邦刑事调查局和葡萄牙刑事警察局。
换句话说,这不单单只是一个简单的研究或者小范围的试验,未来SIIP平台可能被多个国家的警务系统大规模使用。
根据论文中的介绍,SIIP(扬声器识别集成项目)是运行在大型语音样本数据库上的扬声器识别(SID)解决方案,它将采用几种语音分析算法,按性别、年龄、语言和口音来过滤语音样本,通过将来自电话通话或社交媒体帖子的语音样本,与存储在诸执法机构共享的海量数据库中的犯罪分子的语音录音相匹配,来找出嫌疑人。
论文指出,未来它将由国际刑警组织在法国里昂的总部加以管理,目的是提高语音数据的准确性,并提高语音数据的可靠性和司法上的可采信性。
推特、脸书、领英等平台的声音信息都可能作为采集来源
究竟哪些平台上的音频信息会被收录?
答案是:任何“合法截获”的声音!比如果手机、固定电话的通话信息、网络语音信息,或者社交媒体中公开发布的音频(比如招聘、宣传信息),预期用途是将从电话通话和社交媒体收集的声音与“黑名单”数据库相匹配来找出异常人员。
可以说,来源非常广泛,尤其是看到这份论文中公布的社交媒体上的名单,雷锋网编辑不由得虎躯一震~
文中指出,目前 SIIP 可以匹配来自各大社交媒体平台的语音样本,包括Twitter、Google+、LinkedIn、YouTube 和 Facebook,基本涵盖了大多数人的生活圈。
其实,匹配多个平台还不是最大的难点所在,真正的难点在于构建这种系统所需安装的诸多工具,比如过滤背景噪音,提高语音清晰度,隔离声音,以及为警察总部和外勤的应用轻松共享、收集和分类数据的各种小工具。
这样做的目的,是能够将新的语音录音与庞大的声音样本数据库进行匹配。未来,该数据库将由国际刑警组织来管理,来自192个国家的这些执法机构可以访问该系统。
除了数据更为丰富,由于社交媒体平台所提供的信息更为多元,平台还会通过基于语言相关性和地理位置等搜索标准对多媒体内容进行梳理,该系统将标记和处理这些材料,并在数据库中找到类似的片段。
也就是说,原来警察更多的是从文字信息中搜集可疑内容,但现在,不仅新增了视频和音频的识别,还会结合地理位置等信息做更加精准的判断。
安全监控PK个人隐私恩仇录
为了安全的监控和保护个人隐私本就是一对矛盾体。
以美国为例,自1997年2月,联邦调查局开发了能够对网络通讯进行监控的软件系统“杂食者”(Omnivore)软件,但其很容易截获法院令状之外的其他通讯信息,以致对公民的隐私和通讯自由构成巨大威胁,之后,其升级版“肉食者”也因为严重威胁公民隐私权而一直饱受社会各界的批评,甚至停用。
然而,2001年9月发生的“9·11事件”使情况发生了巨大的转变。“9·11事件”使美国民众对恐怖事件的忧虑上升到一个前所未有的高度,相应地,其对政府权力的扩张表现出异乎寻常的宽容。借助这一契机,美国政府开始大肆发展各种监听和监控项目。
这种宽松的态度也让隐私信息的保护发生了严重的问题,最终爆发了众所周知的“棱镜门”事件。
但这也并未阻止监控软件越来越强大的功能,近年来,从美国的联邦调查局(FBI)、中央情报局(CIA)到国家安全局(NSA),一直在开发和更新能够对网络通讯进行监控的软件系统。
在今天所讨论的论文中,有一组国际刑警组织所列出的数据:在对69个国家的91个警察部门作了一项调查后,我们发现,一半以上的警察部门已经在使用某种类型的自动语音识别系统。
未来,如何平衡办案效率和保护个人隐私的问题,也将一直是摆在各类监控软件面前的问题。
参考来源:
《Towards a breakthrough Speaker Identification approsch for Law Enforcement Afencies:SIIP》
《计算机网络犯罪对刑事诉讼的挑战与制度应对》
云头条
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/industrynews/113437.html