被假冒“老板”电话骗走173万，当事人：真心听不出是语音合成

通话1：叮铃铃~

某公司老总：歪~小李子，咱公司今年财务收入多少？啊~嗯，不是很多嘛，你把它全都转到我账上来，我要用来运转子公司。

小李子：得嘞，老板就是太上皇，您说啥就是啥~

通话2：叮铃铃~

小李子：歪~老板，俺已经按照吩咐把钱打过去了，您收到木？

某公司老总：纳尼？啥钱？你个鳖孙儿，我啥时候让你打钱嘞？

小李子：……（懵圈中）

看到这里，想必聪明的你已经猜到了，上面两次通话中出现的“某公司老总”里有一个定是假的。讲真，不是小李子太笨，而是这AI合成的声音已然达到以假乱真的程度。

近日，据华尔街日报报道，犯罪分子通过商业化的人工智能语音生成软件，向一家英国能源公司多位同事及合作伙伴骗取钱财，使得该公司一天内损失220000欧元（约合173万元人民币）。

AI假扮领导声音，只能跪着被骗

和上面故事描述的一样，这家英国能源公司CEO接到了来自德国母公司领导的电话。

电话中，这位“首席执行官”要求他将资金发送给匈牙利供应商，并声称这是紧急事件要求在一小时内付款。

“当时在听电话的，除了我还有我的其他同事们。在整个对话中，我们几乎认定电话对面的这个人就是德国母公司的首席执行官，至少从声音来判断是这样的。”

于是，该公司CEO毫不犹豫地按照对方要求将钱打了过去，在这之后他又连续接到了三通要求打款的电话，这才引起了他们的警惕。

华尔街日报引述该CEO的话说，我的“老板”在一天内打了三通电话，都声称供应商那边需要进行紧急打款以确保双方接下来稳固的合作关系。

被假冒“老板”电话骗走173万，当事人：真心听不出是语音合成

显然，在220000欧元到手后对方使用同样的套路继续进行诈骗，在之后的两通电话中对方提及其德国母公司需要转移资金偿还英国公司的费用。

他们注意到，这几通电话均来自奥地利并且都是如此频繁的电话催款，这引起了该公司行政部门的怀疑，因此并没有进行第二次的打款操作。

据悉，后续调查中发现罪犯将收到的钱从匈牙利转移到墨西哥和其他地方。由于此次事件是基于人工智能的网络攻击行为，因此查找罪犯要更加困难。

截至目前，警方并未确定其罪魁祸首，被诈骗的220000欧元将全部由该公司的投保公司 Euler Hermes（裕利安宜）集团承担全部损失。

AI演进，语音克隆成新骗术

AI技术的突飞猛进，使得语音克隆变得日渐平常。无论是听书软件、地图导航还是社交软件中都会有所使用。最典型的就是QQ里“变声”功能，无论你是男是女，都能让你发出各种明星大腕的声音来。

另一边，越来越拟真的AI语音让人们无法分清电话中的彼此。去年10月，谷歌在开发者大会上演示了一个颇受争议的功能——AI拨打/接听电话。

被假冒“老板”电话骗走173万，当事人：真心听不出是语音合成

随着引入了更深的layer的卷积网络模型，这些模型能编码更高维度和可解释的特征（ neural style）。从原理上来说，语音克隆就是从neural style算法中汲取灵感，实现一个好的隐空间模型来生成raw audio，并用于进行语音Style Transfer。

在谷歌的NSynth中，对合并两种乐器声音的工作中已经对Style Transfer进行了研究。一般认为voice style transfer更容易评估，语音克隆则更具挑战性，因为语音在模型的隐空间中更难被表征。

通常情况下，目标风格的声音和可能会说出的原声音内容完全不同。为了实现语音克隆，会设计出这样一种模型——该模型能够在更高维信息的隐空间内对语音编码的方式进行修改，并能概括到目标语言风格，而无需在内容语音中可能出现的所有音素（最小语音单元）上进行训练。

被假冒“老板”电话骗走173万，当事人：真心听不出是语音合成

上述模型设想，可以简称为voice transfer（CTI技术中一种语音传输方法的设计与实现），它能够让语音助理，拥有所有的不同风格，甚至创造一个拥有自己声音的语音助手。

芯盾时代合伙人杜旭称，现阶段使用AI的攻击手段主要有人脸识仿冒（又称：数字整容）语音克隆两类，其实现难度并不大。简单来讲，攻击者会通过AI技术对现有录音的嗓音、音阶范围等进行模拟，即可模拟发声。

这是一种基于AI的实时变音技术，在知道了声音的频率和声线等数据后，即可根据提前设定好的文字内容与库中的文字（带有音调信息）进行比对，然后按照希望模拟的人的声音进行发声。这种发声方式的拟真度极高，对方很难辨识。此外，该事件的场景是企业场景，即老板给员工打电话，这就更加强了通话方的信任度。

值得一提的是，攻击者之所以如此轻松得手，还有一个原因不容忽视——转账方为第三方公司而非该公司本身。也就是说，很有可能攻击者通过攻击邮箱提前得知了近日会有相当金额转账的情况，而恰好又遇到第三方公司的安全认证机制不够完善这才给攻击者钻了空子。

“这实际上是一个精心设计的骗局，对于一名企业员工来说，如此场景下再加上信息泄露，攻击者完全可以伪装出所谓‘老板’的形态，其辨识度的难度也已超出了纯粹的AI语音克隆，”杜旭补充道。

别看这样一个精心设计的局，但整个过程对于攻击者来说似乎并没有太高的成本付出，尽管AI语音攻击尚属于新型攻击手段，但杜旭相信未来这类攻击手法只会越发频繁出现。

至于防护手段，其实方法也很简单。杜旭称，最简单可行的办法就是启动多因素认证的体系。无论是三方还是企业本身，多重认证得以确保资产留出前的身份确认。譬如，如果该公司加入了转账前会发送老板本人进行短信验证的机制，那么这次攻击就不攻自破了。

“目前来看，存在这种安全风险的企业并非少数，随着AI语音攻击手段的逐渐频繁，国家将大力推广多因素认证机制，因此对于国内企业的安全性我并不十分担心。”雷锋网(公众号：雷锋网)雷锋网雷锋网

刀用哪一刃，在于人

在之前的采访中，有安全从业者这样告诉雷锋网，黑白两道之间其实并没有太大的技术隔阂，最大区别在于初衷的不同。

对于攻击者来说，人工智能技术仅是更加方便牟利的工具：随着技术的演进，方便大众的同时必会有不法分子采用vishing（“语音网络钓鱼”的缩写）这种新型诈骗方式企图获利；对于安全人员来说，人工智能是加固防线的盾牌：无监督学习、AI情报监测等新的工具提升了安全防护的效率。

正所谓刀有两刃，用哪一面还得看人。

参考链接： DeepTech深科技；知乎丨巧克力工厂的查理

。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/118109.html

被假冒“老板”电话骗走173万，当事人：真心听不出是语音合成

相关推荐

发表回复