蒲庙信息网

首页 > 正文

AI诈骗电话克隆声音,这个CEO被骗173万

www.dasvelas.com2019-09-30

我想昨天分享

新智慧报告

编辑:张佳

[新智读]被AI欺骗的经验如何超过100万?据报道,犯罪分子使用人工智能模拟了老板的电话,并要求一家英国公司转移22万欧元。结果,公司被骗了。出乎意料的是,现在的AI不仅可以改变面容,而且可以改变声音。

浪潮尚未退去之后,AI改变了面孔,AI改变了声音,使电话骗局成真!

根据《华尔街日报》,今年3月,欺诈者利用AI复制了英国一家能源公司首席执行官的声音,并成功地诱使公司高管通过匈牙利供应商向他们转让了22万欧元(约合173万元人民币)。

据网络专家称,这是黑客使用人工智能犯罪的不寻常案例。

使用AI掩盖老板的声音,甚至可以安装重音,一部电话骗了173万

就是这种情况。一家英国能源公司的首席执行官接到了电话。他以为自己正在与德国母公司首席执行官交谈。另一方要求他将钱转给匈牙利供应商,并说此事非常紧急,应在一小时之内。付款。

执法机构和AI专家预测,犯罪分子会使用人工智能来自动进行网络攻击。无论事件的幕后原因是谁,似乎都已使用基于人工智能的软件成功地模仿了德国高管在电话中的声音。总部位于慕尼黑的金融服务公司Euler Hermes的欺诈专家RüdigerKirsch说,这位英国首席执行官已经听到了老板的轻微德国口音和他在电话中的语气。

一些官员说,欧洲的语音欺骗攻击是他们听到的第一起网络犯罪,其中犯罪分子严重依赖人工智能。根据Kirsch的说法,Euler Hermes承担了受损公司索赔的全部金额,之前没有处理其他与AI犯罪有关的损失索赔。

Kirsch表示,使用人工智能的欺诈对公司来说是一个新的挑战,以前的安全工具无法检测到它。因此,Network Security最近开发了用于检测所谓的深度假记录的产品。

欧洲刑警组织欧洲网络犯罪中心战略总监菲利普阿曼说:“目前尚不清楚这是否是第一次使用人工智能的攻击,或当局是否未发现使用该技术。虽然很难预测使用人工智能的网络攻击是否会很快上升,但阿曼先生表示,如果黑客更成功或更有利地使用人工智能攻击,他们更有可能使用这项技术。

基尔希说,欺骗英国能源公司的黑客打三个电话。转移22万后,黑客打电话说,母公司已转移资金偿还英国公司的费用。当天晚些时候,他们举行了第三次电话会议,假装再次担任首席执行官,并要求第二次付款。由于尚未收到转移偿还款,第三次来自奥地利,行政当局已开始怀疑尚未支付第二笔款项。

转入匈牙利银行账户的资金随后转移到墨西哥并分发到其他地方。基尔希先生说,调查人员没有发现任何嫌犯。

目前尚不清楚攻击者是否使用机器人来应对受害者的问题。如果他们这样做,阿曼说,执法当局可能会发现调查更加困难。

基尔希认为,黑客使用商业语音生成软件进行攻击。基尔希用一个这样的产品记录了他的声音,并说克隆版本听起来很真实。

网络安全公司Endgame的数据科学主管Bobby Filar表示,一些软件公司提供的服务可以快速克隆声音。 “你不需要成为一名数学医生来使用它,”菲拉尔说。

黑客可以使用的另一种策略是将音频样本拼接在一起以模仿一个人的声音,这可能需要数小时的录音。安全研究人员去年在Black Hat会议上展示了这项技术。

攻击者可以使用公共录音来冒充名人或高管。

菲拉尔说:“你不能四处走动,但保持沉默。每个人都可能遇到这种情况,你会发现你从未想过可以用来对付你的信息。”

联合国区域间犯罪和司法研究所人工智能和机器人中心负责人Irakli Beridze表示,将机器学习技术应用于欺骗性声音会使网络犯罪变得更容易。

联合国中心正在研究用于检测假视频的技术,Beridze先生称这可能是黑客更有用的工具。对于英国能源公司来说,一个不熟悉的电话号码终于引起了怀疑。 “想象一下,用CEO的声音进行视频通话,这是你熟悉的面部表情。然后你根本就没有任何疑问,”他说。

AI改变声音只有5秒样本,谷歌项目开源

事实上,使用AI克隆一个人的声音并不新鲜。百度去年推出了一种新的神经语音克隆系统,可以从少数音频样本中合成一个人的声音。

Lyrebird是Google旗下的一家加拿大公司,它可以在一分钟的音频中生成与用户语音功能高度相似的数字语音。

谷歌还发表了一篇题为“从说话人验证到多语言文本到语音合成的转移学习”(SV2TTS)的论文,该论文描述了一种基于神经网络的文本到语音合成(TTS)合成系统。该系统能够以许多不同扬声器的声音产生语音音频。

SV2TTS是一个三阶段深度学习框架,它通过几秒钟的音频创建语音的数字表示,并使用它来调整文本到语音模型,该模型被训练为新的语音。换句话说,您可以在5秒的音频样本中克隆一个人的声音。

视频演示

该系统由三个经过独立培训的组件组成:

扬声器编码器网络

基于Tacotron 2的序列到序列合成网络,在语音嵌入条件下从文本生成mel谱;

一种自动回归的基于WaveNet的声码器,可将mel频谱图转换为一系列时域波形样本。

Speaker Encoder是Google之前提出的扬声器认证网络。深层网络是单独预先培训的。训练语料库使用大量扬声器音频,不需要相应的文本,音频可能充满噪音。说话的那部分网络输出一个固定大小的扬声器嵌入。人类矢量编码说话者的声音特征。

该研究表明,所提出的模型可以将经过有区别训练的说话人编码器学习的说话人变异性的知识传递给多语言TTS任务,并且可以在不看到说话者的情况下从训练中综合自然。语音。

最后,我们证明随机采样扬声器嵌入可用于在新的说话人语音中合成语音,表明该模型实现了高质量的说话人表示。

论文地址:

音频样本:

开源地址(非官方):

今天,当AI可以改变面部并改变声音时,我们还需要在开发AI时保持警惕,以提高我们的安全意识。可以预见,未来使用人工智能的网络犯罪数量将大幅增加,如何应对这一问题值得我们深思。

参考链接:

寻常-cybercrime-case-?网址:寻常-mod=hp_lead_pos10&ns=prod/accounts《华尔街日报》

收集报告投诉

0x251C

辛志远报告

编辑:张佳

被100多万人的人工智能欺骗是一种什么样的经历?据报道,犯罪分子利用人工智能模拟老板的电话,并要求一家英国公司转账22万欧元。结果,公司被骗了。出乎意料的是,人工智能不仅可以改变它的脸,而且可以改变它的声音。

人工智能变脸的后果并没有消退。人工智能变声诈骗的伎俩已经实现了!

据《华尔街日报》称,今年3月,一名诈骗犯利用人工智能模仿英国一家能源公司母公司CEO的声音,成功诱使高管通过匈牙利供应商向该公司转移22万欧元(约合人民币17.3万元)。

网络专家表示,这是黑客利用人工智能犯罪的不寻常案例。

0x251D

用人工智能伪装老板的声音,连口音都可以伪装。一个电话就欺骗了173万人。

发生的事情是,一家英国能源公司的首席执行官接到一个电话,他以为自己在和德国母公司的首席执行官谈话,后者要求他把钱转到一家匈牙利供应商手中,并说一小时内付款很紧急。

执法机构和AI专家预测,犯罪分子会使用人工智能来自动进行网络攻击。无论事件的幕后原因是谁,似乎都已使用基于人工智能的软件成功地模仿了德国高管在电话中的声音。总部位于慕尼黑的金融服务公司Euler Hermes的欺诈专家RüdigerKirsch说,这位英国首席执行官已经听到了老板的轻微德国口音和他在电话中的语气。

一些官员说,在欧洲,语音欺骗攻击是他们听到的第一个网络犯罪,罪犯显然依靠人工智能。根据Kirsch的说法,Euler Hermes承担了受害公司的全部索赔,并且先前未曾处理过其他因追回涉及人工智能犯罪的损失而提出的索赔。

Kirsch说,欺诈性使用AI对公司来说是一个新的挑战,以前的安全工具无法检测到它。因此,网络安全公司最近开发了用于检测所谓的Deepfake录音的产品。

欧洲犯罪集团欧洲犯罪中心战略负责人菲利普阿曼(Philipp Amann)说:目前尚不清楚这是否是使用人工智能的首次攻击,还是当局尚未检测到该技术的使用。虽然很难预测使用AI的网络攻击是否会迅速上升,但阿曼先生说,如果黑客使用AI攻击获得更大成功或更多利润,那么他们更有可能使用该技术。

Kirsch说,欺骗英国能源公司的黑客打了三个电话。在转移了22万欧元后,黑客致电母公司转移资金以偿还这家英国公司。然后他们在当天晚些时候举行了第三次电话会议,再次冒充首席执行官并要求第二次付款。由于尚未收到转账还款资金,并且第三次致电是通过奥地利的电话号码,因此主管部门开始怀疑第二笔付款没有支付。

转入匈牙利银行帐户的资金随后转至墨西哥并分配到其他地方。基尔希先生说,调查人员没有发现任何嫌疑人。

目前尚不清楚攻击者是否使用机器人来响应受害者的问题。阿曼说,如果这样做,执法调查可能会更加困难。

Kirsch认为,黑客使用商业语音生成软件进行攻击。 Kirsch用一种这样的产品记录了他的声音,并说克隆的版本听起来很真实。

网络安全公司Endgame的数据科学总监Bobby Filar表示,一些软件公司提供的服务可以快速克隆声音。菲拉尔说:“您不需要成为数学医生就可以使用它。”

黑客可以使用的另一种策略是将音频样本拼接在一起以模仿人的声音,这可能需要花费数小时的录音时间。安全研究人员在去年的Black Hat会议上演示了该技术。

攻击者可以使用公共录音来模仿名人或高管。

菲拉尔说:“你不能走动,但要保持沉默。每个人都可能遇到这种情况,你会透露你从未想到过的信息,可以用来对付你。”

联合国区域间犯罪与司法研究所人工智能与机器人技术中心负责人Irakli Beridze表示,将机器学习技术应用于欺骗性的声音会使网络犯罪变得更加容易。

联合国中心正在研究检测假视频的技术,贝里兹先生说,对于黑客来说,这可能是一个更有用的工具。对于这家英国能源公司来说,一个陌生的电话号码终于引起了人们的怀疑。他说:“想象一下以首席执行官的声音进行视频通话,这是您熟悉的表情。那么,您完全不会有任何疑问。”

AI更改仅响起5秒示例,Google项目开源

实际上,使用AI克隆人的声音并不是什么新鲜事。百度去年推出了一种新的神经语音克隆系统,该系统可以仅通过少数音频样本合成一个人的声音。

Google旗下的加拿大公司Lyrebird可以在一分钟的音频中生成与用户语音功能高度相似的数字语音。

Google还发表了一篇题为“从说话者验证到多说话者文本到语音合成的转移学习”(SV2TTS)的论文,该论文描述了基于神经网络的文本到语音(TTS)合成系统。该系统能够以许多不同扬声器的声音产生语音音频。

SV2TTS是一个三阶段的深度学习框架,可以从几秒钟的音频中创建语音的数字表示,并使用它来调整文本到语音的模型,该模型被训练为新的语音。换句话说,您可以在5秒钟的音频样本中克隆一个人的声音。

视频演示

该系统由三个经过独立培训的组件组成:

扬声器编码器网络

基于Tacotron 2的序列到序列合成网络,该网络在语音嵌入条件下从文本生成mel谱;

一种基于WaveNet的自回归声码器,可将梅尔频谱图转换为一系列时域波形样本。

speaker encoder是谷歌先前提议的speaker认证网络。深度网络是单独预先训练的。训练语料库使用了大量的说话人音频,不需要相应的文本,而且音频中可以充满噪声。该部分网络输出固定大小的说话人嵌入、讲话。人类矢量编码说话人的语音特征。

研究表明,该模型能将经过判别训练的说话人编码者所学习到的说话人变异性知识传递给多语种tts任务,并能在不看到说话人的情况下从训练中综合自然。声音。

最后,我们证明了随机采样的说话人嵌入可以用于合成新的说话人语音,这表明该模型可以获得高质量的说话人表示。

论文地址:将学习从说话人验证转移到多说话人文本到语音合成.pdf

音频示例:

开源地址(非官方): voice cloning

今天,当人工智能可以变脸变声的时候,我们在开发人工智能的时候也需要提高警惕,以增强我们的安全意识。可以预见,未来使用人工智能的网络犯罪数量将显着增加,如何应对是一个值得我们深思的问题。

参考链接:

寻常-cybercrime-case-?网址:寻常-mod=hp_lead_pos10&ns=prod/accounts《华尔街日报》

热门浏览
热门排行榜
热门标签
日期归档