主页 > NBA

新技术衍生出来的黑科技,AI被不怀好意的人玩出花样

时间:2019-08-02 来源:果妈的小确幸

作为世界上最古老的几个职业之一,骗子可以说是与时俱进的代表了,甚至可以说是世界上拥抱新事物最积极的群体。


▲美国经典诈骗题材电影《11罗汉》系列


自从微信成为国民级社交软件之后,各类骗子的主战场也随之进行转移,从原来的电话短信诈骗进行了产业升级,成功步入了移动互联网时代。





骗子们的招数层出不穷,最近媒体又爆出了一个更新的骗术:近日,赵女士收到父亲的语音留言,对方称买菜没带钱要赵女士转200元。


赵女士问了一句「爸,是你吗?」很快收到语音答复,赵女士一听是父亲的口音,便将钱转了过去,结果还是被骗。


同样受害的还有来自沧州的王女士,王女士接到同学发来的微信,让她帮忙转点钱,并发来语音催促。


一听就是同学的声音,王女士好心打款500元,同样被骗。






现在的技术已经完全可以通过算法来生成人的全套语音了,甚至连愤怒、高兴等不同语气情绪都能够做到惟妙惟肖,足以以假乱真,而所需要的材料也仅仅只需要被生成者的几段话。



开发这项技术的是谷歌 2016 年在加拿大蒙特利尔大学建立的人工智能实验室(MILA)


基于声音合成技术,MILA在2017年4月份成立了Lyrebird公司。


Lyrebird是一种名为琴鸟的鸟类,这种鸟具有一种特殊的天赋,它不仅能模仿多种其他鸟类的声音,它还能模仿几乎一切它听到的声音。


▲创造你自己的声音阿凡达


在其网站 DEMO 部分,你可以听到了官方合成的足以以假乱真的特朗普以及奥巴马的声音,而美国那边也有记者用机器合成的句子跟家里人打电话做实验,他的母亲完全分不清楚真假。


之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(Neural Network)和机器学习(Machine Learning)


神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理,它利用分层的神经元,从大量样本数据中总结出共同特征。


第一个用神经网络来生成人类自然语音的,就是DeepMind的WaveNet,没错,就是那个做AlphaGo公司。



具体的原理比较复杂,就不过多赘述了,总而言之WaveNet可以把PS痕迹明显的机器语音,转换成更加流畅自然的语音,与人类声音之间的差异大幅降低,目前在鬼畜视频界做的风生水起。


而Lyrebird则更进一层,他可以基于音色、音调、音节、停顿等多种特征,来定义某个人的声音,然后生成更加拟真的声音。



对于骗子来说,完全可以通过骚扰电话录音来提取你的声音在Lyrebird上进行生成,从而可以完成把我们上面说的打电话验证真伪的这个过程给搞定。


声音靠不住了,那就只能靠脸了。


在接到骗子的语言诈骗微信消息的时候,反手就是一记视频通话,这样应该骗子就慌了。






其实不止声音可以伪造,现在连脸都可以通过AI来进行伪造了,比如前段时间在Reddit上大火的明星换头「成人短片」。


一个网名为deepfakes的程序员,他在业余时间用家里的电脑和开源的AI工具fakeapp,通过机器学习算法,成功移花接木,将神奇女侠女主角盖尔·加朵的脸移植到了一名成人女演员身上。



deepfakes此举一石激起千层浪,由于Fakeapp使用门槛极低,无需安装Python和Tensorflow等编程语言和开源软件库就能运行,甚至连高性能显卡都不用,完全可以租用谷歌的云GPU搞定。


一时间欧美各大女星的小电影充斥了整个社区,导致Reddit做出了紧急封杀处理,一群老司机就此做鸟兽散。


▲换脸原理


而比成人片更可怕的还是制造假新闻,在今年的4月份,就有人利用Fakeapp做出了一段假视频,在视频中美国前总统奥巴马对着镜头说出了一句令人震惊的话:「川普总统完全就是个笨蛋。」。


瞬间在美国造成了轰动的影响,大家在这场精心准备的玩笑中,发现了一个可怕的事实,那就是:我们已经进入了这样一个时代,我们的敌人可以做出看起来像任何人在任何时候说任何话的东西。


▲几乎以假乱真