今年5月,某知名音乐人再次就AI合成声音冒充他本人一事发布声明,重申自己“并未营业”,提醒大家不要上当受骗。跳水运动员全红婵、“太乙真人”配音演员张珈铭等知名人士,同样深受AI声音克隆侵权的困扰。随着技术的进步,AI声音克隆日益泛滥。它不仅能生成逼真的声音,还能模仿人的各种情绪变化。而侵权成本低、举证难度大、维权成本高,让许多人选择息事宁人。近日,记者暗访AI声音克隆乱象,揭露“偷声术”的同时,也提醒更多人注意保护自己的专属声音。
10元买20秒,让“余华”替你代言6月2日,记者以“有声书推广”为由,在多家电商平台搜索“AI声音克隆”“音色复刻”等关键词,咨询了大量提供配音服务的线上店铺。询问后发现,这些服务的报价每分钟从10元到几百元不等。大多数店家表示,不仅能克隆用户自己的声音,也能帮忙提取“线上已有素材”中的声音进行克隆,其中便包括名人、明星。记者选择了一家报价较低的店铺“小小修图师”,花费10元下单了20秒的AI声音克隆服务,并将作家余华的一段公开访谈片段作为原始素材发给店家。店家没有核实记者身份,也未询问与余华的关系,更未提及任何授权问题。下单仅十几分钟后,店家便发回一个音频文件。点开一听,效果令人震惊——这段推荐图书的语音,声线、语调甚至独特的停顿节奏,都与余华本人高度相似。店家还“贴心”地询问:“你看这个像不像?如果不像还可以再做调整。”当记者追问“用余华老师的声音做商用,会不会有版权问题”时,店家说“没有考虑过版权的问题”,称客户既然有需要他们就做。不过对方紧接着话锋一转,向记者兜售起另一套“解决方案”。最终,记者又花费80元从这家店铺购买了一款所谓的“AI语音克隆软件”及其使用指导。令人颇感意外的是,店家所谓的“软件”并非什么复杂的程序,而是一个网址链接。记者打开这个网页后发现,它是一款功能强大的在线AI声音工具。上传目标声音样本进行“资料提炼”后,短短十几秒,网站后台便完成了“建模”。随后,在文字输入框中任意输入文本并点击播放,克隆出的“余华声音”就能立刻把文字念出来。更令人不安的是其精细的操控能力。记者发现,网站还内置了“情绪调节”功能。用户可以选择喜、怒、哀、惧等不同情绪模板,而生成的音频也会随之呈现出完全不同的情感色彩。这意味着,造假者不仅能伪造“余华说了什么”,还能精准地伪造他“说这句话时的情绪状态”。这已不是简单的语音合成,而是能操纵情感、制造更强欺骗效果的“深度伪造”,其潜在危害成倍上升。而这套工具的收费模式和生产效率同样触目惊心。网站实行充值消费,换算下来,使用成本约为每小时2元。而它的生产效率却高得惊人:以制作20秒的音频为例,从输入文字、选定情绪到生成,整个过程不到半分钟。这意味着,1小时就能批量生产出120条带有名人声音、饱含特定情绪的“代言”音频。这种几乎可以忽略不计的成本,让侵权行为变得更加廉价和便捷。
声音伪造工坊,在网线那头捉迷藏6月2日中午,记者以“给宠物餐盘做产品推广”为由,又联系了一家AI声音克隆网店“AIGC时代”。记者把一篇近500字的产品推广文案,以及从网上找来的语音辨识度很高的演员张铁林的12秒真人语音,发给店家。同样,店家没有任何询问,只是报了价格,“每200字1单、29.9元,你下3单就行。”3小时后,店家将制作好的音频发回给记者。记者试听后,发现克隆的声音和语气不仅逼真,而且干净,没有背景杂音。店家识别出了这个声音是张铁林的,主动说:“后期如果牵涉版权问题的话,我们不负责的哈。”“对你没有影响吧?”记者追问。“我们没啥的。跟您说过了就行。”店主回了一个“偷笑”的表情。6月3日上午,记者循着该网店的注册地址来到浙中某县,在一幢大厦的15楼找到了这家电商商行的注册地。但是,该处办公室却大门紧闭,触摸屏门锁怎么碰也没有反应。透过门缝,能看到里面有一套沙发、一张办公桌,桌子上放着两台电脑。记者询问附近办公室的人关于这家店的情况。对方说,不知道人在不在,他们平时没看到过有人进出。同一天,记者还在杭州寻找另一家从事声音克隆业务的数码店铺。循着平台上查到的注册地址赶到时,发现店铺地址所在地是一家银行。“我们这里根本没有数码店。”多名保安信誓旦旦地告诉记者。记者又向店主询问有没有线下门店,想要线下沟通。店主回答:“杭州没有哦,没有门店。”