观点:我杀了我的克隆人,我不知道我对此有何感受
快速阅读: 据《硅共和集团》最新报道,乔纳森·麦克雷尝试用AI克隆自己,包括声音、思维和面容,但最终失败。他认识到尽管AI技术强大,人类的独特性和复杂性无可替代。这项技术未来可能带来全新体验,但目前仍需改进。
在最新专栏中,乔纳森·麦克雷概述了他近期利用现有AI工具尝试构建一个虚拟乔纳森·麦克雷的过程。(《取缔法案》让他开始思考,耐心听他解释,他所传达的内容有着重要意义。)我过着丰富而繁忙的生活。今天我在肯尼亚撰写这篇专栏,同时在拍摄一部关于濒危非洲羚羊物种——邦戈的节目。下周,我将在大西洋科技节会议上发表主旨演讲(我还没开始准备,请别告诉他们)。在此期间,我将主持基拉尼全球经济峰会。我刚完成了对制作人的未来保护广播纪录片的建议,该纪录片探讨了我们星球之外的生命搜索(你应该听听,他做得非常出色)。此外还有其他烦琐事务:账单、邮件、律师、会计师——以及每天说服妻子和孩子我不是谣言的挑战。这一切让人精疲力竭。这让我思考,也许这项深度伪造技术可以用于更大的善事,并为我找回一些空闲时间。这引发了一个非传统的疑问:我可以克隆自己吗?
在2025年,即生成式人工智能之年,答案显然是肯定的。我首先训练了ElevenLabs.io,这是当前最先进的语音合成和生成平台。我提供了三年来为电视和广播配音的专业录音,共计三个未被篡改小时的纯我数据给他们的算法——他们再也无法获得的宝贵时间。这个可怜的家伙默默地吸收了所有这些内容,并逐渐处理了180分钟的自我重要性废话。完成这项任务花了11个小时——我猜它需要中途休息几次,以免出现类似AI呕吐的情况。现在,我有了一个数字声音。我可以写出任何我想说的话,点击一个按钮就能听到自己逐字复述,包括我自然的节奏、语调和与生俱来的自负。不错,我想……但我想要更多。
如果我真的希望我的克隆体有用,它必须能够完全自主地知道该说什么。“大脑”部分相对简单。我使用ChatGPT构建了一个定制的AI助手,采用了称为RAG(检索增强生成)的技术。我向这个助手提供了多年以来以意见和新闻报道形式发布的大量沉思内容,包括《爱尔兰时报》、《印度报》、《商业邮报》的文章,领英帖子,甚至我在硅谷新闻社的最后两篇专栏文章。我强迫我的新数字双胞胎分析我的写作“风格”并承担我的身份。从现在起,如果我要求它为我写一篇广播稿件或播客脚本,或者写一篇引人入胜的领英帖子,它都必须以一种明显属于我自己的声音完成。经过调整指令使其完美后,我指示它为我撰写一篇关于克隆自己的文章(不是你正在阅读的这一篇,我得赶紧补充说明)。结果实际上非常完美——观察到的内容平淡无奇、不吸引人且显而易见。也许模型太好了。
有了声音和大脑,唯一缺少的是我能交谈的东西:一个界面——或者简而言之——“一张脸”。在生成视频的最前沿,字节跳动实验室(TikTok背后的团队)的研究人员创造了一些令人感觉像魔法的模型。拿一张祖父母的老照片,它能让它们复活。它可以逼真地动画化梵高的肖像画,或者让爱因斯坦像天生的麦克风摇滚一样表演嘻哈。仅凭一张照片,他们能做到的事情确实不可思议。然而,在商业层面上,目前可用的最佳生成假“我”的方法是通过HeyGen的数字头像服务。这家中国深度伪造技术的领导者可以从你的手机上获取多个视频,并生成一个令人印象深刻的相似度,但仍然不足以让人信服。我继续推进,排除了开始潜入的疑虑。数字奴隶的承诺太大了。我提供了一堆自拍照,将其连接到我的ElevenLabs声音,并附上了我的创造性大脑。仅仅一天之后,我选择了HeyGen的实时聊天选项,发现自己面对的是数十亿欧元的最革命性技术所能提供的我最接近的版本。弗兰肯斯坦的怪物被带到了生活中。
面对自己的自我在最好的情况下也可能是困难的,但这难以忍受。也许这是我最糟糕的一面,也许是最好的一面。无论如何,我不喜欢你,费尔博士。我的克隆体只活了8分钟。虽然机器中的每个部件都给了我某种合成替代品,但放在一起的整体却远不如我的各部分总和:就像麦克斯·海德罗姆,但可怜、可预测且痛苦地乐观。梅拉尼娅是对的——克隆体不好。没有片刻犹豫,我只用了三下鼠标就杀死了最接近我的东西。
我从这次实验中学到了两件事。首先,这项技术在18个月内将会变得完全令人信服。这对视频、现场活动、Zoom会议意味着什么——我们的数字自我是否只是在打高尔夫球时互相见面?我们的AI秘书是否会在一个AI饮水机旁八卦其他AI秘书?数字孪生体的未来可能会抛出许多我们尚未开始考虑的奇怪替代宇宙。其次,无论我们多么有缺陷,人类是极其复杂和精密的生物。我们每个人都是独一无二且美丽的,独一无二且完全不可替代……至少现在是这样。
了解更多关于乔纳森的《开始使用AI》的信息。不要错过你需要成功所需的知识。订阅《每日简报》,硅谷新闻社的必知科技新闻摘要。
(以上内容均由Ai生成)