为什么 AI 无法接管创意写作

快速阅读: 据《经济时报》最新报道，本文探讨了ChatGPT等大型语言模型在创造性写作中的应用与局限。尽管这些模型能生成看似智能的文本，但它们本质上是基于概率预测和对训练数据的重复利用，缺乏真正的人类创造力。作者强调理解模型工作原理有助于作家和教育者更好地利用AI工具，同时提醒人们警惕对其能力的过度期待。

简介
ChatGPT是一个从互联网海量文本中学习到的大规模语言模型（LLM）。它根据上下文（提示和之前生成的词）预测下一个词的概率。这个AI聊天机器人通过选择符合概率预测的下一个词来生成语言。可以将其想象成从帽子里抽取词语，预测概率较高的词会有更多副本在帽子里。ChatGPT生成的文本似乎很智能。

1948年，信息论创始人克劳德·香农提出了用句子中前一个词的概率来建模语言的概念。这类概率语言模型曾受到广泛质疑，其中最著名的批评来自语言学家诺姆·乔姆斯基：“‘句子的概率’这一概念完全是无用的。”在香农提出这一概念74年后，ChatGPT出现了，引起了公众的关注，甚至有人认为它是通往超人智能的门户。从香农的提议到ChatGPT的出现花了这么长时间，因为所需的大量数据和计算时间即使在几年前也是难以想象的。ChatGPT是一个从互联网海量文本中学习到的大规模语言模型（LLM）。它根据上下文（提示和之前生成的词）预测下一个词的概率。

ChatGPT使用该模型通过选择符合概率预测的下一个词来生成语言。可以将其想象成从帽子里抽取词语，预测概率较高的词会有更多副本在帽子里。ChatGPT生成的文本似乎很智能。关于这些工具如何帮助或阻碍学习和实践创造性写作存在很多争议。作为一名撰写过数百篇有关人工智能（AI）著作的计算机科学教授，包括涵盖大规模语言模型社会影响的AI教材，我认为理解模型的工作原理可以帮助作家和教育者考虑AI在所谓“创造性”写作中的局限性和潜在用途。

LLM作为随机性鹦鹉或剽窃者
发现你感兴趣的故事
区块链
5个故事
网络安全
7个故事
金融科技
9个故事
电子商务
9个故事
机器学习
8个故事
教育科技
6个故事

区分大型语言模型（LLM）的“创造力”与人类的创造力很重要。对于那些对计算机能生成的内容期望较低的人来说，很容易将创造力归因于计算机。其他人则持怀疑态度。认知科学家道格拉斯·霍夫施塔特认为“在其炫目表面之下隐藏着令人震惊的空洞”。语言学家艾米丽·本德及其同事将语言模型描述为随机性鹦鹉，意思是它们以随机的方式重复训练数据中的内容。为了理解这一点，请考虑为什么会产生某个特定的词。这是因为它的相对概率较高，而概率高是因为训练语料库中有大量文本在类似上下文中使用了这个词。根据概率分布选择一个词就像选择具有相似上下文的文本并使用其下一个词。从LLM生成文本可以被视为逐字剽窃。

人类的创造力
考虑一个有想法想要表达的人类的创造力。有了生成式AI，他们将自己的想法放入提示中，AI将生成文本（或图像或声音）。如果某人不关心生成的内容是什么，那么他们使用什么提示并不重要。但如果他们确实关心生成的内容呢？LLM尝试生成一个随机写过前文的人可能会产生的内容。大多数创意作家不想得到一个随机人会写的东西。他们想用自己的创造力，并可能需要一个工具来生成他们如果有足够时间就能写出的内容。LLM通常没有大量特定作者的作品语料库可供学习。作者无疑会想要创作出不同的内容。如果期望输出比输入更详细，LLM必须编造细节。这些可能符合也可能不符合作者的意图。

LLM在创造性写作中的某些积极用途
写作就像软件开发：给定想要的结果，软件开发人员产生代码（计算机语言中的文本），类似于作家在自然语言中产生文本的方式。LLM对编写代码和自然语言文本采取相同方式；每个LLM训练的语料库都包含自然语言和代码。结果取决于上下文。作家可以从软件开发人员的经验中学习。LLM对于以前由许多人完成的小型项目很有用，例如数据库查询或撰写标准信函。它们也适用于较大项目的部分，例如图形用户界面中的弹出框。如果程序员想用它们进行更大项目，就需要准备好生成多个输出并编辑最接近预期的那个。软件开发中的问题是精确指定想要的内容；编码是简单的部分。

生成好的提示
如何生成好的提示已被提倡为一种称为“提示工程”的艺术形式。提示工程的支持者建议了多种技术来改善当前LLM的输出，例如先要求一个大纲，然后基于原始提示加上大纲要求文本。另一种方法是要求LLM展示其推理步骤，如所谓的思维链。LLM不仅输出答案，还解释回答问题的步骤。LLM使用这些步骤作为提示的一部分来得出最终答案。这样的建议可能会很快过时。如果某种提示工程技巧有效，它将被纳入未来的LLM版本中，这样效果就会自动发生，无需显式使用该技巧。最近声称能够推理的模型已经整合了这种逐步提示。

人们想要相信
计算机科学家约瑟夫·维森鲍姆在描述他于1964-66年编写的ELIZA程序时说：“我惊讶地看到人们与（程序）交谈后变得多么迅速且深刻地对计算机产生情感依附，并且毫不含糊地赋予它人性。”工具虽然改变了，但人们仍然想要相信。在这个信息误导的时代，每个人都需要一种判断常常自夸的方法。生成式AI没有魔法，但它有大量的数据用于预测某人可能写什么。我希望创造力不仅仅是重复别人写过的内容。

了解更多关于LLM
AI创造性写作
AI新闻
ChatGPT
独家内容
投资理念
股票报告加
电子报
财富版
反败为胜：印度航空快运如何计划复制印航的成功
房地产股票因需求下降和供应过剩而下跌。投资REITs会有帮助吗？
印度对特朗普关税：我们担心吗？为什么？
BP合作关系能否为老化的ONGC井注入新活力？
印度面临重大健康保险难题
疫情期间被认为风险较高的这20只股票在5年内回报率高达近50倍

1
2
1
3
1

查看所有故事

(以上内容均由Ai生成)