知识提取技术助力生成AI成为领域专家
快速阅读: 探讨将深度领域知识融入AI和LLM的方法,通过知识提取技术,使AI成为特定领域的专家,如医学、法律等,强调人机协作的重要性及挑战。
创新并运用知识提取技术,将最佳实践和深入的专业领域知识融入生成式人工智能(AI)和大型语言模型(LLM)中。在今天的专栏中,我探讨了如何发现隐藏的最佳实践,这些实践构成了深厚专业知识的基础,并将其编码到现代生成式AI和大型语言模型中。
这一复杂问题的核心在于,我们可以借鉴在基于规则的专家系统时代已经成熟的知识提取原则。我意识到,一些专注于LLM的人可能会对使用早期AI时代的“过时”方法感到犹豫。尽管有人可能对所谓的GOFAI(良好的老式AI)持有负面看法,但在利用经过验证的技术来提取深度领域知识方面,绝对存在至关重要的价值。这有助于将生成式AI和LLM转变为某一选定领域的最佳实践和深度专业知识的堡垒。
假设你希望将LLM转化为某一特定领域的专家。例如,你可能想创建一个具有深刻医学专长的LLM,特别是在泌尿科或神经科方面特别熟练。另一种可能性是塑造生成式AI,使其在房地产法律方面达到合格律师的水平,或者成为精通认知行为疗法的心理健康治疗师。
通常的方法是收集尽可能多的涵盖所关注领域的文档。将内容数字化,然后将材料输入生成式AI。常用的一种注入技术是检索增强生成(RAG),即在运行时让AI对附加数据进行模式匹配,而不是在最初训练AI时就进行数据训练。关于RAG和其他类似技术的更多信息,请参阅相关链接。
当你可以获取到某领域已被编写的深度知识时,这一切都是好的。问题是,一个深度专业领域不一定所有知识都详细记录下来。那些在这个领域有丰富经验的人的头脑中,充满了各种人类制定的经验法则。可以说,某一领域的最佳实践的秘密往往被锁在那些深入该领域的人的大脑中。问题是如何将这些隐藏的最佳实践知识提取出来,使其具体化和可见,以便将其纳入到旨在该领域表现出色的LLM中。
随着基于知识系统的AI时代的到来,进行了大量的研究和实际实施,以开发领域知识提取技术。为了开发一个专家系统,你需要让专家们透露他们所知道的一切。他们会通过多年的试错,心理上形成许多行业的窍门。逐步地,你会与专家密切合作,让他们揭示他们的成熟经验法则。提取需要让他们谈论自己的专长。另一个途径是向他们提出要解决的问题,让他们写下解决问题所用的规则。各种巧妙的方法被设计出来,以揭示未在书籍和文章中找到的深度领域知识。
对于那些记得在生成式AI成为热门技术之前那段时间的人来说,当时有很多工作是在推进机器学习(ML)。正是在这次对ML的关注期间,研究人员开始意识到知识提取仍然应该处于AI发展的前沿。
确实,一篇研究论文对机器学习和知识提取的交织进行了宏观的审视,该论文由Daniel Kerrigan、Jessica Hullman和Enrico Bertini撰写,发表于《多模态技术和交互杂志》2021年,其中提到了以下关键观点(摘录):
“从领域专家那里提取知识可以在整个机器学习过程中发挥重要作用,从正确指定任务到评估模型结果。”
“将建模赋予领域知识——个人拥有的与特定领域相关的声明性、程序性和条件性信息——是一个常见的目标。”
我们的调查编码了28篇论文中发现的73条知识提取路径,并分析了这些路径在问题定义、特征工程、模型开发和模型评估时所呈现的趋势。
我将重点介绍如何结合生成式人工智能和大语言模型(LLM)快速适应特定领域,从而轻松利用知识提取。
案例研究:股票交易员
假设与一位成功的股票交易员交谈后,您认为将大语言模型调教成股票挑选领域的深度专家会很有帮助。
第一步是选择一个大语言模型,查看该模型在股票交易方面的已有训练情况。如果AI已经充分了解该领域并可直接使用,就没有必要重新发明轮子。我选择了OpenAI的热门产品ChatGPT来完成这个案例研究。虽然可以选择其他大语言模型,但我认为ChatGPT对我的读者来说是一个合适的选择。
通过与ChatGPT进行各种提示和对话,我确定了大量关于股票挑选的传统材料显然已在大语言模型的初始开发阶段被扫描。这非常有用。因为如果不是这样,你就需要从头开始让大语言模型熟悉你正在工作的领域。
从零开始可能会耗时且繁琐。然而,使用未深入了解目标领域的LLM也有其优势。
一旦开始提取最佳实践的隐性知识并将其输入AI,就有可能出现冲突。大语言模型已经对该领域有了一些预设模式,你可能需要与这些方面进行较量。选择不太熟悉目标领域的LLM与选择高度熟悉目标领域的LLM之间的权衡取决于你选择的领域以及希望使用的AI。
与股票交易员的知识提取
深入探讨ChatGPT关于股票挑选的信息后,我发现这位股票交易员的秘密武器尚未被AI掌握。这并不令人意外。这位交易员制定了自己的一套股票挑选规则,其他人未必知道或遵循这些规则。
我不是说他的规则独一无二,只是指出AI并未掌握这些规则,而大语言模型没有这些规则也不足为奇。由于篇幅限制,我只会展示其中几条规则。
我与他一起手动审查了许多他的股票选择,并共同探索了他的历史表现。我直接询问了他选择某只股票的原因,以及为什么不选择其他股票。这是进行知识提取的一种口头化或“大声说出”协议,它有自己的优点和缺点。
例如,当要求专家描述他们的操作时,他们可能会警惕,不愿意透露真实的做法。如果他们是凭直觉操作,这在他人面前显得不专业;他们不想被人嘲笑或指责。在这种情况下,专家可能会编造虚假的理由,告诉你这就是他们的工作方式。你可能会因此误信一些不真实的情况。
这往往是导致知识提取效果不佳,从而使专家系统无法达到领域专家水平的原因之一。提取的专长或规则往往是理性化的,并非专家真正遵循的方法。要谨慎,不要落入这种陷阱。
两条示例规则
以下是我能够揭示并验证确实由该股票交易员使用的两条规则:
收益动量规则
— 如果一家公司至少连续三个季度的收益增长,并且增长率在加速,除非市盈率(P/E)超过30,否则考虑买入。
板块轮动规则
— 如果资金流入某个特定板块(如科技、能源),并且该板块已连续两个月跑赢市场,除非宏观经济指标(如利率、通货膨胀)显示即将出现收缩,否则倾向于该板块内的股票。
我识别出了许多类似这两条规则的规则。
下一步是将这些规则输入到大语言模型中。
这是我使用的一个提示:
“你将成为一个拥有自己独特股票挑选规则的股票交易员。我将提供给你这些特殊规则。一旦我输入规则,请回应表示你已掌握这些规则并准备好使用它们。”
通过人类与AI的协作,可以有效地进行知识提取。例如,在股票交易领域,我首先与一位股票交易员进行了人对人的交流,收集了关于选股的各种规则。之后,我让AI与这位交易员进一步交流,以验证这些规则并寻找可能遗漏的规则。
在与交易员的深入对话中,AI发现了一条之前未被提及的新规则:
新规则:市场情绪规则
如果某只股票的社会和新闻情绪极为正面,且价格在一周内上涨超过10%,则至少在五个交易日内避免进入(可能是炒作周期)。
这条规则经过我的审查并与交易员讨论后,被认为合理并适合纳入规则集。
从整体上看,虽然可以完全依赖AI与专家的交流来开始整个知识提取过程,但我通常倾向于先进行人对人的交流。这样做有助于领域专家进入适当的状态,积极参与到知识提取的过程中来。随后,当专家与AI进行后续工作时,他们会非常高兴地看到自己的规则已经被准确地编码并反馈给他们。此外,AI往往能激发他们思考出更多的规则。
因此,尽管只选择一种途径可能会很诱人,但为了确保过程的智慧性和完整性,最好同时采取两种途径。如果领域专家在其工作中使用数据,另一个有用的步骤是收集相关数据,并让大型语言模型尝试从中检测模式,从而制定规则。
我收集了包括交易ID、交易日期、股票代码、交易行为、价格、每股收益增长率、市盈率、行业趋势、市场情绪、内部人士活动、市场指数等在内的数据,并指示AI进行以下操作:
“请检查以下数据,寻找与股票及其交易相关的模式。首先,尝试识别股票交易背后的潜在规则。其次,将这些规则与您已经通过知识提取获得的规则进行比较。第三,指出已有规则是否能够解释这些交易。第四,确定是否有其他规则可以进一步解释这些交易。”
AI提出了一条有趣的新规则:
新规则:止损纪律规则
如果股票价格下跌超过购买价格的8%,则无论未来前景如何,都应自动卖出。
我与交易员讨论了这条规则。起初,这条规则让人有些惊讶,因为交易员表示自己并不使用这一规则。但在仔细考虑并品鉴了一杯优质葡萄酒后,交易员认为这是一条值得采纳的规则,可以加入到规则集中。
通过这种方式,可以从选定领域的专家那里提取知识,为大型语言模型提供人类所持有的深度专业知识。在后续的讨论中,我将介绍如何测试这些规则,以及决定AI是否可以在该领域作为假定的专家。
关于这一话题,有一点转折需要提及。关于将大型语言模型(LLM)作为专家使用,通常称为“合成专家”,以区分由个人体现的专业知识与由人工智能体现的专业知识,存在大量争论。一种观点认为,除非达到通用人工智能(AGI),正如我在链接中讨论的那样,否则无论采取何种措施,都无法使AI达到人类专家的水平。
这引发了关于狭义智能与广义智能的经典问题,即是否可以在AI中实现一种狭义的“智能”形式,使其表现令人满意,还是必须同时具备广义智能。有观点认为,当前的大型语言模型确实具有一定的广义智能特征,因此是注入深度领域专业知识的好选择。然而,也有人持不同意见,坚持认为只有在实现AGI之后,这一前提条件才能得到充分满足。这是一个争议点。
与此同时,AI开发者们正在通过知识提取,努力将最佳实践和领域内的宝贵知识融入大型语言模型中。这项工作仍在继续,而辩论也在激烈地进行着。正如美国著名作家兼哲学家埃尔伯特·哈伯德所说:“明天做好工作的最佳准备就是今天做好工作。”让我们今天就利用AI做好工作,希望它能在未来的日子里带来更好的成果。
(以上内容均由Ai生成)