使用 AI 帮助将新闻转化为结构化数据
快速阅读: 据《媒体作员》称,生成式AI能将新闻采访中的非结构化数据转化为结构化数据,从而开发高价位订阅产品。媒体公司可通过AI从访谈中提取更多有价值的信息,优化现有产品或创造新产品,实现多元化收入。例如,财经媒体可追踪大型投资机构的投资动向,《The Information》可自动更新科技公司组织架构图。这不仅能提升信息价值,还能增强竞争力。
新闻行业的一大问题就是我们从采访消息来源中收集了大量信息,然后发生两件事。首先,我们将部分信息以文章的形式呈现出来,这本质上是有限的。其次,剩余的大部分信息最终被丢弃在编辑那里。
只要新闻行业存在,这种情况就一直如此。然而,随着生成式人工智能的到来,现在有机会从所有这些信息中提取出更多的价值,可以转化为新的产品或增强现有产品。其关键原因在于,这是有史以来第一次,将难以整理的信息——如文章和访谈记录——转化为结构化数据变得成本效益高。
让我们暂停一下,定义这两个术语。
**结构化数据**:这是一种具有明确分类的数据。想象一下一张电子表格,列名清晰,然后按行填入数据。它易于浏览且可操作。
**非结构化数据**:这是一种没有分类的数据。其中包含大量的事实和信息,但未以可扫描或可操作的方式组织起来。
想想记者进行采访时的情景。他们提出许多问题,然后得到的回答可能冗长且偏离主题,与他们正在撰写的核心故事毫无关联。也许一个好的记者会回顾并识别出其他可以挖掘的线索,但不幸的是,大部分内容最终会被丢弃。
但如果相反,你将整个访谈记录输入自己的AI代理,并让它从头到尾分析呢?可以在每次采访结束时告诉它寻找特定类型的信息。结果将是将非结构化的访谈记录转化为结构化数据。
这个想法来自我最近与一位财经媒体从业者的交流。他说他们的许多读者关心的是为他人投资的人打算购买什么。所以,如果你是黑石集团(主要的私募股权公司),你会关心加州公务员退休系统(CalPERS)的投资主管在考虑投资什么。
也许当记者采访CalPERS的投资主管时,这是一个直接的问题。但也许不是。也许记者是在询问CalPERS对债券的兴趣,而投资主管说:“我们实际上正在考虑减少对私募股权的投资。” 这是一句话,可能根本不会出现在报道里,但这是一个数据点。可以将CalPERS作为一行数据加入电子表格,表示其正在考虑减少PE投资。
然后你可以使用相同的AI代理创建图表,显示CalPERS如何改变其投资策略,或者前十大养老金基金都在减少PE投资。如果你开始深入挖掘,潜力相当大。
然后是《The Information》。它以其展示科技巨头CEO们手下人员关系的组织架构图而闻名。虽然收集这些信息可能容易,但仍需要记者记住他们学到的上下级关系并更新相应的电子表格。借助AI,可以自动完成,让记者能够创建一个更详细的组织架构图。
AMO也有这种潜力。我们有一个私募股权数据库,试图追踪发生的交易。但我们并不总是记得更新它,可能会在采访中听到一些交易,但这些信息并未出现在报道中。通过AI,我们可以立即从采访中提取出最近完成的一笔交易。这对用户更好,也对我们更容易。
对于每一个存在的细分市场,在采访消息来源的过程中都可以找到非结构化数据,可以转化为结构化数据。但我们为什么在乎尝试让这些非结构化信息更加有序呢?
一个很大的原因是它能开发出高价位订阅产品的潜力。想想媒体公司和信息服务公司的订阅模式之间的区别。前者主要是销售实时的文章访问权限,后者则是销售数据访问权限。现实是,消费者和投资者通常更重视数据业务,而不是传统的媒体公司。
我不是建议媒体公司放弃核心模式。相反,正是作为新闻驱动型公司的能力使这种产品成为可能。只有优秀的记者才能从消息来源中获取优质信息。只是我们传递给读者的信息形式——文章——局限了我们。AI改变了这一点。
你可能开始调整记者提出的一些问题。所以,如果组织架构图是你标准的产品之一,也许你的记者会被要求问每个消息来源:“你向谁汇报工作?” 或“谁向你汇报工作?” 这会让采访延长30秒,但突然间,你能获得大量可整理的附加数据。
结果可能是一个多元收入来源的业务。也许有些信息是免费的,并通过广告盈利。然后是更高价格的订阅,覆盖所有文章。最后是超级高端的订阅,提供所有非文章形式的访谈结构化数据访问权限。一次访谈可以产生多个输出。这样就能让每一分钱花得更有意义。
(以上内容均由Ai生成)