使用 AI 帮助将新闻转化为结构化数据

发布时间:2025年4月25日    来源:szf
使用 AI 帮助将新闻转化为结构化数据

快速阅读: 据《媒体作员》称,生成式AI能将新闻采访中的非结构化数据转化为结构化数据,从而开发高价位订阅产品。媒体公司可通过AI从访谈中提取更多有价值的信息,优化现有产品或创造新产品,实现多元化收入。例如,财经媒体可追踪大型投资机构的投资动向,《The Information》可自动更新科技公司组织架构图。这不仅能提升信息价值,还能增强竞争力。

新闻行业的一大问题就是我们从采访消息来源中收集了大量信息,然后发生两件事。首先,我们将部分信息以文章的形式呈现出来,这本质上是有限的。其次,剩余的大部分信息最终被丢弃在编辑那里。

只要新闻行业存在,这种情况就一直如此。然而,随着生成式人工智能的到来,现在有机会从所有这些信息中提取出更多的价值,可以转化为新的产品或增强现有产品。其关键原因在于,这是有史以来第一次,将难以整理的信息——如文章和访谈记录——转化为结构化数据变得成本效益高。

让我们暂停一下,定义这两个术语。

**结构化数据**:这是一种具有明确分类的数据。想象一下一张电子表格,列名清晰,然后按行填入数据。它易于浏览且可操作。

**非结构化数据**:这是一种没有分类的数据。其中包含大量的事实和信息,但未以可扫描或可操作的方式组织起来。

想想记者进行采访时的情景。他们提出许多问题,然后得到的回答可能冗长且偏离主题,与他们正在撰写的核心故事毫无关联。也许一个好的记者会回顾并识别出其他可以挖掘的线索,但不幸的是,大部分内容最终会被丢弃。

但如果相反,你将整个访谈记录输入自己的AI代理,并让它从头到尾分析呢?可以在每次采访结束时告诉它寻找特定类型的信息。结果将是将非结构化的访谈记录转化为结构化数据。

这个想法来自我最近与一位财经媒体从业者的交流。他说他们的许多读者关心的是为他人投资的人打算购买什么。所以,如果你是黑石集团(主要的私募股权公司),你会关心加州公务员退休系统(CalPERS)的投资主管在考虑投资什么。

也许当记者采访CalPERS的投资主管时,这是一个直接的问题。但也许不是。也许记者是在询问CalPERS对债券的兴趣,而投资主管说:“我们实际上正在考虑减少对私募股权的投资。” 这是一句话,可能根本不会出现在报道里,但这是一个数据点。可以将CalPERS作为一行数据加入电子表格,表示其正在考虑减少PE投资。

然后你可以使用相同的AI代理创建图表,显示CalPERS如何改变其投资策略,或者前十大养老金基金都在减少PE投资。如果你开始深入挖掘,潜力相当大。

然后是《The Information》。它以其展示科技巨头CEO们手下人员关系的组织架构图而闻名。虽然收集这些信息可能容易,但仍需要记者记住他们学到的上下级关系并更新相应的电子表格。借助AI,可以自动完成,让记者能够创建一个更详细的组织架构图。

AMO也有这种潜力。我们有一个私募股权数据库,试图追踪发生的交易。但我们并不总是记得更新它,可能会在采访中听到一些交易,但这些信息并未出现在报道中。通过AI,我们可以立即从采访中提取出最近完成的一笔交易。这对用户更好,也对我们更容易。

对于每一个存在的细分市场,在采访消息来源的过程中都可以找到非结构化数据,可以转化为结构化数据。但我们为什么在乎尝试让这些非结构化信息更加有序呢?

一个很大的原因是它能开发出高价位订阅产品的潜力。想想媒体公司和信息服务公司的订阅模式之间的区别。前者主要是销售实时的文章访问权限,后者则是销售数据访问权限。现实是,消费者和投资者通常更重视数据业务,而不是传统的媒体公司。

我不是建议媒体公司放弃核心模式。相反,正是作为新闻驱动型公司的能力使这种产品成为可能。只有优秀的记者才能从消息来源中获取优质信息。只是我们传递给读者的信息形式——文章——局限了我们。AI改变了这一点。

你可能开始调整记者提出的一些问题。所以,如果组织架构图是你标准的产品之一,也许你的记者会被要求问每个消息来源:“你向谁汇报工作?” 或“谁向你汇报工作?” 这会让采访延长30秒,但突然间,你能获得大量可整理的附加数据。

结果可能是一个多元收入来源的业务。也许有些信息是免费的,并通过广告盈利。然后是更高价格的订阅,覆盖所有文章。最后是超级高端的订阅,提供所有非文章形式的访谈结构化数据访问权限。一次访谈可以产生多个输出。这样就能让每一分钱花得更有意义。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日