5 个免费的开源数字工具来打击虚假信息
快速阅读: 《全球调查新闻网络》消息,五款巴西开发的开源工具助全球媒体打击假新闻。Capí是AI聊天机器人,核查工具监控健康广告,Mosaico转化文本为视频,“谁说的?”增强作者透明度,Xarta自动更新文章上下文。
五款免费开源数字工具,助力打击虚假信息
撰文 | 马塔·斯帕森科普夫,拉丁美洲新闻评论
为全球调查记者网络撰写 • 2025年5月21日
巴西新闻发展研究所(Projor)推出的打击虚假信息创新基金第二阶段(Codesinfo),重点推广五款由巴西媒体机构开发的开源数字工具,以强化对抗在线虚假信息的能力。这些解决方案于2024年底开发完成,可供全球任何新闻机构免费使用。
为了触及国际媒体,Projor运营总监兼Codesinfo协调员弗朗西斯科·贝尔达表示,Codesinfo网站正在翻译成英文和西班牙文,并且参与开发工具的媒体机构正在接受支持,以开展网络活动宣传这些解决方案。
“我们相信这五款工具能够提升公民新闻的整体能力,”贝尔达告诉拉丁美洲新闻评论(LJR)。他指出,这得益于它们在强调作者身份概念(“谁说的?”工具)、事实核查(核查工具)、环境与气候变化报道中的科学证据(Capí聊天机器人)、基于文本报告制作短视频(马赛克)、以及提供更新的背景信息(Xarta)方面的作用。”
**Capí:关于气候的可靠答案**
由环境媒体开发的Capí是一款人工智能聊天机器人,于2024年11月以测试版形式发布。该工具旨在为用户提供清晰、最新且可靠的气候问题解答。
“我们认为Capí可以在故事创作、报告审核或探索主题时提供帮助。”——环境媒体执行董事蒂亚戈·梅达利亚
“我创建气候聊天机器人的想法正是因为我意识到无论我们如何努力,这个话题仍然引发了很多疑问。我认为科学界在清晰传达数据方面存在困难,”环境媒体执行董事蒂亚戈·梅达利亚告诉LJR。“不仅仅是清晰度的问题,对吧?环境媒体的宗旨是将科学转化为易于理解、清晰且吸引人的新闻内容。”
Capí由一支多学科团队开发,包括工程师、记者、教育工作者和设计师。它使用一个受限数据库,其中包括环境媒体的报告和知名科学组织的文件。其主要来源包括联合国政府间气候变化专门委员会(IPCC)的报告,这是一个评估全球变暖、其影响及缓解策略的科学数据的机构。
“我们认为Capí可以在故事创作、报告审核或探索主题时提供帮助。例如:你正在处理一份提案并希望扩展内容,进行头脑风暴。Capí可以在这方面提供帮助,”梅达利亚说。
Capí背后的技术是谷歌开发的大规模语言模型(LLM)Gemini。为了高效地生成可靠回答,该工具采用了检索增强生成(RAG)技术,这种技术于2020年提出,旨在减少幻觉现象并根据特定用途对LLM进行上下文化。
Capí不会收集用户的个人数据,但通过一种称为提示调优的技术利用交互内容进行持续学习。聊天机器人的基础设施运行在特殊优化的Google Cloud服务器上,以减少能耗和二氧化碳排放量,符合工具的环保目标。
“Capí是一个测试版AI,所以她可能会产生幻觉并犯错,”梅达利亚说。“我们在网站上对此进行了说明。错误会被报告并纠正,但她使用的可靠来源是我们经过精心挑选和慎重考虑的。”
该工具的GitHub页面可通过链接访问,还有项目历史和系统架构。
**核查工具:监控医疗行业广告**
另一个在Codesinfo内开发的工具是核查工具,这是由事实核查网站Aos Fatos创建的一种解决方案,用于分析巴西主要新闻网站上的健康广告,这些广告可能包含误导性信息。
“该项目源于对主要新闻网站使用的原生广告平台缺乏监管的关注。这些工具利用新闻业的可信度来牟取虚假信息的利益——并且是在媒体公司的同意下进行的,”Aos Fatos创新总监布鲁诺·法维罗告诉LJR。
收集和分析广告的过程结合了自动化和人工分析。Aos Fatos团队创建了爬虫程序,每天访问主要门户网站并收集原生广告。然后他们使用语言模型对每个广告进行主题分类。最后,记者们使用Aos Fatos公开的事实核查方法(公开的)来分析这些广告,可验证的陈述会与原始资料、公共数据、可靠的研究或专家咨询进行比较,并给出评分。
该工具的代码是开放的,并在Aos Fatos的GitHub页面上发布,供感兴趣的记者和研究人员使用。工具的文档解释了如何调整代码以从其他网站收集广告。
“使用原生广告服务的新闻机构也可以使用核查工具来分析其发布的广告质量,并向平台施压以改善监管,”法维罗说。“尽管在巴西新闻工作的资金筹集极其困难,但我们不能让这种做法直接违背新闻职业存在的理由。”
**马赛克:将文本转化为视频**
Mosaico是由巴西主要报纸《Folha de São Paulo》开发的一个Python库,它利用人工智能将文本转换为短视频。基于流行的Python视频编辑库MoviePy构建,Mosaico提供了一个界面用于处理媒体资产、定位元素、应用效果以及生成视频脚本。
“这家报纸选择此方案应对假新闻挑战加剧的问题,在短视频消费大幅增长的情况下,”《Folha de São Paulo》的人工智能编辑达尼埃拉·布拉加告诉拉美新闻评论(LJR)。
根据布拉加的说法,Mosaico与其他自动视频解决方案的区别在于它是一个专有工具,内部维护,基于《Folha de São Paulo》自己的内容进行训练,并且是为了满足报纸的新闻质量参数和标准而开发的。
“视频的制作由《Folha de São Paulo》的记者监督,他们审查并批准最终结果。文字和图片均为真实内容。尽管已发布多篇视频报道,但其应用范围近期才逐步扩大,”布拉加说。
对于其他想要采用该工具的媒体机构,布拉加表示,由于GitHub上的存储库可用,可以根据特定需求定制工具。由于其为开源软件,开发者和记者可以贡献改进、修复漏洞及新增功能。
“这样,社区本身就可以推动工具的发展,”布拉加说。“这种自动化也加快了社交媒体上对短动态内容的需求响应速度,减少了对专门团队的需求。”
**谁说的?:关于作者身份的透明度**
由专注于南里奥格兰德州社区新闻的新闻机构《Folha do Mate》开发的插件“谁说的?”是一款受LinkedIn启发的WordPress扩展,它简化了构建和标准化记者档案的过程。
“通过透明化我们的工作流程、作者身份及信息来源,我们进一步巩固了对严肃新闻工作的承诺,并助力所在地区的持续发展,”Folha do Mate商业总监保拉·卡瓦略说道。
卡瓦略表示,该插件是Folha do Mate之前一系列旨在打击虚假信息的举措的延续。其他举措包括在学校举办新闻工作坊、关于虚假信息风险的教育测验以及对读者发送的新闻进行事实核查。
“‘谁说的?’插件的创建目的是突出文章作者的身份,重视信息源的可信度,并拉近记者与读者之间的距离,促进内容生产的更多责任感和清晰度,”卡瓦略说。
已有超过50年历史的《Folha do Mate》目前拥有大约4000名活跃订阅用户,卡瓦略指出。“这表明了一种稳固且值得信赖的关系。”
该插件仅限于WordPress平台使用,安装指南可在《Folha do Mate》官网及GitHub页面查阅。
**Xarta:始终最新的上下文**
Xarta是由Núcleo Jornalismo创建的一个系统,它通过在各种新闻报道中嵌入“可嵌入”的卡片来自动化给文章提供上下文的过程。Xarta还帮助防止被恶意使用的脱节内容。
Núcleo在2024年8月巴西封锁社交网络X时使用该工具的一个例子。团队没有为每篇关于该主题的文章创建和更新上下文,而是使用Xarta确保新文章具有最准确和最新的背景信息,同时即使旧文章也能始终保持最新。
“拥有现成的新闻背景信息能有效辅助我们的工作,加速新文章的发布速度,并确保上下文信息始终完整且最新,”Núcleo运营总监贾德·德拉蒙德告诉拉美新闻评论(LJR)。
“同时,我们注意到我们的观众数据显示,特定新闻事件的最新报道并不总是流量最高的文章。这些带有旧上下文的文章可能会被恶意使用,”贾德·德拉蒙德补充道。
这两项发现的结合促成了这个项目的诞生。我们创建了一个工具,使文本保持更长时间的更新,为新闻事件提供更好的上下文,并优化新闻编辑室的工作。
Drummond解释说,每个新闻编辑室都可以创建自己的Xarta,他们也可以使用Núcleo提供的某些嵌入式卡片,这些卡片可供其他媒体机构复制。
“我们有一些公共卡片,并允许通过知识共享许可4.0复制,只需访问卡片并找到包含嵌入代码的页面,复制后插入到文章中即可,”Drummond说,“所有创建Xarta的新闻编辑室均可自行决定是否允许复制生成的上下文卡片。”
(以上内容均由Ai生成)