普利策奖背后的AI力量:获奖记者分享AI应用经验
- Andrew Deck
- 新闻业 , 人工智能 , 调查报道
- 2025年5月29日
【编者按】
本文转载自 Nieman Lab,深入探讨了2025年普利策奖获奖及入围作品中,记者们如何巧妙地运用人工智能技术来辅助他们的报道工作。
这些获得新闻界最高荣誉的报道所使用的AI,并非我们日常语境中常提及的生成式AI,而是更多地依赖于传统的机器学习技术。这些技术被记者们用于处理海量数据、识别图像模式、从复杂文档中提取信息以及转录音频等任务。
这揭示了AI在专业调查报道中的真正价值:它不是替代记者进行写作或分析,而是作为一种强大的工具,极大地提升了记者处理和理解复杂信息的能力,让他们能够挖掘出仅凭传统方法难以发现的真相。同时,文章也强调,无论技术如何发展,人工的审查、核实和深度分析仍然是确保报道准确性和深度的基石。
对于关注技术如何赋能新闻业的朋友来说,本文提供了多个具体的案例,展现了AI在顶尖新闻实践中的实际应用和潜力。
普利策奖连续第二年要求申请者披露人工智能的使用情况——今年有一位获奖者和三位入围者进行了披露。
一份关于埃隆·马斯克(Elon Musk)政治形象重塑的可视化报告。一项依赖于19世纪中期土地赠与的家谱调查。一项视觉取证分析,推翻了以色列军方关于杀害两名记者的说法。一项历时多年的调查,建立了一个关于美国警察使用“非致命武力”致死人员的新数据库。
5月5日,普利策奖在15个新闻类别中公布了其获奖者和入围者名单。普利策奖连续第二年要求参赛者披露是否使用了人工智能技术。上述这些故事,包括一个获奖作品和三个入围作品,都向评审委员会披露了人工智能的使用情况。
与去年的获奖者类似,生成式人工智能工具在这些披露中并不占主导地位。相反,我采访的参与这些报道的记者主要使用了在ChatGPT发布和大型语言模型(LLMs)兴起之前就已存在的机器学习技术。总体而言,今年使用的许多人工智能工具都将调查记者视为新闻编辑室中最早的采用者。
普利策奖管理员 Marjorie Miller 表示:“在当前这个早期阶段,我们认为负责任地使用人工智能是当今记者日益多样化的工具包中的一个重要组成部分。”她还提到了其他在获奖作品中体现的工具,包括统计分析、公共记录申请和视觉取证。“这项技术,在适当使用时,似乎能以十年前不可能的方式为项目增加敏捷性、深度和严谨性。”
去年,我采访了首批披露在工作中使用了人工智能的两位普利策奖得主。今年,普利策奖首次要求突发新闻摄影和专题摄影类别的参赛者提交原始相机记录文件(而不仅仅是截图)以及已发布的图片。
Miller 表示,这项新政策为这些类别的评委提供了“清晰的保管链”,并在人工智能操纵的辩论在新闻摄影领域兴起时生效。
去年,《华尔街日报》(The Wall Street Journal)着手将埃隆·马斯克(Elon Musk)在X(前身为Twitter)上的言论进行可视化。自2022年收购Twitter以来,马斯克越来越多地利用他的个人账户及其超过2亿的粉丝来推进他的政治议程。《华尔街日报》的报道捕捉到了这位亿万富翁在这段时间内如何重塑了他的在线形象。
《华尔街日报》的计算记者 John West 是对马斯克在X上的41,000多次互动进行分析的合作记者之一,他说:“尽管我心里隐约觉得我们会看到一些向政治方向的转变,但这种转变的鲜明程度确实让我感到惊讶。”这篇报道是关于马斯克政治影响力的几篇报道之一,为《华尔街日报》的团队赢得了今年的普利策国内报道奖。
《华尔街日报》首先使用了克莱姆森大学媒体取证中心提供的数据集,其中包括马斯克自2019年以来在X上的大部分帖子。经过一些调整和补充,West 和他的同事将这个数据集转换成向量,这是一种机器学习技术,为它们分配了数值。这个过程捕捉了X互动中的语义关系,并将它们放置在空间中。向量的可视化将关键词相似的帖子分组在一起形成簇,并显示出马斯克的言论随时间发生了变化。
West 说:“顶部都是关于移民、政治和更具分裂性的政治议题,底部则是表情包和特斯拉相关内容。”West 说:“这显示了他的言论在Twitter上如何从一个商业人士转变为一个政治人物。”
该报道没有使用生成式人工智能模型。相反,West 表示他们从谷歌的软件开发工具包(SDK)中提取了文本和图像嵌入模型——用于创建向量的模型。West 提到马斯克以在其账户上发布病毒式传播的表情包而闻名,他说:“我们想捕捉表情包的语义含义。”“图像嵌入模型现在非常强大。一年前我们还做不到这一点。”
普利策奖管理员 Miller 注意到了《华尔街日报》创新的可视化。“十年前,这可能是传播学和数字人文领域学者们相对晦涩的领域,”她说。但十年后,“这些工具可能会作为现成的产品供独立记者使用。”
然而,West 表示,即使向自己的父母解释,他也觉得很难阐明他在工作中使用的AI类型。“这不像我们把数据输入ChatGPT,”他说,这与我采访的其他普利策奖得主的评论相呼应。“人工智能已经成为生成式、Transformer模型的代名词。如果有一个词能区分‘生成式人工智能模型做了这件事’和‘更像机器学习的AI模型做了这件事’就好了。但我们目前还没有这种细微的区分。”
作为解释性报道的入围者,系列报道“40英亩与一个谎言”深入挖掘了重建时期的历史,揭露了“40英亩与一头骡子”政府项目的遗留问题。来自现已关闭的公共诚信中心(Center for Public Integrity)、Reveal 和 Mother Jones 的记者们识别出了一千多名内战后获得土地的曾被奴役的黑人男女,他们的土地在一年半内被剥夺。
该报道的主要记者之一 Alexia Fernández Campbell 表示:“[AI]工具帮助我们获取了信息,这些信息如果不是有无限的时间来查阅全部180万份数字化自由民局记录,我们是无法手动收集的。”
档案中的土地所有权文件没有索引或清晰标记,并且是用19世纪的斯宾塞体草书手写的。为了整理这些文件,计算记者 Pratheek Rebala 开发了一个定制的图像识别算法。他将团队已经识别出的土地所有权文件和土地登记册作为训练数据输入,然后使用生成的模型搜索了自由民局记录集的全部内容。
Fernández Campbell 说:“这次搜索比我手动找到的多了数百个名字和土地记录。”她之前已经对该记录集进行了广泛的研究。这种细致的档案研究与定制的人工智能检测工具相结合,使团队能够识别出大约500名额外获得土地赠与的曾被奴役的人。她说:“人工智能工具帮助我们扩大了项目的范围,并表明‘40英亩与一头骡子’项目影响的人比许多人意识到的要多。”
这些记录也是团队进行家谱调查的起点。他们追踪到了几位后代,并与他们交谈,了解了被剥夺的财产和继承权。
《华盛顿邮报》(The Washington Post)的视觉取证团队为了深入调查以色列军方为杀害加沙两名半岛电视台记者所做的辩解,仔细查看了致命袭击地点附近的无人机和卫星画面。这项工作是普利策奖国际报道类入围作品之一,其中包括咨询Preligens,这是一家使用物体检测模型识别卫星图像中军用车辆的地理空间人工智能公司。
以色列国防军(IDF)的说法是,他们袭击了一名“操作对以色列国防军构成威胁的飞行器的恐怖分子”。这次袭击导致 Hamza Dahdouh 和 Mustafa Thuraya 死亡,并导致另外两名巴勒斯坦自由记者受重伤。2024年1月7日,即袭击当天,Preligens 在记者所在位置10英里范围内没有发现任何军用车辆。这项分析证实了无人机画面显示的内容以及其他分析师告诉《华盛顿邮报》的信息:袭击发生时,现场没有对以色列国防军构成直接威胁。
大型新闻编辑室的视觉调查团队越来越多地使用人工智能模型分析卫星图像,特别是在加沙,以色列禁止大多数国际记者进入和进行实地报道。去年,我采访了《纽约时报》(The New York Times)一位获得普利策奖的计算记者,他使用物体检测模型分析加沙各地的弹坑形成情况,并帮助证明以色列国防军在被标记为平民安全区域使用了其最重型的武器。 《华盛顿邮报》以类似的方式使用了 Preligens 的模型,本质上是作为一个模式识别器,可以梳理大范围的图像。
2021年,即乔治·弗洛伊德(George Floyd)被谋杀的次年,美联社(The Associated Press)发起了一项调查,旨在了解美国有多少其他人死于执法人员,但并非使用枪支。政府往往未能正确记录和追踪这些死亡事件,这使得美联社面临着建立自己的“致命约束”案件全国数据库的艰巨任务。他们招募了合作者,包括马里兰大学的霍华德调查报道中心,该中心最终主导了调查中机器学习和人工智能工具的应用。
在三年多的时间里,报道调查报道类入围作品“致命约束”的团队收集了超过20万页的数字文件,包括法院文件、警方报告、尸检报告和死亡证明。许多文件是手写的或低质量的扫描件。光学字符识别(OCR),一种可以从文档图像中提取文本的过程,对于在这堆文件中找到关键信息至关重要。特别是像亚马逊Textract这样的工具,使得数千份文档对记者来说更易读、更易搜索。
霍华德中心的数据编辑 Sean Mussenden 在谈到他们使用OCR等机器学习工具时说:“我们寻找机会更有效地获取关键事实。”“它们对于构建核心数据库至关重要,而核心数据库对于每一篇报道都至关重要。”Mussenden 特别指出,机器学习如何帮助他们索引1000多起“致命约束”案件中的死亡方式和原因,这揭示了法医检查员的疏忽和偏见模式。
调查启动时,ChatGPT距离发布还有一年多时间,但随着更多生成式人工智能工具进入市场,霍华德中心的团队决定进行实验。Mussenden 说:“在生成式语言模型爆炸之前和之后都能进行这项工作,这真是令人难以置信。似乎每天都有新的模型或工具值得测试。”最值得注意的是,他的团队使用了Whisper,OpenAI 的语音识别模型,转录了他们收集的数百小时警方随身摄像机录像的音频,这些录像通常是通过公共记录申请获得的。
Mussenden 说:“我们从未直接发布这些模型的输出。它们被用作帮助记者更接近关键信息的工具,但有多层人工审查——包括严格的事实核查过程。”“迄今为止,最重要的报道方法是人工记者阅读和从文件中提取信息。”
作者:Andrew Deck 是 Nieman Lab 报道人工智能的特约撰稿人