2020年,AI对新闻业意味着什么?

36氪的朋友们 · 2020-02-11
数据具有强大的事实支撑作用,将减少虚假信息带来的视听混淆。

编者按:本文来自微信公众号传媒1号(ID:zcfhxy),36氪经授权发布。

译者 | 冯嘉欣

原文来源 | DEV

原文作者 | Carolyn

新闻业从传统印刷时代到互联网数字时代的转变,意味着技术在新闻业发展中的重要性日益显著。其中AI和机器学习是无法避免的两大浪潮。正如ICFJ奈特研究员Catherine Gicheru所说,「数据能帮助读者深度认知新闻事件及其影响。数据与传统的新闻报道方式的结合将以更具吸引力与创新性的方式向读者传达实时动态信息。除此之外,数据具有强大的事实支撑作用,将减少虚假信息带来的视听混淆。」近些年来,大量新闻编辑室正在逐步摸索AI和机器学习,力求将其应用于新闻实践中,这些技术实践对于技术与新闻业的融合而言是巨大的一步。

关键词:AI;机器学习;新闻工作者;新闻业

机器人

目前一些大型新闻编辑室已经开始将AI和机器学习投入实践。

首先是机器人。

《华盛顿邮报》拥有一项机器人报道程序「Heliograf」。在其投入使用的第一年就发表了约850篇文章,并因其在2016年美国大选报道中的突出贡献为《华盛顿邮报》荣获大奖。Heliograf报道的领域不限,包括里约奥运会(约300条简讯)、当地高中足球赛,以及国会选举等。与此同时,Heliograf还可以根据所报道的主题原创推文,将最新金融趋势和大数据报告给新闻工作者。

图片来源:Hackology

《福布斯》则采取了不同的方法。

2019年,《福布斯》推出了一个由内容管理系统驱动的新网站「Bertie」。Bertie是专为内部新闻编辑室与合作伙伴打造的AI内容发布平台。它能提供更具吸引力的标题,为故事内容匹配图片,评估阅读难度,自动生成推送摘要,并报告实时趋势以提供报道主题。

《洛杉矶时报》同样也在AI领域做了很多探索工作,其中「Quakebot」便是典型代表。

2014年洛杉矶发生大地震,《洛杉矶时报》是当时第一个对此进行报道的媒体。整个过程大概是「地震发生-记者清醒-走到电脑前-三分钟内发布新闻」,之所以能在三分钟内完成这篇报告,是因为Quakebot早已完成所有工作。

Quakebot的工作原理是,无论何时美国地质调查局发出的地震警报超过某个特定阈值,它将按照程序提取报告中的相关数据并将其填入预先编写好的模板中。之后编写好的新闻进入内容管理系统,由人工编辑进行审查和发布。

尽管Quakebot并非开源机器人,但其开发者说明了它包括编码示例在内的所有工作原理。除了Quakebot,《洛杉矶时报》还应用了一款能够收集洛杉矶每桩凶杀案信息的机器人。其报告中涵盖了大量数据,包括受害者的性别、种族、死亡原因、官员介入程度、邻居以及死亡年份。

图片来源:KPIX

《卫报》澳大利亚版也拥有一套名为「ReporterMate」的自动化系统。该系统于2019年初首次发布文章。它的工作原理与其他机器人类似,唯一不同的一点在于它是开源结构。

分析与预测

机器人并非AI对新闻业做出的唯一贡献。除此之外,AI还能剖析数据集、预测趋势并自动完成任务。

从Propublica对国会议员会议内容的分析中,这些功能得以凸显。Propublica整理过去两年里成千上万篇新闻稿,通过计算机模型提取出每位国会议员使用最频繁的短语,以此完成内容分析。

BuzzFeed也开发出一套计算机模型,但与Propublica的目的截然不同。他们专注于发现和跟踪秘密间谍飞机。该计算机模型采用机器学习的算法,对飞行模式类似于联邦调查局和国土安全部的飞机进行筛选。在该技术的支持下,BuzzFeed得以报道美国警官如何追捕墨西哥的毒枭头目,追踪非洲恐怖分子的军事承包商如何飞越美国大陆,以及空中侦察等话题。

图片来源:CSS-Tricks

此外,《纽约时报》使用AI和机器学习技术进行内容评论审核。

2017年,《纽约时报》仅有10%的文章开放了评论功能。尽管只有10%,审核人员每天也需要审查11000条评论,因此他们转向了AI将该工作自动化。具体而言,《纽约时报》采用了一种名为「Perspective」(来自Google的母公司Alphabet的技术孵化器)的工具进行大规模的评论审核。

Perspective API使用机器学习模型评估评论可能对对话产生的影响,以此判断评论是否存在危害性。在这之前《纽约时报》还曾采用The Coral Project的「Talk」工具处理这些危害性评论。这通过使用Perspective API创造了专用于新闻编辑室的定制化审核UI工具。

《纽约时报》和《连线杂志》都使用伦敦的Trint进行转录。Trint的最大卖点在于他们使用语音识别功能以多种语言转录采访内容。

而半岛电视台提出的概念,或许是介于两种技术之间的最令人期待的应用。2019年的半岛电视台媒体领袖未来峰会围绕在战区部署机器人记者的话题进行了讨论。具体而言,他们认为无人机能够飞入危险地带。峰会之后,半岛电视台开始采用机器人操控无人机战略。

在该案例中,半岛电视台显示机器人能够评估情况的危险性并能躲避狙击手的攻击。他们指出真人记者通常不会为这种类型的采访环境做培训准备,更不用说将普通人送到这些危险地区存在的伦理危机。

除了以上提到的这些,彭博社,路透社,美联社,雅虎等许多其他大型新闻服务机构也在采用这些技术。

推动媒体与技术融合:培训与关系网构建

也有一些组织致力于整合媒体与技术两大领域,并且集中火力专攻新闻业中的AI应用。

奈特基金会支持下的Quartz Ai工作室帮助记者如何在报道中使用机器学习技术。他们的工作中令人欣赏的一点在于他们重点关注如何使这些技术同样投入到小型媒体机构(比如职员或者特约记者较匮乏的地方性报社)的实践中。

图片来源:Google Design

Google则重点关注该主题下的两个领域。

其一是由Google「人+AI研究(PAIR)」项目开发的数据集可视化工具「Facets」,该工具为开源结构,因此任何人都可以利用它进行数据处理并以可视化的方式呈现信息。其二是于2018年底启动的「Google新闻计划」(更确切地说是AI新闻),这也是Google的关注核心。该计划是与伦敦政治经济学院的国际新闻智库Polis合作进行,旨在通过研究和培训帮助新闻行业以更新颖的方式使用AI。

Mozilla并不完全以AI为中心,但它也一直在推动技术与新闻行业之间的连接。它曾与奈特基金会、《纽约时报》《华盛顿邮报》以及其他的国际性新闻组织合作推动新闻领域的开放与创新。此外,Mozilla还启动了「OpenNews」之类的特殊项目,以建立开发人员、设计师、新闻记者、编辑之间的关系网,推动新闻领域的技术应用进程。该项目最初在Mozilla孵化。Mozilla还发起「信息信任倡议(MITI)」,通过开发产品、研究,培育社区,以及建立合作关系等一系列措施抗击假新闻,维护互联网健康可信的生态环境。

技术与新闻传统的冲突

比尔•科瓦齐(Bill Kovach)和汤姆•罗森斯蒂尔(Tom Rosenstiel)共同编写的《新闻的十大基本原则》一书中提到:「新闻应当成为独立的权力监督机构」,「为无声者发声」。新闻工作者的首要责任是保证事实真实性,公民只有当有切实可靠的信息来源时才能更好地做出决定。

图片来源:SlideShare

然而,在引进技术时,这些新闻原理与现实之间存在脱离。有趣的是,互联网和新闻业实际上在很多基本要素上相重叠。要使技术与新闻更好地融合,就必须完善问责机制。而目前还未形成该机制,尤其是对于AI和机器学习方面。

新闻业在从传统印刷时代向互联网时代的转变过程中,技术正在改变人们对新闻周期的认知。整个社会新闻消费的方式正在发生翻天覆地的变化,但有一点从未改变:所有的新闻都存在偏见。

过去,读者能清楚地认识到每一份报纸的倾向性,例如《卫报》左倾,《每日邮报》右倾。尽管如此,人们仍然会选择自己喜欢的报纸。如今,人们几乎不再看纸质报纸了,而转向了社交媒体或者新闻聚合平台之类的技术产品。但许多人对技术了解得不多以至于不清楚这些技术产品是如何向他们推送新闻的。更重要的是,技术产业与媒体之间缺乏沟通。

作为新闻的守门人,创作新闻内容的记者应该在该合作中处于核心地位,并在数据地基础上做出合乎新闻伦理的决策。对决策进行新闻伦理评估是新闻行业长期以来的规范。通常伦理准则来自组织内部或者职业记者协会等。

随着机器学习和AI进入新闻生产环节,传统的新闻伦理道德也需要得到重新审视。到目前为止,尚未存在涵盖新技术的行为准则。更多的只是指导如何掌握新技术,如何利用数据模型收集的信息。

图片来源:Futurism

内容创作者兼技术人员Latoya Peterson曾经写道:「新闻工作者得在AI对新闻编辑室乃至整个社会造成危害之前熟练地掌握它。」

她认为,要想熟练地掌握,新闻工作人员需要对AI运行的基本架构驾轻就熟,包括数据集的生成、使用,乃至对结果的影响。除此之外,Latoya还提到新闻工作者有必要了解偏差系统的深层含义。倘若新闻工作者不了解AI的工作原理,他们则更有可能错失重大事件或者过分渲染。当然,这里并非要求新闻工作者达到程序员一般的精通程度,仅仅了解开发人员如何处理这些问题便能加深系统构建与设计的过程。

对于新技术条件下的新闻学教育,部分大学已将计算机科学和新闻学合并,例如纽约市的哥伦比亚大学。「Google新闻计划」设有培训中心,为记者提供了关于Google产品和工具使用额40多个课程。但该课程的实际效用非常有限——许多记者要么无法接受到培训要么根本不知道它的存在。同时,新闻工作者是否应该公开数据源和应用的算法也存在伦理的考量。

AI对新闻工作者的未来意味着什么?

图片来源:Roland Berger

本着真正的技术精神,未来是开放式的。2018年11月,Mozilla基金会决定将其60%的互联网健康工作集中于「更好的机器决策」,其中也将重点关注媒体领域。「Google新闻计划」在2019年底发布有关媒体如何使用新技术以及如何进一步受益的全球调查报告。

据美联社的估计,AI能够帮助新闻工作者释放20%的时间,从而使他们有更多的时间和精力投身于内容创作中,而并非事实核查和行业研究。该占比只会越来越高,而这将有助于提高新闻质量水平。

1号结语

从各大新闻编辑室的技术实践来看,无论是机器人写作、算法分析与预测,还是机器内容审核、语音转录技术等,AI和机器学习在新闻业中的作用越来越突出。然而技术的引进并非顺水行舟——大量新闻工作人员不愿接受这些新技术甚至持恐惧态度。从新技术对传统新闻工作造成威胁的角度看,这种态度可以理解,但技术的发展已成事实,或许更重要的是克服恐惧或者排斥心理,逐步掌握甚至掌控新技术。

根据开放社会基金会「独立新闻项目」总负责人Maria Ronderos的说法,事实上这些技术是战友而非敌人。AI和机器学习将使新闻工作人员在数据的驱动下思考更全面,更好地报道这个全球化、信息丰富的世界,从而成长为更优秀的新闻人。

新技术固然在某些层面替代了新闻工作者,但这并不意味着技术对人的完全取代。新闻工作者的继续存在也是必要的。至少从理论上讲,人能够引导数据分析的方向。另外,计算机能够承接对人类而言枯燥无味的工作,从而为新闻工作者腾出更多的时间与精力完成更有意义的事情。

+1
3

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

关系网

i工作

蒂尔

飞行模式

水行舟

理道

下一篇

带货是网红+直播的最终目的

2020-02-11

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业