Hanley et al., 2025 | PNAS
在上一期推送中,我们介绍了卢樱丹老师一项关于国际信息流入中国社交媒体平台的研究,本期介绍的研究是卢樱丹老师在这一研究问题上的延续和扩展,重点关注在俄乌冲突这一案例上,外国媒体的报道是如何塑造中国社交媒体上的叙事的。
与传统传播学中关于「国际新闻流动」关注的特定新闻事件在不同新闻机构之间的引用和流动不同,近年来,以「叙事」为单位研究这种跨国家和平台的新闻、信息流动的研究越来越成为一种主要的研究视角(一个例子是之前关于「叙事相似性」的研究的介绍)。这种以「叙事」为单位的视角更能够说明更充分揭示信息在跨国家和跨平台传播中的意义建构过程,不仅关注信息是否被转引或再现,更强调不同主体在叙事建构中如何选择性地强调或省略要素,从而塑造对事件的理解。此外,这一视角也便于与当下兴起的大语言模型方法结合,使得研究者能够在大规模语料上对叙事进行更精确的测量与表示。
在本文中,叙事被定义为:由若干要素(如行动者、行为、事态发展)选择性地置于与其他要素的关系之中,这些关系往往暗含某种道德判断或预期结果,并为人们理解事件、概念与世界提供一套透视框架。叙事具有选择性,会省略部分要素并突出其他要素;同时又具有结构性,不同要素通过时间顺序或因果关系被组织起来。为了将这一概念操作化,若若干文本包含相同的核心要素(如特定命名实体、事件、地理焦点),并呈现出相同的明确或隐含关系,则可视为属于同一叙事。
中国国家媒体是否是微博用户获取涉外信息的主要「守门人」?
与中国、乌克兰或美国的新闻网站相比,俄罗斯新闻网站发表了更多与微博叙事相匹配的文章。相应地,微博上的叙事中,有相当大一部分最主要地与俄罗斯新闻网站相关,而与中国新闻网站最相关的叙事比例不足 10%。那些后来出现在微博上的叙事,更可能最初出现在俄罗斯新闻网站,而不是中国、乌克兰或美国网站。此外,俄罗斯网站对微博叙事的传播具有极高的影响力。总体而言,这些结果表明:中国官方媒体并不是微博用户获取有关俄罗斯入侵乌克兰信息的主要”守门人”。
研究团队收集了 43.5 万条微博(时间范围:2022 年 2 月 1 日至 4 月 19 日),这些微博均与”俄罗斯入侵乌克兰”相关,由经过人工标注数据微调的中文 BERT 模型自动识别。随后,我们将微博拆分为更小的文本片段,并将其转换为向量表示。在此基础上,我们应用改进版的 DP-Means 算法 对这些向量进行聚类。该过程将相似片段归为同一类叙事,并由人工审核者设定阈值,根据研究中对叙事的定义来判定哪些聚类可被视为叙事单元。
与此同时,研究者还建立了一个对照性的媒体语料库,涵盖 826 万篇新闻文章(时间范围:2022 年 1 月 1 日至 6 月 1 日),来源于 一万家最受欢迎的中国、俄罗斯、乌克兰、美国新闻网站,用来追踪微博叙事与不同媒体体系的关系。
1️⃣ 首先,我们识别出每个新闻生态系统中包含来自微博叙事的文章比例。我们将新闻文章拆分成较小的段落,并使用多语言 MPNet 为每个段落创建向量表示,再与微博段落进行比较。当一篇文章的向量表示与一条微博的向量表示相似时,它们可能具有不同的含义,尤其是在多语言环境中。为了解决这一问题,我们不仅依赖语义相似性,还通过训练三个双语 mDeBERTa 模型(中文–俄文、中文–乌克兰文、中文–英文),识别保持语义一致但用词和表述不同的”释义”关系。
2️⃣ 第二项分析估计了各个微博叙事与新闻生态系统之间的关联程度。我们使用逐点互信息(PMI)来衡量每个微博叙事与新闻生态系统的共现概率。对于每一个新闻生态系统与微博叙事的组合,我们计算一个 PMI 值。某一微博叙事与 PMI 值最大的新闻生态系统关联最强。
3️⃣ 在第三项分析中,我们识别每条微博叙事最早出现在四个新闻生态系统中的哪一个。具体方法是比较微博帖子与新闻文章的发布时间。如果最早的发布时间来自某个新闻生态系统的文章,则认为该生态系统是该叙事的”首次出现”;如果最早的时间来自微博帖子,则认为该叙事最早出现在微博。然而,这一分析未必能捕捉叙事的真正来源,因为它可能最初产生于线下,或者出现在我们未纳入分析的新闻生态系统中。
4️⃣ 最后,我们分析叙事随时间的传播,以理解各新闻网站与微博之间的关系,采用基于网络推断的方法。这项分析帮助我们估计每个新闻生态系统对微博叙事的整体”影响力”。这里的”影响力”指微博上的叙事被某个特定新闻网站复制的可能性。例如,如果在我们的数据集中,有若干叙事依次出现在今日俄罗斯(Russia Today,俄罗斯新闻网站)、布赖特巴特新闻(Breitbart News,美国新闻网站)、媒体ET,最后才出现在微博,那么该方法会表明媒体ET对微博的影响力更强,因为微博帖子在媒体ET文章之后立即出现。我们通过累加各新闻网站在微博上的加权边数,来估算每个新闻生态系统的总影响力。
我们在微博上识别出 2,183 条不同的叙事,每条叙事由至少五条独立信息组成。平均来看,这些叙事中有 95% 的信息在叙事首次出现后的 11.8 天内发布(中位数为 3 天)。每条叙事平均由 40 位用户分享(中位数为 12 位)。微博上最常出现的叙事涉及制裁对俄罗斯的影响,以及北约、欧盟和美国在冲突中的角色。图 1 展示了按发帖量排序的前十个叙事,并附有 Llama3 自动生成的摘要。
分析 1 发现,俄罗斯新闻生态系统中包含与微博叙事匹配的文章比例最高,并在俄军入侵当天达到峰值(图 2 红线)。中国新闻生态系统中此类文章的比例最低(图 2 黄线)。
尽管中国新闻生态系统中与微博叙事匹配的文章比例不是最高,但如果微博叙事与中国新闻生态的内容比与其他新闻生态更相似,它仍可能充当重要的”守门人”。然而,分析 2 显示情况并非如此。对微博叙事与新闻生态系统的关联性分析发现,37.1% 的微博叙事与俄罗斯新闻网站最相关,其次是乌克兰网站(35.0%)。仅 9.7% 的微博叙事与中国新闻网站最相关,18.3% 与美国新闻网站最相关(见表 1 第一行)。
分析 3 关于首次出现的结果显示,37.8% 的微博帖子包含的叙事最早出现在俄罗斯新闻网站,37.2% 最早出现在乌克兰网站,5.2% 出现在中国网站,19.1% 出现在美国网站(见表 1 第二行)。其余帖子包含的叙事在被我们分析的 10,000 个新闻网站报道之前,就已在微博上出现。最早出现在俄罗斯新闻网站并在微博上被大量讨论的叙事,往往是亲俄的,包括”美国资助乌克兰开发生物武器”的虚假说法、”俄罗斯摧毁大量乌军军事目标”的报道,以及”乌克兰腐败”的指控。相比之下,最早出现在乌克兰新闻网站的叙事多集中于战争进展,如”车臣武装加入冲突”和”乌克兰宣布进入全国紧急状态”。最早出现在美国新闻网站的热门叙事主要关注美国对乌克兰的军事援助。最早出现在中国媒体的叙事则突出中国提供人道主义援助、中国在冲突中保持中立角色,以及战争如何通过资本向西方流动使美国在与中国的竞争中占据优势。在四个新闻生态系统之外,最受欢迎的微博叙事是一系列调侃 2022 年冬奥会乌克兰运动员的笑话。
最后,分析 4 表明,俄罗斯网站贡献了微博上关于俄乌战争讨论中 78.0% 的外部影响力,其次是乌克兰网站(18.9%),美国网站(2.0%),以及中国网站(1.1%)(见表 1 最后一行)。
图 3 突出展示了对微博叙事影响力最大的具体网站,并按国家进行颜色区分。其中,gazeta.ru(俄罗斯最早的在线新闻媒体之一)影响力最大。外语内容通过多种方式进入微博,包括微博用户将内容翻译成中文,以及外国媒体直接在微博上发布中文内容。
文献来源: Hanley, H. W., Lu, Y., & Pan, J. (2025). Across the firewall: Foreign media’s role in shaping Chinese social media narratives on the Russo-Ukrainian War. Proceedings of the National Academy of Sciences, 122(1), e2420607122.
原文链接: 请点击左下方【阅读原文】