论文推荐 Vol. 22｜评论的审议质量对评论数量和质量的影响

New Media & Society

概要

新闻媒体社交媒体页面上的新闻帖子下方评论区，为用户参与和公共讨论提供了空间。然而，从协商讨论的规范性视角来看，用户评论往往质量不足。本文分析了 Facebook 用户评论的协商性特征，即互惠性、尊重性、理性和建设性，如何影响这些评论所获得的回复数量及其回复的协商质量。人工内容分析结果显示，顶层评论中的理性会增加其获得的回复数量；此外，顶层评论中的尊重性、理性和建设性，会提高回复中出现相应特征的可能性。研究发现支持了关于评论行为中卷入机制的假设，也说明社会规范理论适用于理解在线讨论。这些发现有助于我们理解协商性螺旋以及不文明螺旋的形成过程。

用户评论的审议质量

在研究用户评论质量时，学者们常常会参考协商民主的规范性理论（例如 Dahlberg, 2011; Esau et al., 2017；关于其他理论框架，见 Freelon, 2015）。协商民主这一概念（例如 Dryzek, 2000; Gutmann and Thompson, 1996; Habermas, 1996）包含这样一种观念：如果沟通遵循特定标准，就可能带来民主所期待的结果，例如达成共识性决策，或者至少形成有理由支撑的分歧、增加知识，并促进开放的心态（Mutz, 2008）。这些规范性标准有助于评价政治讨论的质量，也包括在线用户评论中的讨论质量。协商理论既包括较为经典的协商观，也包括更为扩展的协商观。尽管不同作者在具体理解上仍有差异，但许多持较经典协商观的学者都认为，协商性讨论应当具有互惠性（reciprocal）、尊重性（respectful）、理性（rational）和建设性（constructive）（Friess et al., 2021）。下面我们将简要区分这些标准，它们也将为下文的实证研究提供指导。

就互惠性（reciprocity）而言，参与协商性在线讨论的用户应当回应彼此的观点并参照彼此的发言（Graham and Witschge, 2003; Stromer-Galley, 2007）。这一点对于协商的认识功能至关重要，也有助于促进共情和相互理解（Barber, 1984）。它还与不同声音的包容性直接相关（Esau and Friess, 2022）。为了增强在线讨论中的互动，并使讨论串更有条理，大多数平台都会提供一些设计功能，使用户可以通过技术手段回复其他评论。这表明用户对某条评论存在一种基本程度的参与（同时也会影响平台的信息流展示算法）。然而，这并不必然意味着用户真正与其他参与者的发言内容发生了“实质性互动”（Trénel, 2004）。不同于单纯的技术性回复，具有互惠性的评论会指向其他用户的评论，回应这些用户或其发帖内容（例如 Stromer-Galley, 2007）。

虽然互惠性为协商奠定了基础，但参与者之间的这种社会互动本身，并不一定意味着它在协商的其他标准上具有较高质量（见 Esau and Friess, 2022 关于“协商性互惠”的讨论）。一方面，对其他参与者及其观点的相互承认，还必须确保倾听和互动是尊重性的（Barber, 1984）。一个被广泛使用的尊重指标是不存在不文明表达，尽管这显然只是最低标准。与此相一致，不文明可以被定义为“那些对讨论论坛、参与者或讨论主题传达出不必要的不尊重语气的讨论特征”（Coe et al., 2014: 660）。不文明可能表现为包含辱骂、脏话等不礼貌表达的陈述，也可能表现为“威胁民主、否认人们个人自由、并对社会群体进行刻板化描绘的行为”（Papacharissi, 2004: 267）。尊重，也就是说不出现不文明表达，是任何协商性在线讨论的基本组成部分，因为对共识的追求应当由更好论证的力量来推动，而不是通过对他人的不尊重性支配来实现。

此外，在协商性讨论中，观点不应只是被简单地提出，即使这些观点具有互惠性和尊重性，也仍然不够。它们还应当由理性的论证和解释来支持（Dahlberg, 2011; Stromer-Galley, 2007）。这是因为，只有这样的陈述才可能使参与者调整自己的观点，并最终达成共识（Habermas, 1996）。陈述中的理性包括提供额外知识，例如引用大众媒体文章和经验证据。它也可以包括个人经历，或者用来支持自身观点的论据（Burkhalter et al., 2002; Graham and Witschge, 2003; Stromer-Galley, 2007）。

为了确保讨论氛围具有生产性，所有发言还应当具有建设性。它们应当围绕最初引发讨论的话题展开。虽然讨论中可以引入其他相关话题，但一场富有成效的讨论最终仍然需要围绕原始问题交换理由和解决方案（Stromer-Galley, 2007）。如果参与者能够针对正在讨论的问题提出解决办法，这样的讨论也会从中受益（Burkhalter et al., 2002）。此外，用户也可以提出真诚的问题，以促进对共识的追求（Friess and Eilders, 2015; Stromer-Galley, 2007）。

评论对回复评论的影响

影响新闻条目下方评论数量及其协商质量的因素有很多。第一，平台设计和评论区结构会影响用户贡献的数量和质量。其中包括平台可供性（例如 Oz et al., 2018; Rossini, 2020）、匿名评论的可能性（Esau and Friess, 2022; Rösner and Krämer, 2016）、平台的管理风格（Stroud et al., 2015; Ziegele et al., 2018a）、异步评论机制，以及是否围绕清晰界定的话题展开讨论（Esau et al., 2017; Freelon, 2015; Peacock et al., 2019）。第二，评论的数量和质量也会受到讨论情境中较低层次、更加具体的情境因素的强烈影响（Beckert and Ziegele, 2020）。例如，涉及争议性议题的帖子（Tenenboim and Cohen, 2015），以及包含新闻价值因素的新闻条目，比如接近性、连续性、争议性和负面性（Weber, 2014; Ziegele et al., 2014），都会增加用户评论。一些新闻条目的特征还会刺激更多低质量评论的出现。例如，在政治新闻下方，往往会出现更多不文明评论（Coe et al., 2014; Stroud et al., 2015; Szabó et al., 2021）。此外，记者参与新闻条目下方评论串中的互动，也能够提升交流的协商质量（Ksiazek et al., 2016; Stroud et al., 2015; Ziegele et al., 2018a）。第三，某一新闻条目下方评论的数量和质量，也可能受到同一评论串中既有评论的影响。例如，已有评论中的讨论因素可能会影响后续评论（Ziegele et al., 2014）。因此，本文考察的是先前评论对后续评论的影响。具体而言，我们关注顶层评论的协商质量特征如何影响其回复的数量和协商质量。这里的顶层评论指一级评论，也就是直接位于新闻条目下方的评论；回复则指从属于这些顶层评论、以缩进形式呈现的评论。第四，评论者的人格特质以及其他属性也会影响评论质量（Beckert and Ziegele, 2020; Esau and Friess, 2022; Küchler et al., 2022）。

在下一节中，我们将讨论两种有助于理解顶层评论如何影响其回复的理论路径：一是顶层评论可能影响用户卷入程度，二是顶层评论可能在评论串中提示某种社会规范。

对回复评论数量的影响

用户评论的特征会影响用户的卷入程度（Ziegele and Quiring, 2013）。这里有两个相关的卷入维度（Perse, 1990）：认知卷入指个体由于接触到媒体中的新信息而激活自身知识，并将这些信息与自己的知识、价值观、兴趣和目标联系起来的一种状态。在本文语境中，这种新信息来自一条评论（Johnson and Eagly, 1989）。情感卷入则指个体对媒体内容的情绪性投入；在本文中，同样指个体对一条评论的情绪性投入。积极的情感卷入包括快乐、兴奋等内部状态；消极的情感卷入则包括愤怒、烦恼等状态（Berry and Hansen, 1996）。

认知卷入（Lasorsa, 1991）和情感卷入（Rimé, 2009; Shoemaker and Cohen, 2006）都可能增加人们参与人际传播的程度。与此一致，许多作者都讨论过，用户生成内容的特征可能会提高用户的卷入程度，并进而影响他们参与在线讨论的情况以及其发言质量。这意味着，用户评论中的协商性标准可能会提高用户的卷入程度，从而影响这些评论获得回复的数量。这里的回复数量被视为一种基本参与程度的指标，但它并不必然意味着用户真正以互惠的方式认真考虑了他人的观点，相关区分见上文。

互惠性评论会通过回应其他用户或其评论内容来指向其他用户的评论。首先，这应当会提高被回应用户的卷入程度。例如，当媒体用户感到自己处在一种社会互动之中时，他们会更加关注相关信息，并认为该信息与自己更加相关，从而提高其卷入程度。其次，互惠性也可以吸引第三方用户参与进来，尤其是那些认同被引用帖子中的价值观和态度，或者认为自己与被回应用户属于同一群体的用户（Bedijs, 2014; Hwang and Kim, 2016）。第三，对其他评论或用户的引用，即互惠性，会向读者表明这些评论对于一个更大的群体而言具有相关性，而不是一段孤立的自说自话。这应当会让读者产生更强的卷入感。第四，互惠性评论可能包含对先前评论的反对意见，而这种分歧表达又会提高用户对评论区的注意力，也就是提高认知卷入（Dutceac Segesten et al., 2022）。因此，互惠性评论更有可能提高用户的卷入程度，并进一步强化他们以回复形式表现出来的参与行为（Lasorsa, 1991; Rimé, 2009; Shoemaker and Cohen, 2006）。

H1. 具有互惠性的顶层评论比不具有互惠性的顶层评论获得更多回复。

此外，可以假定，尊重程度较低的评论会通过情感卷入机制刺激用户回应。例如，不文明评论可能威胁用户的信念和态度，引发消极情绪，并导致防御性回复（Borah, 2014）。在一项实验研究中，Ziegele et al.（2018c）发现，相比文明评论，用户更愿意回复不文明评论，并且这一机制是通过刺激消极情感卷入发挥作用的。面子理论也支持这一点。该理论认为，用户会将不文明的在线行为视为对其社会形象的威胁，由此产生消极情绪，并进行报复性回应（Chen, 2015）。不过也需要指出，一些实验研究发现，不文明评论对回复可能性具有负向影响，或者并没有影响（Han and Brazeal, 2015; Molina and Jennings, 2018; Naab, 2022）。然而，在一项内容分析中，Ziegele et al.（2014: Study 2）发现，攻击性评论会获得更多回应。

H2. 尊重性的顶层评论比不尊重的顶层评论获得更少回复。

以往研究较多关注用户评论中不文明表达的负面影响，但关于理性和建设性如何影响用户卷入以及回复数量的研究还远不充分。不过，具有信息性和有用性的内容会产生更强的认知卷入（Perse, 1990）。同样，高质量评论也可以刺激认知卷入。例如，研究发现，包含额外知识或问题的评论更能引发思考（Ruiz et al., 2011），从而提高用户的认知卷入。用户评论中的信息可能促使读者反思自己原先关于该话题的知识，并思考自己可以如何参与这场对话（Ziegele et al., 2014）。通过这一机制，与那些很少刺激认知卷入的评论相比，这类评论会提高读者回复的意愿（Ziegele et al., 2018c）。使用与满足取向的相关研究也支持这一点：理性和建设性的评论能够促使其他用户补充或纠正信息，并对先前评论进行平衡（Diakopoulos and Naaman, 2011）。

H3. 具有理性的顶层评论比不具有理性的顶层评论获得更多回复。

H4. 具有建设性的顶层评论比不具有建设性的顶层评论获得更多回复。

对回复评论审议质量的影响

认知卷入和情感卷入也有助于理解评论特征如何影响其回复。在实验研究中，理性和建设性的评论会带来更具协商性的回复，因为它们刺激了用户的精细加工过程，而这一过程随后会体现在更高质量的后续发言中（Beckert and Ziegele, 2020）。这意味着，更具互惠性、理性和建设性的评论，不仅会带来更多回复，也会使回复本身表现出更多互惠性、理性和建设性。其基本论点是，这类评论会促使用户更加深入地处理信息，从而产生更高质量的回复。目前，很少有研究区分评论特征对协商质量具体标准的影响，更多是将回复的整体协商性作为考察对象。不过，也有一些研究关注了尊重性回复的触发因素。例如，包含问题和额外知识的评论被发现较少引发不文明表达，因为认知卷入会抑制言语攻击（Ziegele et al., 2018c）。相反，不文明和偏离主题的评论可能触发消极的情感卷入，并通过这一机制促成低质量回复（Cheng et al., 2014; Lee, 2005; Papacharissi, 2004; Szabó et al., 2021; Ziegele et al., 2018c）。

社会规范理论也可以解释评论特征如何影响回复内容。社会规范这一概念有助于理解个体如何使自己的行为与他人的行为保持一致（Lapinski and Rimal, 2005）。规范可以被理解为个体关于“他人认为自己应该做什么”的认知（Cialdini and Goldstein, 2004）。当个体进入某种社会情境时，他们往往会寻找有关情境规范的线索。这些线索既可以包括某种行为在一个社会群体中被认为有多大程度上是可接受的，即命令性规范，也可以包括其他人有多频繁地从事这种行为，即描述性规范（Lapinski and Rimal, 2005）。规范能够引导行为，因为个体往往会遵从占主导地位的社会规范（Cialdini and Goldstein, 2004）。尤其是在他人正在观看的情境中，即使来自他人的社会制裁并不太可能发生，个体也会倾向于遵从社会规范（Lapinski and Rimal, 2005）。当个体认同某个参照群体时，社会影响会格外强烈（Turner, 1982）。不过，在计算机中介传播情境中，即使参与者匿名、彼此之间认同程度较低，社会影响也同样被观察到（Rösner and Krämer, 2016; Spears et al., 2011）。Sukumaran et al.（2011）认为，当社会情境较为模糊、传播对象也不确定时，例如在公共评论区中，被感知到的社会规范可能会对参与者行为产生特别强的影响。这意味着，顶层评论的协商质量可能会影响其子讨论串中后续回复的质量。回复者可能会根据顶层评论的质量，形成对评论区质量标准的感知，并倾向于在自己的发言中达到这一标准。

卷入和被感知到的社会规范都会影响社交媒体中的发帖行为（Park et al., 2011）。此外，描述性规范对行为的影响，在卷入程度较高的人群中更强；在这里，这种行为指的是协商性评论（Lapinski and Rimal, 2005）。这是因为，卷入会提高个体处理内容的动机，从而增强他们对描述性规范的感知能力（Kashima et al., 2013）。

关于描述性规范影响的证据，也就是顶层评论对子讨论串中评论的影响，已经在多项研究中出现。评论区中的高质量新闻从业者参与，能够提高后续评论的文明程度以及信源使用（Stroud et al., 2015）。在一项实验研究中，与看到较少思考性评论的参与者相比，看到高度思考性评论的参与者会发表更长、更聚焦于主题的回复，并花费更多时间来撰写评论。前一组参与者还预期，评论区中未来的评论会更加经过思考（Sukumaran et al., 2011）。与此同时，低质量评论也会带来更多低质量评论（Rösner and Krämer, 2016）。在少数针对非实验室评论空间的内容分析研究中，Friess et al.（2021）发现，更理性、更具建设性、较少不礼貌的评论，会收到协商质量更高的回复。

这些发现表明，协商质量的指标，也就是互惠性、尊重性、理性和建设性，应当能够激发更具协商性的子讨论串。不过，既有研究仍存在若干局限。首先，它们大多没有提供针对非实验室评论区中用户评论特征的内容分析证据，或者研究情境中包含了新闻从业者的参与。其次，既有研究往往只关注有限的一组协商指标，主要是尊重性或文明性，或者将多种协商质量指标合并为一个总体指数（例如 Friess et al., 2021）。一方面，这种做法是合理的，因为在线讨论需要同时满足所有标准，才可能接近协商的规范性理想。另一方面，这些指标仍然是彼此独立的维度，它们可以相互独立地出现。对这些维度进行分别测量和分析，可以使我们考察顶层评论中的哪一种特征会激发其子讨论串中的哪一种特征。这样能够为理解其背后的机制提供更细致的信息。

基于卷入理论和社会规范理论，本文提出以下假设，并将通过内容分析方法加以检验：

H5. 具有互惠性的顶层评论比不具有互惠性的顶层评论更有可能获得具有互惠性的回复。

H6. 具有尊重性的顶层评论比不具有尊重性的顶层评论更有可能获得具有尊重性的回复。

H7. 具有理性的顶层评论比不具有理性的顶层评论更有可能获得具有理性的回复。

H8. 具有建设性的顶层评论比不具有建设性的顶层评论更有可能获得具有建设性的回复。

数据和方法

数据

我们采用人工定量内容分析的方法，考察德国新闻媒体 Facebook 页面上的用户评论。之所以选择 Facebook，是因为在德国它是用户获取新闻并参与新闻评论时最常使用的社交媒体平台（Newman et al., 2020）。研究选取了当时德国影响力最大的 14 家新闻媒体。这些媒体都拥有自己的新闻生产能力，并且在 Facebook 上设有评论区。

在新闻帖子和评论样本方面，研究首先从这 14 家新闻媒体的 Facebook 页面中抽取新闻帖子。抽样时间为 2018 年连续七周中的一个“构造周”（artificial week）（Rössler, 2017）。随后，研究剔除了顶层评论少于 60 条的新闻帖子。对于剩余帖子，研究从每家媒体每天随机抽取一条新闻帖子，最终得到 97 条新闻帖子样本。随后，研究通过 Facebook Graph API，在每条新闻发布 7 天后，按照 Facebook 默认的评论排序方式，即“最相关”排序，收集这些帖子的全部评论及其元数据，例如发布时间、回复总数和点赞数。之后，研究选取每条新闻下方前 60 条评论进行人工编码。这 60 条评论包括顶层评论和回复评论。

编码审议质量

在编码阶段，研究由 6 名经过专门训练的研究助理对所有评论进行人工编码。编码指标见表 1。为了检验编码一致性，研究从完整数据集中随机抽取了 98 条评论进行互评一致性检验。作者同时使用百分比一致率和 Gwet’s AC1 系数来衡量信度（Gwet, 2008）。

具体来说，每条评论都被按照二分变量进行编码，即 0 表示该特征不存在，1 表示该特征存在。研究关注的协商质量指标包括互惠性、尊重性、理性和建设性。这些指标主要参考了既有关于在线协商和用户评论质量的研究（Coe et al., 2014; Friess et al., 2021; Graham and Witschge, 2003; Rowe, 2015; Stromer-Galley, 2007; Ziegele et al., 2018a）。其中，互惠性和尊重性都用单一指标来测量。总体来看，77% 的评论具有互惠性，共 4123 条。其中，顶层评论中只有 4% 具有互惠性，而回复评论中有 98.3% 具有互惠性。这一结果也比较符合平台结构，因为回复评论本身通常就是针对其他评论展开的。尊重性方面，71% 的评论被编码为尊重性评论，共 3818 条。其中，76.7% 的顶层评论具有尊重性，69.3% 的回复评论具有尊重性。理性则由四个指标构成，包括是否包含论证、额外知识、信息来源，或者个人经验。只要评论中至少包含其中一个指标，就被视为具有理性。在全部评论中，39.6% 的评论至少包含一个理性指标，共 2130 条。其中，顶层评论中这一比例为 43.5%，回复评论中为 38.4%。建设性同样采用综合指标来测量。具体来说，如果一条评论至少包含以下三个指标之一，就被视为具有建设性：与主题相关、提出解决方案，或者提出真诚的问题。在全部评论中，30.8% 的评论至少包含一个建设性指标，共 1658 条。其中，顶层评论中有 52.9% 具有建设性，而回复评论中只有 24.2% 具有建设性。

结果

H1 到 H4 考察的是：具有互惠性、尊重性、理性和建设性的顶层评论，是否会比不具备这些特征的评论获得更多回复。由于顶层评论位于第一层，新闻帖子位于第二层，也就是说，评论嵌套在新闻帖子之中，因此研究采用多层模型。虽然新闻帖子还进一步嵌套在不同媒体机构之中，但作者没有加入第三层媒体机构层级，因为样本中只有 14 家媒体，数量较少，可能导致估计结果出现偏误（Maas and Hox, 2005）。

因变量是“每条顶层评论获得的回复数量”，这是一个计数变量，而且存在大量零值。超过一半的顶层评论没有收到任何回复，比例为 51.9%。同时，这一因变量还存在过度离散问题：其标准差明显大于均值。具体而言，共分析了 1234 条顶层评论，平均回复数为 4.36，标准差为 12.26。因此，研究使用 R 包 NBZIMM 估计了多层零膨胀负二项回归模型（Zhang and Yi, 2020）。零膨胀负二项模型包含两部分：一部分使用逻辑回归模型预测零值，也就是某条顶层评论是否没有回复；另一部分使用负二项模型预测回复数量，包括在假定分布下通常会出现的零值。

研究首先计算了一个只包含多层结构的空模型，也就是只加入新闻帖子层面的随机效应。结果显示，组内相关系数为 ICC = .16。随后，研究将顶层评论的协商质量特征作为第一层预测变量加入模型。

表 2 中标为“No Replies”的部分是逻辑回归结果，显示顶层评论的不同协商特征如何影响其出现“过度零值”的可能性，也就是没有获得任何回复的可能性。结果显示，只有顶层评论的互惠性显著降低了没有回复的可能性。也就是说，当一条顶层评论提到了另一条评论的内容或作者时，它更不容易完全没有回复。相比之下，尊重性、理性和建设性都不能显著预测零回复。换言之，具有互惠性的顶层评论比不具有互惠性的顶层评论更有可能至少获得一些回复。虽然模型的这一部分不能直接用来确认或拒绝假设，但它仍然提供了关于回复数量影响因素的初步信息。

表 2 上半部分标为“Replies”的部分是负二项回归结果，用来说明哪些因素会影响子讨论串中的回复数量。结果显示，只有理性显著增加了每条顶层评论获得的回复数量。因此，H3 得到支持。也就是说，具有理性的顶层评论会比不具有理性的顶层评论获得更长的子讨论串，也就是更多技术意义上的回复。相比之下，互惠性、尊重性和建设性对回复数量没有显著影响，因此 H1、H2 和 H4 没有得到支持。

H5 到 H8 进一步考察的是：具有互惠性、尊重性、理性和建设性的顶层评论，是否会更可能获得具有相应特征的回复。为了检验这一点，研究在多层结构中加入了新的层级。此时，回复评论位于第一层，嵌套在顶层评论之下；顶层评论作为第二层单位，又嵌套在新闻帖子之下，新闻帖子则作为第三层单位。

研究分别建立了四个模型，依次以回复评论的互惠性、尊重性、理性和建设性作为因变量。由于这些因变量都是二分变量，例如 0 表示回复评论中没有互惠性，1 表示回复评论中存在互惠性，因此研究使用 R 包 lme4 估计了多层逻辑回归模型。四个空模型只包含多层结构，也就是顶层评论层面和新闻帖子层面的随机效应。对应的组内相关系数分别为：互惠性 ICC = .37，尊重性 ICC = .21，理性 ICC = .08，建设性 ICC = .17。之后，研究将顶层评论的互惠性、尊重性、理性和建设性作为第二层预测变量加入模型。

表 3 显示了预测回复评论互惠性的多层逻辑回归结果。结果表明，顶层评论的互惠性并不会影响其回复的互惠性。因此，H5 没有得到支持。不过，考虑到样本中回复评论的互惠性本身变异较小，这一结果并不意外。

相比之下，尊重性的顶层评论更有可能获得尊重性的回复。换句话说，带有不文明特征的顶层评论，更有可能在其子讨论串中收到不文明评论。表 4 的结果显示，在控制其他因素不变的情况下，如果一条回复出现在尊重性的顶层评论之下，那么它本身具有尊重性的可能性，比出现在不尊重的顶层评论之下高出约 70%。因此，H6 得到支持。

理性方面也出现了类似结果。表 5 显示，理性的顶层评论更有可能获得理性的回复。具体而言，如果一条回复出现在理性顶层评论之下，那么它本身具有理性的可能性，比出现在非理性顶层评论之下高出 51%。因此，H7 得到支持。

建设性的影响最为明显。表 6 显示，建设性的顶层评论更有可能获得建设性的回复。具体而言，回复一条建设性顶层评论时，该回复本身也具有建设性的可能性，是回复一条非建设性顶层评论时的 3.62 倍。因此，H8 得到支持。

最后，作者还进行了一个补充检验。4145 条回复中，有 811 条回复来自与顶层评论相同的作者，占 19.6%。这带来一个潜在问题：顶层评论质量与回复质量之间的关联，是否只是因为同一作者具有相似的写作风格，而不是因为回复者受到了描述性规范或卷入机制的影响？为了解决这个问题，作者进行了事后分析。他们只保留那些由不同作者发布的回复，再次估计四个多层逻辑回归模型。结果没有发生显著变化。这说明，顶层评论质量与回复质量之间的关系，并不能简单归因于同一作者的写作风格。

讨论

本文呈现了一项人工内容分析的结果，分析对象是德国 14 家主流新闻媒体在 Facebook 新闻帖子下方的用户评论。我们考察了顶层评论的协商性特征如何影响两个方面：（1）这些顶层评论获得的回复数量；（2）这些回复本身的协商质量。

就回复数量而言，结果显示，具有互惠性的顶层评论显著更不容易完全没有回复。这说明，当顶层评论直接回应其他用户或其他用户的评论时，后续评论者可能会认为这些评论与自己更相关，从而促使被回应的用户以及其他用户参与回复。相比之下，与不具备这些标准的顶层评论相比，具有理性、尊重性和建设性的顶层评论既没有更高、也没有更低的可能性获得至少一条回复。这意味着，除了引用其他用户或其评论之外，在顶层评论中使用协商性特征，并不会提高评论被注意到的可能性。

然而，当我们进一步考察顶层评论获得的回复数量时，只有顶层评论中的理性是一个显著预测因素。也就是说，顶层评论在多大程度上能够激发讨论，似乎主要取决于它是否具有理性。这说明，论证、信息来源、知识和个人经验都可能鼓励更多后续互动。理性的积极作用可能是因为，用户在阅读理性评论时会产生更强的认知卷入，而这进一步提高了他们回应的可能性（Ziegele et al., 2018c）。相较于互惠性、尊重性和建设性，理性论证似乎能够为用户提供更多思考材料，也更能激发后续参与。

与我们的预期相反，互惠性和建设性并没有影响回复数量。虽然引用他人可能足以避免完全没有回复，但互惠性本身可能并不足以开启一个包含大量用户互动的评论串。

本研究没有发现顶层评论的尊重性对回复数量具有显著影响。这与一些既有研究不同。不过需要注意的是，相关既有研究往往采用实验设计，而不是非实验室情境下的内容分析。缺乏尊重的表达可能会对某些用户产生足够强的情感卷入，并触发防御性回应；但对另一些用户而言，它也可能因为让人感到无力或希望回避冲突，而阻止他们参与在线争论。这提示我们，相关影响可能受到用户特征的调节，因为不同用户对不尊重性传播的敏感程度并不相同。此外，也可能是因为本研究将尊重性测量为“不存在不文明语气”，从而遮蔽了一些可能存在的影响。未来研究应当采用更加细致的测量方式，并区分不文明和不礼貌。

就回复的协商质量而言，多层逻辑回归模型显示，顶层评论中的尊重性、理性和建设性，都会显著提高这些特征出现在其子讨论串中的可能性。这支持了这样一种观点：协商性评论会提高读者的认知卷入，并促使他们以更经过思考的方式进行回复。不过，研究结果也显示，顶层评论中的某一项协商性标准，例如建设性，只会提高子讨论串中同一项标准出现的可能性。也就是说，建设性会带来更多建设性，而不是带来更多尊重性或理性。换言之，顶层评论中的不同协商性特征并不会“外溢”到其他协商性特征上。由此看来，发挥作用的机制未必一定是认知卷入。相反，一个更合理的解释是，用户会从顶层评论中感知到某种描述性规范，并在自己的回复中遵从这种规范。这一结果尤其重要，因为本研究是较早采用有理论基础的协商质量标准分类，并分别分析不同标准，而不是简单使用整体协商指数的研究之一。

在实践意义上，我们的研究结果支持所谓“协商性螺旋”（spiral of deliberativeness）（Friess et al., 2021）。也就是说，协商性评论可能会带来更多协商性评论。类似结果也可见于 Stroud et al.（2015）。对于评论区的运营者而言，介入在线讨论可能是有益的：传播高质量评论可能有助于激发一种协商性的讨论氛围。与此同时，考虑到用户会遵从被感知到的讨论规范，不尊重也可能带来更多不尊重，从而形成“不文明螺旋”（Papacharissi, 2004; Rösner and Krämer, 2016; Ziegele et al., 2018c）。这一点尤其值得警惕，因为不文明表达不仅会损害后续讨论的质量，也会对读者产生负面影响（Anderson et al., 2018; Ziegele et al., 2018b），并损害媒体机构的新闻可信度（Prochazka et al., 2018）。

局限与未来研究

本研究的结果需要结合若干局限来理解。首先，未来仍需要通过实验研究来检验卷入机制与被感知到的讨论规范这两种中介机制之间的差异。本文采用内容分析方法，提供了具有较强概括潜力的经验证据。这些发现可以补充既有实验研究和特定评论串内容分析研究的结果（Friess et al., 2021; Han and Brazeal, 2015; Molina and Jennings, 2018; Ziegele et al., 2018c）。

第二，本研究并不试图全面解释回复数量及其协商质量的所有决定因素。相反，它是少数专门关注顶层评论协商性特征影响的研究之一。这不可避免地导致模型解释的方差有限。不过，这种设计也使我们能够更细致地分析顶层评论中的特定特征，如何影响回复中同一特征的出现，而不是仅仅考察回复协商质量的总体指数。未来研究应当纳入更广泛的内容特征，例如更扩展的协商观中的标准，以及其他讨论因素。未来研究还应比较评论特征与个人用户层面、新闻帖子层面和媒体机构层面的预测因素之间的影响差异，相关近例可见 Esau and Friess（2022）。这也可能需要纳入更广泛的媒体机构样本，以及 Facebook 之外的其他平台。最重要的是，这将有助于探索不同因素之间的交互效应，并更全面地描绘影响评论的各种因素。

第三，本研究关注的是顶层评论与其子讨论串中回复评论之间的关系。这些回复并不一定直接回应顶层评论的作者或内容，也可能是在回应同一子讨论串中的另一条回复，前文已经提到这一点。除此之外，回复评论本身也可能描述某种规范、增强用户卷入，并由此改变后续回复，甚至改变后续其他顶层评论的协商质量。因此，未来研究应当更细致地考察这些动态过程。例如，研究可以分析早期回复如何影响同一新闻条目下方后续出现的顶层评论，或者如何影响同一子讨论串中的后续回复。这一点尤其重要，因为有些回复评论回应的并不是顶层评论，而是其他回复。因此，本研究发现的顶层评论特征对子讨论串中评论的影响，也可能是被中介的：也就是说，顶层评论先影响其直接回复，而这些直接回复再进一步影响后续回复。此类分析还需要考虑平台的算法化评论展示机制，因为算法会根据用户使用时间、个人使用行为以及平台社交网络，为不同用户呈现个性化的评论排序。

第四，在抽样过程中，我们部分依据受欢迎程度来选择帖子和评论。具体来说，研究只纳入至少有 60 条顶层评论的帖子，并且只选择按照 Facebook“最相关”排序排在前 60 位的评论。这一决定可能使样本中的帖子主题和评论特征产生偏差，例如更偏向政治性和争议性新闻主题。不过，由于 Facebook 的默认设置，样本中包含的这些评论也最有可能被评论区读者看到。因此，这些评论最有可能影响后续评论流。未来研究仍应更加细致地考察这类调节效应，以及评论串内部的动态过程。

原文信息

文献来源：Naab, T. K., Ruess, H. S., & Küchler, C. (2025). The influence of the deliberative quality of user comments on the number and quality of their reply comments. new media & society, 27(1), 62-83.