68-语料库驱动的网络隐性仇恨言论的语用分析——以“专家建议”话题评论为例
Doi:doi.org/10.70693/rwsk.v1i2.539
——以“ 专家建议”话题评论为例
徐俊扬1
(暨南大学,广东 广州510632)
摘要:本文基于 KH coder 语料库工具的词汇共现网络功能和言语行为理论,对网络媒体中关于“ 专家建议”话题的 评论进行分析。研究发现网络隐性仇恨言论存在以谓词为驱动的表现方式,其语用功能的表现与谓词原来功能不一 致,从而隐性地达成了评论者的目的。
关键词: KH coder;仇恨言论;言语行为理论
一、研究背景
1.1 现实背景
2023年1月27日,联合国秘书长古特雷斯在纽 约联合国总部举行的国际大屠杀纪念日之际发表讲话,回顾了这段可怕的历史,并对当今世界现状表示担忧。他着重提到了“错误信息、偏执的阴谋论和不受控制的仇恨言论(Hate Speech)(Brown, 2017)”的猖獗,反犹太主义的兴起以及白人至上主义和新纳粹主义意识形态的扩散,世界必须对 "蛊惑人心 的仇恨声音 "保持警惕。同一天,在白宫举行的农历新年招待会上,针对最近在亚洲社区发生的两起 大规模枪击事件,美国总统拜登承认反亚裔仇恨犯罪的增加,并指出亚裔社区期间所经历的 "深刻的仇恨、痛苦、暴力和损失",此类犯罪部分是由与新冠状病毒流行有关的煽动性言论引起的。
可见,仇恨言论这一现象在国际社会深受重视 且具有极大的潜在危害:一方面,仇恨言论的发生促 使了暴力的煽动,多样性和社会凝聚力的破坏;另一方面,仇恨言论的发酵威胁到国际社会急需凝聚的共同价值观和原则。
近期,我国主流社交媒体——新浪微博关于“建 议专家不要建议”、“年轻人为什么不爱听专家建议”、“年轻人反感专家问题究竟出在哪”等话题走热,话题底下频频出现各种看似温和却令人寒心的评论,而这些“温和”的评论的点赞数和回复量都相对较高,这意味着我国网络仇恨言论现象也处于发酵状态。
1.2 网络仇恨言论研究回顾
近几年,关于网络仇恨言论的研究基本集中在 国外英文期刊的发表,主要分为宗教、人权、性别和政治四大类,不同类型的网络仇恨言论都带有其特有的 意 识 形 态 特 征 ,包 括 伊 斯 兰 恐 惧 症(Islamophobia)、另类右派(Alt-Right)和白人民族主义(White Nationalism)等(Castaño-Pulgarín et al., 2021)。在仇恨言论的表达上,Răileanu (2016)着手于宗教话题探讨仇恨言论发布者的言语特征以佐证当事人普遍与其他人存在对事件的不同看法,并且这种特立现象的表现会在社交网络上被放大。Sundén 和Paasonen (2018)在设身处地地观察和分析关于女性的网络仇恨言论后发现相关话语倾向于羞 辱 的表 达方 式。Trajkova和Neshkovska (2018)在研究出于政治目的的仇恨言论中发现事主偏好于扮演分析人员或是仲裁者来 表 达 负面 评 论 并 对 他 人 施 以 权 力和 支 配。He et al.(2021)收集不同种类的言 论 并 分 析 得 出 仇 恨 言 论 和 反 言 论 (Counterspeech)的相互关系,印证了反言论对减 少仇恨言论的积极效应。Parvaresh (2023) 通过大量语料的观察发现网络仇恨言论的形式和 意义都表现得比较隐晦,并根据语用功能来尝试对相关言论作具体分类以为后续研究其隐晦特征为参考。本研究基于前人的研究基础,以言语行为理论为指导,尝试对我国媒体相关语料做语料库数据整理和语用分析,并就相关现象提出菲薄见解。
二、研究设计
2.1 研究问题
本文考察我国主流社交媒体中相关话题的评 论并作语用分析,主要研讨以下三个问题: 1)网络隐性仇恨言论的相关表现形式及语义特征;2)相关话题中的网络仇恨言论者的具体攻击对象3)网络隐性仇恨言论行为的意义。
2.2 语料来源
哔哩哔哩弹幕网(Blibili),简称B站,是中国 的一个弹幕视频分享网站,其建立初衷为给用户提 供和谐而干净的弹幕视频分享平台。B站用户年龄 层主要集中在出生于1990-2009年区间的Z世代群体(Generation Z),青年用户倾向于依凭着匿名性、互动性极强的弹幕及评论功能达成情感认同(糜舒涵, 2020) 。为此,笔者选择收集该网站中两则视 频的一级评论作为语料制作语料库,视频分为1)央视网的2011年春晚相声《专家指导》建议专家们多看、2)央视网快看的央视网评为何年轻人越来越反感“专家”,经语料库工具识别共计2154条中文语料。
2.3 研究工具和理论
KH coder(樋口, 2016, 2017)是一款用于定量内 容分析和文本挖掘的免费软件,可对中文(简体中文)、法语、英语、日语等多种语言进行分析处理,并预置词性赋码和可视化数据分析功能,从形式和 意义上帮助我们做进一步的文本分析。其中共现网络图(Co-Occurrence Network)能根据Jaccard系数对词与词之间(根据词性划分不同 词类的词)关系及频率信息绘制图标,并根据不同 颜色划分相应的“关系社群”(subgraph)。
Searle在Austin所提出的言语行为三分说(顾曰国, 1989)的基础上进一步提出直接言语行为(Direct speech act)和间接言语行为(Indirect speech act)的区别。其中,直接言语行为即部分言语行为可直接实 现交际目的,而间接言语行为的交际目的需要通过另外一个言语行为表达时(何兆熊, 1984)。
在多语篇的具体分析过程中,一方面语料库语言性能提供自下而上的量化分析数据的视角,从而补足在文本纵深分析中的人工观察语料中存在的短板;另一方面,语用分析为量化研究所遗留的问题提供理论兜底和细化探究,进而高效地完成语篇分析目的。
三、研究过程
3.1 词汇共现网络分析
用KH coder语料库工具加载观察语料库,对语料库进行词性标记并生成词汇共现网络,如图1所示:
根据图1,围绕“专家”的关系群最多紧密,主要包括不、建议(Verb)、媒体、说、都,可以看出相关评论主要涉及专家的一些行为措施,并且“不” 与“专家”的关系比较密切,似乎表现出对“专家”的相关行为的持有否定态度较多,具体观察下如下关 系排名前三的索引行(concordance):
(1)“不”与“专家”的关联语境:
1)但很多媒体的专家没加名字,也不知道是 哪个专家,或者就是几句话,专家是流量的代名词。
2)专不专家的我分得清,相比起来我更关心 春晚节目能不能按这个水平(对“专家建议”的讽刺性话题内容)办。
3)专家建议: 以后自媒体的标题不要使用“专家建议”。
4) (专家的相关事务)我根本不管,相声界各种什么争来争去的,跟我没一毛钱关系,我只想看到好节目。
5)这是一个我认为很复杂的,需要双向努力 的问题。有时候不是专家的问题
从中可以观察到,“不”在整体的语境中表现出 消极的语义韵(Sinclair, 2004: 34),对“专家”的身份、 建议、责任等相关事项存在怀疑和不确定,而这种所谓“怀疑和不确定”的模糊性概述似乎又藏有更深 层次的语用表达。令人欣慰的是,其中部分评论也 用“不”来表达出视频内容的理性存疑,从中也可发 现与之相符的语义表达,如“需要双向努力” ,体现 出对“专家”现实表现抱有期待的语义倾向(甄凤超, 2022)。
图 1 观察语料库的词汇共现网络图
注:图片中的横线颜色深浅代表关联强弱程度,深为强,浅为弱;图片中的圆的大小代词频高低,大为高,小为低(不包括最小的圆的词频比较),不同颜色的圆代表不同的关系群(subgraph)。
(2)“建议(Verb)”与“专家”的关联语境:
1)你是不是上错号了(指官方媒体所播放的 内容与日常内容主题不一致的现象,即对“专家建议” 话题的讽刺视频),那些专家建议有一半都是你发的,左右互搏流量吃的饱饱的
2)建议辞典里取消专家二字, 以后直接用本名
3)建议专家们多看看2011兔年春晚相声《专家指导》(对“专家建议”的讽刺性话题视频),重 温经典,建议专家不要再建议。
4)近期那些离谱的“专家建议”大多都是媒体断章取义 … …
5)不是不要专家指导,是建议不要那么多伪专家!
从关联索引行能察觉出,“建议”周围的语境辐 射出来的大多呈现出消极的语义韵,即对“建议”的 否定和批判等相关态度,而2)、3) 中的“建议”在语境中似乎表现出与语境外(汉语词典)中的“建议” 中阐述出来的态度不一致,这与5)中的“建议”的语用表达好像有点偏差。
(3)“媒体”与“专家”的关联语境:
1)但是,专家说的话很多时候的确被各种媒体肢解得支离破碎,受众得到的都是碎片。
2)很多头衔都不是国家和国际的更像是自己编的,而且网上还有很多自媒体自称“专家”。
3)专家现在在大众眼里这么不靠谱,和断章取义的媒体也有很大关系
4)其实不一定是专家,现在自媒体随便说句话,就被传成专家
5)我提议以后以后自媒体引用专家的话时,必须做应用出处注释,否则一律按照谣言不过审
显然,在关联“媒体”和“专家”的相关语境中呈 现的语义倾向多数指向对“媒体”的任意妄为的批评, 如“肢解得支离破碎” 、“自称” 、“随便说句话”等,
中间的“媒体”与“专家”似乎本就是对“矛盾” ,两者 所传达的或其利益所向彷佛对不上。再回到图1中 找到“媒体”,其词汇共现关系中相邻的就是“断章取 义”,那么与“媒体”矛盾的“专家”的语境义似乎与其语境外(词典)的本义相匹配了,即群众对专家的 认可语义表达。
3.2 语用分析
经过上述“专家”的词汇关联网络整理和具体语 境分析可以简单看出多数评论者对“专家建议”话题 的大致看法和态度倾向,但其中还存在部分意思模 糊的表达需要深入话语内容进行剖析。我们抽取从 上述分析中存惑的话语:
(1)建议专家们多看看2011兔年春晚相声《专家指导》(对“专家建议”的讽刺性话题视频),重 温经典,建议专家不要再建议。
句子中的“建议(Verb)”所显现的语义与具体的语用功能相斥,“建议”的本义是针对一个人或事 件提出自身合理的见解或意见,使其向着更积极的 方向发展,其语用功能是积极的,而这里第一个“建 议”是让受事者去接受一个对其自身影响不好的事物——讽刺性话题视频,这明显与“建议”的出发点 相违背。第二个“建议”出现在第三个“建议”之前, “专家”是第二“建议”的受事者,按照“建议”原来的 语用功能解释——“不要再建议”是评论者对受事者 “向积极方向发展”的驱动,而第三个“建议”所驱动 的成分本应也是积极的,而“不要再建议”明显否定 了第二个“建议”所带来“积极方向”的驱动的解析, 因此第二个和第三个“建议”所呈现的语义与其原本 的语用功能也是相斥的。可见,整段话语所呈现的 是话语的间接引语功能,评论者通过这种“违背”话 语规则的表达方式间接地表达出对专家建议的讽 刺和专家身份的贬毁,属于仇恨言论的隐性表达。
(2)专不专家的我分得清,相比起来我更关心春晚节目能不能按这个水平(对“专家建议”的讽 刺性话题内容)办。
此处从谓词“分”(区分) 、“关心”和“办”(举办)来探讨,“分”所引导的小句呈现的语义是对“专 家身份的真伪”的了悟,功能是推动话语向进一步话 题发展或避谈相似话题,体现评论者对“专家身份的 真伪”话题的冷漠态度。“关心”的施事对象是春晚节 目,并且评论者对春晚节目的愿望是按“这个水平” 举办,而材料中的“水平”是 “专家建议”的讽刺性内 容的表现方式,体现了对这类话题的娱乐性的赞誉, 语用功能是表达对相关话题内容的肯定的态度。该 则评论中两个小句通过呈现的相反语用功能表达 了对专家身份的漠不关心,而对讽刺专家话题的内 容报以热忱,间接表明了评论者对专家的冷嘲热讽,同样属于隐性仇恨言论的表达方式。
四、总结
本研究以使用了语料库工具中的词汇共现网络以分析网络仇恨言论的基本表现方式和具体目的,并结合言语行为理论对话语的表层和深层语义语用价值做进一步的剖析,发现其中存在着仇恨言 论的隐性表达,回答了本文所提出的三个问题:
(1) 网络隐性仇恨言论的表现形式存在以谓词为驱动推动话语表现具体语用功能的趋向,语义 特征多数表现为具体语境内的谓词语义与谓词原有语义发生偏差。
(2)相关话题中的网络仇恨言论者的具体攻击对象一般为话题对象,但也存在与其关联的其他 对象,比如词汇共现网络中的“媒体”也被予以攻击对象的身份。
(3) 网络隐性仇恨言论行为的意义是根据其 话语的语用功能所驱动的,大多评论者都是对目标 对象进行“攻击”行为,这种行为的表现在很大程度释放了评论者的情绪,从而引起媒体及社会层面的关注,推动更进一步的发酵反应。
本文所搜集的语料是来自官方媒体账号的视频评论,相较于其他评论渠道,该渠道对于评论中带有的“攻击性”的评论包容度较低,因此其自身普遍带有攻击性言论的自动或人工的筛选过滤机制,除去了大多与仇恨言论相关的评论内容,但本研究 通过语料库数据整理和语用分析发现其中仍有一些“温和”的仇恨言论。笔者认为,这种隐性仇恨言论现象的发生也表明了在“讲文明,树新风”的背景下仇恨言论在发酵的同时也发生了演化,评论者在释放情绪的过程中以隐性的表达方式有效地过渡到大多官方正式媒体平台。对于这种转变,笔者建议应当加大相关规定限制。虽然不否认互联网确实需要一定程度的包容性,但长时间的隐性仇恨言论 的发酵和演化可能会产生新的不可控因素,对于这 样的不可控因素,相关机构应该提前做好引导和控 制以建立良性、可持续发展的网络文明生态。
参考文献:
[1] Brown, A.(2017).What is hate speech? Part 1: The Myth of Hate.Law and Philosophy, 36(4), 419–468.https://doi.org/10.1007/s10982-017-9297-1
[2] Castaño-Pulgarín, S.A., Suárez-Betancur, N., Vega, L.M.T., & López, H.M.H.(2021).Internet, social media and online hate speech.Systematic review.Aggression and Violent Behavior,58,101608.https://doi.org/10.1016/j.avb.2021.101608
[3] Răileanu, R.C.(2016).Religion-Based User Generated Content in Online Newspapers Covering the Colectiv Nightclub Fire.Romanian Journal of Communication and Public Relations, 18(2), 55.https://doi.org/10.21018/rjcpr.2016.2.2090
[4] Sundén, J., & Paasonen, S.(2018).Shameless hags and tolerance whores: Feminist resistance and the affective circuits of online hate.Feminist Media Studies, 18(4), 643–656.https://doi.org/10.1080/14680777.2018.1447427
[5] Trajkova, Z., & Neshkovska, S.(2018).Online hate propaganda during election period: The case of Macedonia.Lodz Papers in Pragmatics, 14(2), 309–334.https://doi.org/10.1515/lpp-2018-0015
[6] He, B., Ziems, C., Soni, S., Ramakrishnan, N., Yang, D., & Kumar, S.(2021).Racism is a virus: Anti-asian hate and counterspeech in social media during the COVID-19 crisis.Proceedings of the 2021 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, 90–94.https://doi.org/10.1145/3487351.3488324
[7] Parvaresh, V.(2023).Covertly communicated hate speech: A corpus-assisted pragmatic study.Journal of Pragmatics, 205, 63–77.https://doi.org/10. 1016/j.pragma.2022. 12.009
[8] 糜舒涵. (2020). 新媒体环境下的青年亚文化狂欢—— 以哔哩哔哩弹幕网为例. 传媒论坛(10), 157-158.
[9] 樋口耕一. (2016). A Two-Step Approach to Quantitative Content Analysis: KH Coder Tutorial using Anne of Green Gables (Part I). 立命館産業社会論集 = Ritsumeikan Social Sciences Review, 52(3), 77–91.
[10] 樋口耕一. (2017). A Two-Step Approach to Quantitative Content Analysis: KH Coder Tutorial Using Anne ofGreen Gables (Part II). 立 命 館 産 業 社 会 論 集 = Ritsumeikan Social Sciences Review, 53(1), 137–147.
[11] 顾曰国. (1989). 奥斯汀的言语行为理论:诠释与批判. 外语 教 学 与研 究 , (1), pp. 30-39, 80. https://kns. cnki. net/kcms/detail/detail.aspx?dbname=cjfd1989&filename=WJYY198901014&db code=cjfd.
[12] 何兆熊. (1984). 英语语言的间接性. 外国语(上海外国 语 学 院 学 报 ), (3), pp. 11-15. https://kns.cnki.net/kcms/detail/detail.aspx?dbname=CJFD1984&filename=WYXY198403002& dbcode=CJFD.
[13] Sinclair, J.(2004).Trust the Text: Language, Corpus and Discourse (R.Carter,编).Routledge, 34.https://doi.org/10.4324/9780203594070
[14] 甄凤超. (2022). 词项框架下话语对象的意义建构及其路径分析. 外国语( 上海外国语大学学报), 45(2),pp.37-46.https://kns.cnki.net/kcms/detail/detail.aspx?dbname=DKFX2022&filename=WYXY202202004 &dbcode=DKFX.
A Corpus-driven Pragmatic Analysis of Implicit Hate Speech on the Internet:
A Case Study on the topic of Experts’ Advice
Xu Junyang
College of Foreign Studies, Jinan University, Guangzhou, Guangdong, China
Abstract: The paper analyzes comments on the topic of "experts ’ advice" in online media based on the lexical relational network function of the KH coder corpus tool and speech act theory. It is found that online implicit hate speech exist a predicate-driven expression, and its pragmatic function shows inconsistent with the original function of the predicate, thus implicitly achieving the reviewer's illocutionary purpose.
Keywords: KH coder; Hate Speech; Speech Act Theory
[1] 作者简介:
徐俊扬(1998—),男,广东东莞人,暨南大学外国语学院硕士研究生,研究方向为语料库语言学。