互联网平台加强网暴治理新浪微博、抖音、小红书等平台调整功能权限

1996年,美国麻省理工学院教授尼葛洛庞帝在《数字化生存》一书中预言,“数字不再只和计算有关,它决定我们的生存。”

二十六年后的今天,数字时代给人们的生活方式带来巨大变革,媒介作为人的延伸,打破了时空限制,人与人之间的关系变得“比特化”,实现前所未有的联结。暴力的形式也从线下蔓延到网络空间,幻化成屏幕上的文字、符号、图片以更隐蔽的方式给当事人造成伤害,甚至导致“数字性死亡”“社会性死亡”。

自2022年6月起,南财合规科技研究院将推出反网暴系列报道,以期从不同维度、不同面向对网暴的衍生路径、群体反应、治理面向进行拆解分析,以媒体力量推进网暴治理。

应对网络暴力,互联网平台是第一道防线。在网暴酝酿及初发阶段,各互联网平台如何设计防护机制?存在什么难点与痛点?

对于互联网平台而言,“用户自主设置+平台介入监测”是事前阶段主流的防控模式。

经21世纪经济报道记者梳理发现,在新浪微博、抖音、快手、知乎、小红书、豆瓣、B站、中,用户均可以自主管理评论、私信互动关系。常见的选择范围包括所有人、关注的人、我的粉丝及互相关注的人,也可以选择直接关闭权限。

相较于评论,私信场景中的网暴行为更加隐蔽。上述8个平台对于“未关注人私信”功能均作出了严格限制,在对方未关注或回复前最多只能发送一条消息。新浪微博、小红书、知乎、豆瓣、B站均设置了类似“未关注人私信箱”功能,陌生人发来的私信将会被系统收入其中。在抖音、快手,用户还可以选择设置私密帐号,该功能开启后,仅粉丝可以浏览作品,且新的关注请求需经过用户批准。

新浪微博近期发布公告,加强言论攻击及网暴行为治理,调整私信接收规则,在接收未关注人发送的私信时,仅显示1条私信提醒,用户在确认接收后,可查看具体内容并进行正常文字对线小时。

在网暴信息识别监测方面,21记者设置了20个敏感词,包括常见的攻击类词汇以及谐音、换字等更隐秘的表达,在上述8个平台进行测试,均有不同程度的拦截,且评论场景中的词汇拦截率高于私信场景。

在敏感词测试中,平台过滤情况大致可分为三类:一是消息可以正常发送及接收;二是消息发送后被屏蔽,接收方无法收到该信息;三是消息发送失败。在第一类情况中,部分词汇会触发风险提示。

经记者梳理发现,贬低矮化类、诅咒威胁类和人身攻击类词汇基本能被系统识别并屏蔽。谐音、缩写类敏感词,除了“NMSL”有较高的屏蔽率外,仍有许多谐音词存在一定识别难度。

值得注意的是,网络暴力的表现形式复杂多变,某类信息是否涉及网暴,还需结合具体语境、当事人主观感受等因素进行判断。如“逝者安息”“位列仙班”等,在不同场景下会产生不一样的解读。

抖音上线了“发文警示”“负向内容过滤”等12项防网暴功能。在“发文警示”功能下,若系统模型判定已经发送的评论存在问题,会推送弹窗提醒,建议发送者重新编辑,去除不当言论。如果发送者坚持发送,则该条评论不会在评论区出现。在“负向内容过滤”功能下,当模型判定用户收到的私信消息为“谩骂或骚扰”,该消息会被直接放入“陌生人盒子垃圾信息”中。

B站针对私信场景上线智能拦截功能,系统将对检测到疑似骚扰或不良的会话内容直接拦截。在评论、弹幕等场景,用户可以开启评论精选模式、设置弹幕关键词以过滤不良内容。据B站相关负责人介绍,当评论区集中性出现负面信息时,系统会触发一套较为严格的防网暴互动管控模型,识别过滤不友善内容。“平台还会通过抑郁情绪识别模型去识别有抑郁倾向的用户,在发现相关内容后直接触发防网暴模型。如果监测到有关轻生的内容,平台会紧急介入专家进行风险等级判定,与用户建立联系、安抚情绪,必要时上报警方处理。”

作为Z世代高度聚集的文化社区,B站近期升级了未成年人保护机制。未成年用户开启青少年模式后,平台将从内容、功能等层面进行限制,用户所浏览的视频需经内容团队人工审核,评论、弹幕、私信等功能也会经过更严格的模型过滤,降低未成年人受到舆论伤害的风险。

在问答社区知乎,用户可开启“瓦力保镖”功能,开启后系统识别出的不良评论和私信将会被折叠、隐藏或删除,严重者将被拉黑。21记者用两个帐号进行测试,在收到3-4条不友善私信后,系统会自动将对方帐号加入黑名单。6月,知乎优化“发文提示”功能,用户在评论和私信场景下发布不友善内容时将会收到社区建议修改的提示。在私信场景中,不友善的内容将被自动折叠并触发风险提示,用户可以自主选择是否浏览消息详情。

侮辱攻击类词汇层出不穷,对于表达形式更隐晦的网暴信息,平台如何及时处理?微博相关负责人表示,对于日常的言论攻击、泄露隐私、引战等内容,平台通过主动巡查、受理用户举报投诉等方式进行处置;对于热点事件中衍生的网暴行为,平台及时跟踪、联系热点当事人,发掘相关线索上报至监管部门;针对平台上的不友善内容,微博通过机器模型策略、关键词策略强化内容识别与处置。

方面回复称,贴吧有巡查、吧主和吧务反馈、举报、清理回溯等发现机制,同时不断优化内容策略,升级贴吧网暴识别能力。近期贴吧共扩充网暴关键词近500组,新增图片黑库600余张。

目前,对于网暴的定义仍存在一定模糊界限。互联网平台面临着一个绕不开的问题:什么样的言论和行为能够判定为网络暴力?

在当事人社交帐号下刷屏白色蜡烛表情包,再附上一句“早日安息”。在私信中“提醒”当事人,“晚上一个人出门注意安全,别被车撞了。”又或者是对当事人的外貌留下一句轻飘飘的评价,“汇集了高科技的脸,一定很贵吧。”

大量灰色的、难以判定的内容形成了一座大山,横亘在互联网平台治理网暴的道路中。

微博相关负责人在采访中告诉21记者,微博平台主要治理侮辱谩骂、侵犯隐私、造谣诽谤、贬低羞辱、道德绑架和冒犯骚扰等方面的网暴行为。“网暴行为的发生较随性和偶然,没有固定规律,有时只因为一句话、一个观点或一个表情。平台难以及时发现和制止。此外,行业处置未形成统一标准,各平台尺度不同,导致处置过程中也会存在用户申诉和投诉的问题。”

抖音相关负责人表示,平台正在不断加强网暴信息识别能力建设,但依然存在一些难点,难以兼顾“快速”与“精准”。对于明显的辱骂、造谣、人身攻击类言语,平台可以明确定义和治理。但另外还有大量恶搞、调侃类的言论,它们不违法违规,但对当事人的身心带来了实质伤害。比如用当事人的脸P成搞怪表情包,用谐音梗进行辱骂等等。“网暴的界定和识别是目前的难点之一,在治理过程中需要结合受害人具体情况、抗压能力,信息传播量级、传播速度进行个案分析,这对平台进行规模化、及时性治理带来很大困难。”

目前司法层面对网暴尚无明确界定,更多的是从局部角度进行归纳。北京海淀法院专门审理互联网案件的法官秦鹏博在此前采访中表示,“在现有的法律法规和规范性文件、指导性文件中缺乏对网络暴力概念内涵和外延的规定,亦缺乏列举性的规范方式。”进一步明晰网络暴力的法律概念,探索专门法的立法模式,是未来有效治理网络暴力的重要途径。

不同的互联网平台有各自独特的社区文化。在事前阶段,文化建设作为一种“软性手段”将分散的用户联结在一起,强化用户作为数字社区成员的身份认同感,引导用户自觉维护社区氛围。而对于难以判定的内容,平台也可以通过用户众议的方式提高信息甄别的准确性。

在B站,用户可以自愿加入“风纪委员会”,对全站热门稿件的氛围进行众议投票,包括视频整体的评论、弹幕氛围,以及单条评论、弹幕在具体语境下是否适宜,以此甄别不良内容。B站相关负责人在采访中表示,“今年4月,我们收到部分风纪委员的反馈,希望社区能够治理数码区存在的带节奏引战攻击互动问题。5月初B站启动了数码区专项治理行动,根据风纪委提报的不良氛围特征进行总结,交由阿瓦隆(评论审核系统)学习并治理。”

微博相关负责人表示,众议投票的方式能够一定程度上降低正常评论被误伤的情况。“对于难以界定的内容,微博平台会每日推送给社区委员会成员进行投票众裁,以最大公允地判定违规行为是否成立。如用户对站方处置有异议,可随时进行申诉。”

目前,多个互联网平台通过制定社区公约、鼓励用户参与社区共治等方式维护社区氛围,同时以用户意见建议反哺社区策略调整。

中国传媒大学新闻传播学部电视学院教授、媒体融合与传播系主任顾洁认为,在互联网综合治理体系中,网民自律是重要一环。“自律不仅是不做坏事,更重要的是主动去做好事。目前网民参与互联网治理的力量还没有被完全发挥出来,随着网络志愿文化逐渐深入人心,相信越来越多的网民会积极参与到治理中去。”

随着个性化算法推荐等技术的普遍应用,网民基于选择性心理长期只关注自己感兴趣的内容,只听自己认同的观点。这些观点不断重复加深,形成“回音室效应”,可能会加剧群体极化现象。顾洁表示,“信息茧房”“回音室效应”是全球社会都在面临的问题,互联网平台应坚持技术向善,以主流价值观为导向,为网民提供更多的信息选择。网民自身也要有意识地“破茧”,拓宽信息视野,了解多元化的声音,在此过程中进一步提升媒介素养,提高理性思辨能力。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注