内容审核,靠人工还是靠机器?

2018年开始,快手、火山小视频等数十家短视频社交平台在数月内相继被网信办约谈,短视频社交平台从此迎来了一系列大刀阔斧的整改篇章。不久前,网信办会同有关部门对吱呀、语玩、一说FM等26款音频社交平台进行新一轮全面集中整治,新兴的音频社交平台因此迎来不少质疑。

在一年多的时间内,互联网的UGC内容审查方向均在走向人工强干预,业界甚至有人认为,真正靠AI审核内容可能还需要5-10年的窗口期。现实已经表明,只有督促互联网公司承担社会责任,强调算法的价值观,在产品设计上创新未成年人保护措施,加强内容安全监管,才能杜绝短视频社交平台中的种种乱象。

人工干预已成行业共识

得益于算法技术的发展,互联网公司通过用户画像实现了相对精准的信息推送。但如果不对信息的分发加以干预,诸如强烈性暗示、虚假信息、软色情等内容就会在推荐网络中蔓延,科技界、媒体界由此展开了关于“算法有没有价值观”的讨论。

字节跳动创始人张一鸣曾发表公开信,表明为纠正机器与算法的缺陷,将原有6000人的运营审核队伍,扩大到10000人。2018年4月被网信办约谈后,快手官方表示,将原有2000人的审核团队扩充至5000人。在“算法有没有价值观”这一命题上,快手和字节跳动最终作出了少有的共同选择。

今年4月,探探因整改下架,在其后陌陌第1季度财报会议中,唐岩表示将加大内容审核业务上的资源投入。最新一轮开展集中整治的26款音频社交平台中,社交应用Soul也公开回应称将严格审核相关功能和内容,其整改措施中同样包括加强审核团队建设,将会增招大量内容审核及主管级人员。

如今的探探,在其朋友圈发表动态会进入长时间的审核状态。而在Soul,其动态内容审核据称已全面覆盖除机器判定外的两道人工审核流程,在未来新版本中当动态内容判断为涉嫌违规时也会直接给予用户提醒。

上述四款应用的整改措施都在强化人工审核在内容审查机制中的主导作用,从一个侧面印证了机器分发的局限性。

机器审核只能辅助识别

得益于音视频技术的发展,音视频匹配通话、音视频直播、音视频信息流等新型媒介走进人们的数字屏幕,给人们带来崭新的通讯体验和娱乐视听上的享受。音视频内容技术审核要求高,完善审查机制耗费较大人力财力,但这并不代表一筹莫展。

音频内容的机器审核方案中,音频识别转文本匹配关键词是目前通用的基础方案。先识别音频中的语言语种,语音识别转化为文本信息后索引出关键词,在这一过程就可以植入现有文本识别中的上下语义分析,机器识别出与模型相似度最高的垃圾内容进行剔除。但正如机器与算法的缺陷,目前业界的音频识别技术能力尚未到达可以完全代替人工审核的阶段,特别是在处理方言、有不同音轨的杂音等场景时。

视频内容实则由音频内容、视频画面内容两个对象组成,视频画面内容的机器审核,业界目前常采用截取画面帧上传识别,最终复用的是图片识别通道对场景、人物、物品进行判断是否违规。但以常用的24帧标准为例,一个60秒的视频就多达1440个画面帧,要实现覆盖全画面帧的机器审核则会耗费极大的资源,故此常见的审核设计是设定视频的截取时段选取部分画面帧进行机器审核。在无法覆盖全画面帧的审核的条件下,自然就出现了视频内容“闪现”色情违禁内容的风险,更有甚者,一些人通过画面内容隐晦表达,图片的机器审核难以理解表义。

其实无论什么载体的媒介,在真正的AI时代来临之前,所有的机器审核都只会是人工的辅助。在流程设计上,机器审核可以做到的就是帮助运维者先行剔除大量确切违规的内容,剩下的人工审核流程可不能说省就省。举个例子,一张人像图片,可以划分为“色情”、“性感”、“正常”三个维度,机器审核可以根据肉体裸露的程度进行判断,实际上信息的表义可没那么简单,究竟该怎么定义“性感”?全无裸露的人体通过场景与动作的表达能不能达到人们对“色情”的认知?

人生而爱美,如果说“性感”可以从性暗示程度、信息接收者的舒适度作为标杆,那么定性标尺就掌握在网站运维者手上,各社交平台的编辑责任制也因此诞生。

国家网信办:论内容审核,还得向脸书、推特取经

据央视网报道,国新办于2019年9月举行第六届世界互联网大会新闻发布会。国家互联网信息办公室副主任刘烈宏在回答记者提问时介绍,在内容审核上,脸书、推特等公司其实更有招数。以下为文字实录。

记者:近年来,中国的政府部门包括网信办都在推出一系列有关网络内容的规章性文件,特别是在监控网络信息方面,这就导致了很多中国企业开始开发新的,比如人工智能的软件去进行分析,来控制这些网络内容。是否这些领域的内容将会是中国企业未来能够胜过美国企业的一个优势点?因为现在我们看到很多美国企业,包括美国的Facebook都不能成功阻拦那些含有暴力内容的视频信息,是否这些美国企业能够从中国企业身上学到这些呢?

刘烈宏:在内容审核上,脸书、推特等公司其实更有招数。前段时间,脸书、推特以散布“假新闻”为借口,封禁了一批发布客观理性声音的中国账户。但与此同时,大量歪曲事实、攻击抹黑中国的谣言信息却大行其道。这充分表明,脸书、推特等公司的内容审核其实非常精准,如果说要“取经”的话,可能找他们更合适。

延伸阅读:

推特停用936个账号

推特给出的理由却非常荒唐——这些账号有“政府背景”,通过协调一致的统一行动在传播各种涉港“假新闻”,而这些所谓的“假新闻”在破坏香港示威的“合理性”,还“企图在香港播下政治不和的种子”。

但是,查看了推特声明中给出的示例后可发现,这些破坏香港暴乱“合理性”的“假新闻”,全都是痛斥暴徒暴力行为,力挺香港警察的“真新闻”。

接着,推特又发布了一篇声明,称为了保护“合理的探讨及开放的对话”,该公司从即日起不再接受由政府控制的媒体提出的广告业务。

但据BBC报道,因为政策不会用在那些所谓“采编独立的公营媒体”,因此像英国广播公司(BBC)、美国公共广播电视公司(PBS)、美国国家公共广播电台(NPR)等应不在受限制之列。

脸书:从推特得到消息,删除一批账号

同一天,脸书也发布声明,称他们通过从推特得到的信息,删除了7个粉丝专页、3个社团和5个个人帐号。

理由也是一样的,这些虚假账号“涉嫌”用欺骗性策略传播关于香港暴乱的新闻,而这被脸书当作是由中国政府发起的针对香港暴乱的“舆论操控行动”,这些账号也被当作“与中国政府有关的个人有联系”。

脸书还在声明里加了一份“非常客观中立”的句子,称“我们删除群组和账户是基于他们的行为,而不是他们发布的内容”。

但查询这些账号发布的信息,全都是痛斥香港暴徒暴行,力挺港警的内容。

骂暴徒、撑港警是“舆论操纵”,而暴徒打、砸、烧就是“正当、合理的”,要通过删除“假新闻”来保护。网友感叹,外国互联网巨头用实际行动,向我们阐释了什么是真正的“言论自由”。

外交部回应“推特脸书删内地账号”:是不是戳中了他们的短处?

推特公司官方账号“推特安全”在8月19日发布了一份声明,称他们已经暂停了936个在内地建立的推特账号。

“针对推特脸书关闭内地账号”事件,中国外交部发言人耿爽20日表示,不了解具体情况。但我想,对于当前香港的局势,14亿中国人是什么态度,大家应该很清楚,海外华人华侨、广大留学生是什么态度,大家也应该很清楚,他们当然有权利表达自己的观点和看法。

有记者在提问中称,在此之前,中国官方媒体在推特脸书等社交媒体上投放了很多广告“负面描述香港的局势”。

耿爽对这一说法进行了批驳:“我不知道你所谓的中国官方媒体对香港局势的负面描述是指什么?我想香港发生了什么,真相是什么,世人自然有自己的判断,为什么中国官方媒体介绍的就一定是负面的或者是错误的呢?”

耿爽说,至于推特公司新出台的政策,你可以去问推特公司。中国媒体利用海外社交媒体与当地民众进行沟通,对外介绍中国的政策,讲述中国故事,这是情理当中的事,不知道为什么某些公司或者某些人对此反应如此强烈,“我不知道是不是戳中了他们的某些短处?”

文旅部:网络直播应至少延播3分钟,加强脱口秀、相声内容审核和现场监管

12月5日,文化和旅游部发布了就《文化和旅游部关于进一步加强演出市场管理的通知(征求意见稿)》公开征求意见的公告。

《通知》提出,要重点对电音类、说唱类节目审核把关,着重加强脱口秀、相声以及先锋话剧、实验话剧等语言类节目内容审核和现场监管。

此外,允许在全国范围设立外商独资的演出经纪机构和演出场所。

重点对说唱类、脱口秀、相声进行内容审核和现场监管

《意见》提出,在音乐节庆类演出活动方面,要重点对电音类、说唱类节目进行审核把关,配合公安等部门加强对演出现场、电子显示屏内容以及互动环节的监督检查,督促演出举办单位防范人群踩踏等安全事故。

在小剧场演出活动方面,要重点加强脱口秀、相声以及先锋话剧、实验话剧等语言类节目的内容审核和现场监管。

对沉浸式演出活动,要加强演出全流程审核,防止出现封建迷信、血腥恐怖等内容。

网络直播应至少延播3分钟

在演出新业态管理方面,《意见》提出,加强演出网络直播管理,营业性演出活动需要进行网络直播的,应当在报批时一并提出申请。

组织演艺人员从事线下现场演出的网络直播(表演)公会组织,应当取得《营业性演出经营许可证》,并依法办理相关手续。

网络直播应采取延迟播出的形式,至少延播3分钟。演出举办单位和网络直播企业应当制定直播管理流程和突发事件应急预案,安排专人对演出直播内容和网民留言等互动内容进行实时审看。

允许设立外商独资的演出经纪机构、演出场所

《意见》还提出了激发演出市场活力的有关举措,降低外资准入门槛,允许在自贸试验区设立中方控股的合资文艺表演团体,允许在全国范围设立外商独资的演出经纪机构、演出场所经营单位。

针对票务市场,《意见》提出,各级文化和旅游行政部门要加强对涉外营业性演出、大型演唱会,以及有较高知名度演员参演的演出活动等票务销售情况的预研预判,及时将可能引发票务紧张或炒作的演出活动列入重点监管对象。

需要说明的是,目前该《通知》正在向公众征集意见,意见反馈截止到2019年12月22日。

微信突然宣布:将启动最严内容“审核”,群主也可能受到影响

根据微信发布的《微信2019年大数据》报告中显示,微信月活跃用户数量达到11亿,要知道同期微博的月活用户量为5亿,可以说社交内容和信息产出,主要还是来自微信。所以说对于内容的审核来说,是至关重要的,微信也有大量的审核团队对微信公众平台、微信朋友圈、甚至微信群转发消息都有严格的审查机制。

最初微信只是对公众平台资讯的审核

前些年,公众平台刚刚开始成立的时候,有大量的文章产出,特别是各种“标题党”、“谣言”横行,记得几年前总是被父母或者老一辈的长辈,转发一些“伪科学”、“伪养生”的知识,还有很多的无光痛痒的内容却挂着重要事件的标题。但是因为父母辈的人对信息的辨识度比较低,对网上的内容信服度也比较高,使得很多人被骗,最后腾讯加大了内容审核力度,专门成立了微信内容审查部门,对所有的微信产出内容进行审查。最近两年,确实已经很少有这种信息产出了,不得不说腾讯在这方面确实加大了力度。

随着对信息的透明和信息安全重视,朋友圈也被强烈约束

在2019年,腾讯发布了一项朋友圈决议:对于中小学打卡类朋友圈,坚持每天打卡能够获得物品的“软污染”朋友圈内容,进行清理、特别是某些健身公众平台,借着健身的名义,以每天打卡,坚持多少天可以得到多少的积分等带有诱导倾向的内容,进行了打击清理。严重的直接进行封号处理。截止2019年12月份数据显示,微信朋友圈已经存在极少数的“打卡行为”,而这些打卡行为往往是真实的对学习或者健身有真正意义的“打卡”。

2020年,微信审核力度再度加强

随着网信部对于谣言的管控力度增大,以往是对于传播500人以上的谣言进行训诫和拘留。而现在对于传播危害程度较深、影响较大的,甚至不再考虑传播人数。就连在微信群里面发布“谣言”,特别是对公众有误导和制造恐慌情绪的,微信群主也没有进行制止,结果从任由其微信群里面开始向外扩散,被朋友圈等其他位置进行转发,这种行为可能会被封号处理,就连群主也会受到影响。

2020年了,朋友圈还是那个我们曾经发表自己生活感悟的地方吗?很多人的朋友圈被所谓的“微商”所占据,被所谓的“美拍”所占据。根据调查现在90后,已经越来越少发朋友圈了,特别是90后的男生,有近40%的90后男生,平均每个月才发布一次朋友圈,更有一部分一年才发几个朋友圈,还有一半以上是因为帮朋友转发。让微信回归到通讯本质,让朋友圈恢复到我们熟人之间了解彼此的广场,让更多有价值的内容被微信公众平台所展示,这才是我们期望的微信的样子。