NLP论文(情感分析):《Hate Speech on Twitter: A Pragmatic Approach to Collect Hateful and Offensive Expressions and Perform Hate Speech Detection》 笔记

论文

NLP论文笔记合集(持续更新)

原论文:《Hate Speech on Twitter: A Pragmatic Approach to Collect Hateful and Offensive Expressions and Perform Hate Speech Detection》

介绍

2018年02月15日发表的文章

模型结构

文章翻译

Abstract

随着社交网络和微博网站的快速发展,不同文化和心理背景的人之间的交流变得更加直接,导致这些人之间的“网络”冲突越来越多。因此,仇恨言论被越来越多地使用,以至于它已经成为侵犯这些开放空间的一个严重问题。仇恨言论是指使用偏激的、暴力或攻击性语言,针对享有共同属性的特定群体,无论该属性是其性别(即性别歧视)、族裔或种族(即种族主义)还是其信仰和宗教。虽然大多数在线社交网络和微博网站禁止使用仇恨言论,但这些网络和网站的规模使得几乎不可能控制其所有内容。因此,有必要自动检测此类语音并过滤任何呈现仇恨语言或煽动仇恨语言的内容。在本文中,我们提出了一种在Twitter上检测仇恨表达的方法。我们的方法基于从训练集中自动收集的 unigram 和模式。除其他外,这些模式和 unigram 后来被用作训练机器学习算法的特征。我们在由2010条推文组成的测试集上进行的实验表明,我们的方法在检测推文是否具有攻击性(二元分类)方面达到了87.4%的准确率,在检测推文是否具有仇恨、攻击性或干净性(三元分类)方面达到了78.4%的准确率。

V. CONCLUSION

在这项工作中,我们提出了一种新的方法来检测Twitter中的仇恨言论。我们提出的方法自动检测仇恨发言模式和最常见的 unigram,并使用这些模式以及情感和语义特征将推特分类为仇恨、冒犯和干净。我们提出的方法将推文分为攻击性推文和非攻击性推文的二元分类准确率达到87.4%,将推文分为仇恨、攻击性推文和干净推文的三元分类准确率达到78.4%。

在未来的工作中,我们将尝试构建一个更丰富的仇恨发言模式词典,与unigram词典一起用于检测仇恨和攻击性在线文本。我们将对不同性别、年龄组和地区等人群中仇恨言语的存在进行定量研究。

相关的笔记

相关代码

pytorch

tensorflow

keras

pytorch API:

tensorflow API

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐