一个情色小说网站,能否反应我们当今时代的性别权力结构呢?
王尔德说:「一切事物都与性有关——除了性本身。性与权力有关。」即使是在「政治正确」风行的当下,情色小说总能反映出人们心中最真实的想法。
我们通过抓取英文情色小说网站 Literotica 上最热门的 50 篇文章,并对它们进行分析,看看男女在其中所扮演的角色究竟有何不同?
项目地址:https://github.com/WillSkywalker/literotica-he-she/
本次统计使用了「非自愿与强迫关系」板块的文章——因为它能最好的体现权力结构。但是你也可以通过在代码中简单的替换网址来选择不同的板块。
我们在此进行一个简单的统计:在 He/She 两个词后面最常出现的动词是什么,并画出在两性之间差异最大的 20 个单词。
输入 python3 literotica-he-she.py
即可执行此程序。请保证网络连接。
程序会输出两张图:其一为出现次数最多的词语(通常为 was, is 等),以及在某一性别中明显更多出现的词语。
本项目已经自带了运行结果;你也可以通过更改代码中的数据来进行不同的实验。我会在未来实现更易于改动和封装更完善的接口。
由于本项目并不是严格意义上的统计分析,因此我们不做出统一的解读。欢迎提出你对于数据的不同理解。