顾名思义就是用来爬晋江小说的评论区的.
为什么我要在全球最大的的同性交友平台上发一个女性网络文学网站的爬虫啊??(雾
需要安装 bs4, requests 和 html2text 这几个库, 自己 pip install 一下就好了.
可以自己修改 main.py 的 33 行下面的代码获取不同分类的评论.
# 如果只想要获取长评取消注释下面这行
# "wonderful": 1
# 如果只想要获取作者加精评论取消注释下面这行
# "belike": 1
# 如果只想要获取话题取消注释下面这行
# "huati": 1
# 以上三行可以自行注释或取消注释, 但一次最多取消注释一行
# 默认全部注释即获取所有评论
存储的数据是 SQLite3 格式的, 如果要做数据分析可能还要再加工一下保存的数据, 但只是想爬下来自己看的话足够了~
数据格式自己打开了看看就能猜出来了不写了...