WeiboSpider

This is a sina weibo spider built by scrapy

这个爬虫一开始是需要登陆获得微博cookie的，然后再运行爬虫

如果你的账号是买的，微博判定不是正常账号，会出现滑动宫格验证码，本项目中获取cookie的方案就不适用了，具体可以参考这篇文章

如果需要构建大规模的微博抓取系统，在本项目的基础上仅仅需要做的就是，购买大量微博账号，维护一个账号池

购买微博账号的地址是这里，访问需要翻墙。

如果确实有抓取数据的需要，可以联系我，Email：[email protected]

使用本项目

Python版本:Python3.6及以上

git clone https://github.com/xqhjay/WeiboSpider.git
# 首先获取cookie，并存入数据库中
python cookies.py
# 然后运行爬虫
python run.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
sina		sina
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
run.py		run.py
scrapy.cfg		scrapy.cfg