Skip to content

xqhjay/WeiboSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WeiboSpider

This is a sina weibo spider built by scrapy

这个爬虫一开始是需要登陆获得微博cookie的,然后再运行爬虫

如果你的账号是买的,微博判定不是正常账号,会出现滑动宫格验证码,本项目中获取cookie的方案就不适用了, 具体可以参考这篇文章

如果需要构建大规模的微博抓取系统,在本项目的基础上仅仅需要做的就是,购买大量微博账号,维护一个账号池

购买微博账号的地址是这里,访问需要翻墙。

如果确实有抓取数据的需要,可以联系我,Email:[email protected]

使用本项目

Python版本:Python3.6及以上

git clone https://github.com/xqhjay/WeiboSpider.git
# 首先获取cookie,并存入数据库中
python cookies.py
# 然后运行爬虫
python run.py

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages