一个抓取freebuf所有栏目的文章的爬虫,以离线网页形式展现,上传了一些爬取好的结果
python freebuf.py
http://www.freebuf.com/sectool -->
http://www.freebuf.com/sectool/page/100
如果返回是 说明这个栏目没有这么多页,写程序的二分法不用我教吧,用这个方法可以快速得出总页数,然后填上即可
import requests
import re
import urllib
暂时爬取了三个栏目放在这里,大家可以看下效果,自己可以动手爬其他的
可以看到freebuf终端安全的文章从建站到现在全部在这里了