crawler

多个平台的爬虫代码整理

浙江在线：crawler.py, get_article_content.py

crawler.py 为主程序，其中调用get_article_content.py，也可直接使用get_article_content.py，但前提是已经获取了所有文章的单链。

知乎： zhihuID.py, zhihuanswerdownload.py

zhihuID.py可以爬取单一话题下的所有相关问题，其中调取zhihuanswerdownload.py，对单个问题下的所有回答进行爬取。

学习强国：有点问题，只能爬部分且要对网址做如下形式的修改: url_origin >>> url

即，最后一个/后面要加上data，且后缀要改成.js

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
爬虫		爬虫
README.md		README.md

Provide feedback