ipra_portal_scraper

Scrape cases, subjects, media item and document metadata from http://portal.iprachicago.org/

Assumptions

Clone the repository:

git clone https://github.com/newsapps/ipra_portal_scraper.git

Create a virtualenv for this project:

mkvirtualenv ipra_portal_scraper

Install dependencies:

pip install -r requirements.txt

./scrape.py > cases.json

cat cases.json | ./export_subjects_table.py > subjects.csv

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
analysis_notebooks		analysis_notebooks
.gitignore		.gitignore
README.md		README.md
export_subjects_table.py		export_subjects_table.py
requirements-analysis.txt		requirements-analysis.txt
requirements.txt		requirements.txt
scrape.py		scrape.py