Article Analysis RnE Project for Busanil Science High School, 2020
부산일과학고 2020년 기사 분석 RnE 프로젝트입니다.
- Python 3.x
- requests
- BeautifulSoup 4
- Selenuim (Chromedriver)
- R
scrap_articles.py [-h] [-p ] [-c -n -q -d -i <number_ignore>] [-s -o ] [-l ]
- -h --help: 도움말
- -p --press [언론] [joongang | donga | chosun]
- -c --collect: 기사 목록 검색
- -n --number [찾을 기사 수]
- -q --query [주 검색어]
- -d --detail (부가 포함 검색어)
- -i --ignore (처음부터 무시할 기사 수)
- -l --list (저장할 파일명)
- -n --number [찾을 기사 수]
- -s --scrap 기사 내용 스크랩
- -l --list (기사 목록 파일명)
- -r --result [출력 파일명]
예) scrap_articles.py -p joongang -c -n 100 -q 코로나 -l list.csv
- -l --list (기사 목록 파일명)