Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Найти интересные и пригодные для парсинга данные на гос.сайтах #1

Open
radachynskaja opened this issue Feb 1, 2018 · 1 comment
Assignees

Comments

@radachynskaja
Copy link

Дано:
Список гос.сайтов, распаршенный с сайта e-gov.by:
https://docs.google.com/spreadsheets/d/16G274vgGRg3GdOXxR7IkOmD5B_za2sPzPcoCsnXMsBw/edit?usp=sharing

Что нужно получить:

  1. Ссылки на конкретные страницы с данными
  2. Наборы данных с сайтов в формате CSV и обязательно метаданными к ним (источник, прямая ссылка на страницу/цы, с которой спаршены данные, дата последнего обновления, заголовок датасета (напр. Количество туристов, посетивших Гродно в 2017 году), описание данных из источника, если есть)

Пишите в комментарии или в телеграм @radachynskaja (https://t.me/radachynskaja), дам доступ к редактированию таблицы, если соберетесь работать с пунктом 1.

@gsk990
Copy link
Member

gsk990 commented Mar 13, 2018

тут замечен государственный реестр аж 14125 гос сайтов с лінкамі и др. инфой, нужно распарсить и следить за обновлениями:

На 13.03.2018

  | зарегистрировано ИР всего : 14215
  | зарегистрировано ИР в текущем году : 857
  | зарегистрировано ИС всего : 271
  | зарегистрировано ИС в текущем году : 8

http://www.ipps.by:9087/apex/f?p=124:201:0::NO:::

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants