-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathAgendaLula.py
29 lines (21 loc) · 1.26 KB
/
AgendaLula.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import requests
from bs4 import BeautifulSoup
import pandas as pd
def obter_agenda_presidente(url):
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
eventos = soup.find_all('div', class_='item-compromisso')
dados = []
for evento in eventos:
hora = evento.find('time', class_='compromisso-inicio').text.strip()
descricao = evento.find('h2', class_='compromisso-titulo').text.strip()
dados.append({"Data": url.split('/')[-1], "Hora": hora, "Evento": descricao})
return pd.DataFrame(dados)
urls_presidente = [
"https://www.gov.br/planalto/pt-br/acompanhe-o-planalto/agenda-do-presidente-da-republica-lula/agenda-do-presidente-da-republica/2024-05-21",
"https://www.gov.br/planalto/pt-br/acompanhe-o-planalto/agenda-do-presidente-da-republica-lula/agenda-do-presidente-da-republica/2024-05-22",
"https://www.gov.br/planalto/pt-br/acompanhe-o-planalto/agenda-do-presidente-da-republica-lula/agenda-do-presidente-da-republica/2024-05-23"
]
df_presidente = pd.concat([obter_agenda_presidente(url) for url in urls_presidente], ignore_index=True)
df_presidente.to_excel('agenda_presidente_lula.xlsx', index=False)
print("Agenda do Presidente Lula salva em 'agenda_presidente_lula.xlsx'")