Releases: ericbrasiln/pyHDB
v1.7.1 - pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira
O que mudou?
Simplificação do código utilizando função interna do Selenium para com webdriver do Chrome.
A partir da versão 4.6.0, o próprio selenium resolve e baixa o webdriver do Chrome, não sendo mais necessário baixar manualmente ou usar o webdriver_manager.
Full Changelog: v1.7...v1.7.1
v1.7
v1.7 - pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira
- Fix do bug de erro na busca by @ericbrasiln in #19
Atualização do argumento --headless
-
Inclusão da nova forma de definir o argumento headless nas opções do
drive. Referente às issues #17 e #18, o argumento --headless agora é utilizado como '--headless=new' e segundo a documentação do Selenium:Using --headless=new should bring a better experience when using headless with Selenium.
Veja o post completo aqui e essa [resposta no StackOverflow)(https://stackoverflow.com/questions/45631715/downloading-with-chrome-headless-and-selenium/73840130#73840130).
Essa mudança corrigiu o erro de carregamento dos resultadosda busca. Realizei testes no Pop_Os! e no Windows 11.
-
Inclusão de user agent.
Correção de ortografia
- Correções mínimas de ortografia nos comentários do código.
Correção na nomeação de relatórios
Correção do csv com dados gerais
- Alteração do nome da coluna 'Frequência de Ocorrências por Página' por 'Número de páginas para uma ocorrência'.
Limpeza do título do relatório de acervo
- Exclusão de espaços, caracteres especiais e repetidos.
Padronização do aviso de direitos autorais
- Exlcusão de nome específico do jornal.
Essas alterações encerram a issue #13 e #18
Full Changelog: v1.6.1...v1.7
v1.6.1
pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira v.1.6.1
O que Mudou?
Correção no comando de fechar 'Aviso' by @ericbrasiln in #14
- Atualização da linha 46 do arquivo
scrape.py
para a versão atual do Selenium: Dewarning = driver.find_element_by_id('RadWindowWrapper_PesqOpniaoRadWindow')
parawarning = driver.find_element(By.ID, "RadWindowWrapper_PesqOpniaoRadWindow")
. Eu havia atualizado para a atual sintaxe do Selinium, mas essa linha não foi corrigida, o que gerava erro ao tentar fechar o aviso de jornal protegido.
Revisão da documentação by @ericbrasiln in #15
- Update README.md
- Inclusão de citação do artigo publicado na revista História da Historiografia.
- Update index.md
- Inclusão de citação do artigo publicado
- update version
- update de referência do artigo publicado
Full Changelog: v1.6...v1.6.1
pyHDB v.1.6
O que mudou?
PR #10 cores no terminal compatibilidade com windows by @ericbrasiln
- Exclusão de cliques extras no parâmetro periódico
- Exclusão de .click() da variável
p_arrow
eclick_per
. - Esses cliques aumentavam a ocorrência de erros e eram desnecessários, visto que o parâmetro periódico nessa versão do programa é fixado em
Todos
- Solução da questão das cores no terminal
- Inclusão na documentação da solução encontrada para o problema das cores do terminal no Windows. Issue #9
PR #11 Update issue templates by @ericbrasiln
- Inclusão de templates para Bugs e pedidos de novos recursos
PR #12 Correção de erros na definição de parâmetros de busca by @ericbrasiln
src/parameters.py
: Correção de erros na definição de parâmetros de busca
As funções de definição dos parâmetros de busca (set_place, set_time,set_journal,set_search) apresentavam erros em função de problemas de carregamento do site da HDB.
Buscando remediar o problema, incluí validações em cada função. Caso erros acontecam, uma mensagem aparece e o programa é encerrada.
README.md
e pyHDB-docs/docs/index.md
: Atualização da documentação
- inclusão do wget na lista de bibliotecas
- inclusão de maiores informações sobre powershell
- inclusão de referências de lições do programming historian sobre powershell e bash
src/pyHDB_acervos.py
: Atualização do script de acervos específicos
- Atualização do texto (cores, termo de busca, pasta existente)
Full Changelog: v1.5...v1.6
v1.5
O que mudou?
#6 do branch Validações por @ericbrasiln
src/pyHDB.py
: inclusão de cores para marcar dados e informações importantes. Inclusão de opção removendo a impressão de logs do webdriver.manager; correções de texto; inclusão da função de validação do período.src/parameters.py
: Inclusão de validações dos parâmetros inseridos pelo usuário. Tenta encontrar o termo na caixa de busca específica. Se não encontrar, imprime um recado e termina o programa. Também foram incluídas cores para marcar casos de erro.src/validate_period.py
: Criação de função para validação do período inserido pelo usuário. Testa se o input segue o padrão previsto pela HDBsrc/requirements.txt
: remoção da versão das biliotecas dorequirements.txt
#7 do branch Validações por @ericbrasiln
- Inclusão da informação sobre as validações na documentação;
- correção de email para contato;
- atualização do número da versão no documento de citação.
Full Changelog: v1.4...v1.5
v1.4
O que mudou?
Solução no erro de carregamento dapágina de resultados da HDB by @ericbrasiln in #4
pyHDB.py
- correção de problemas na página de resultados solucionado (ver linhas 120-139)
- print de possível solução de erro (165-169)
pyHDB_acervos.py
- correções ortográficas
docs
- atualização das infos sobre instalação + citação + contatos
- comentários sobre Chrome e sistema operacional
- Inclusão de imagens ilustrativas da instalação + nova img do texto incial da ferramenta.
- Atualização de links
- Inclusão de agradecimentos no nav bar
- footnotes
.gitignore
- inclusão de pasta de resultados
README.md
- Adequação do texto em relação à documentação do site.
Citação
- atualização do número da versão para 1.4 no CITATION.cff, no README.md e citation.md do mkdocs.
Full Changelog: v1.3...v1.4
v1.3
O que mudou
- Criação de site de documentação criado com mkdocs.
- Atualização do selenium mais recente (find_element e definição de opções do webdriver).
- script para raspar acervos renomeado
- inclusão do requirements.txt na pasta src
- correções ortográficas no README.md. Inclusão de explicação sobre script para acervos
Ver informações detalhadas do PR link: #3
Full Changelog: v1.2...v1.3
v1.2
pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira
Ferramenta de auxílio metodológico para pesquisa na Hemeroteca Digital Brasileira da Biblioteca Nacional.
Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.
Descrição
Mudança de nome da ferramenta de H_HDB para pyHDB.
Agradeço a Leonardo Nascimento (UFBA) pela sugestão do novo nome.
As alterações foram realizadas no README.md, nas descrições de cada arquivo na pasta src, no arquivo de citação e foram adicionados novos logos atualizados na pasta img.
What's Changed
- Rename by @ericbrasiln in #1
New Contributors
- @ericbrasiln made their first contribution in #1
Full Changelog: v1.0.1...v1.2
v1.0.1
Descrição
Ferramenta de auxílio metodológico para pesquisa na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional.
Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.
Códigos estão armazenados no diretório src e imagens no diretório img.
Mudanças
- Inclusão do número e link do DOI gerado pelo Zenodo no
README.md
e noCITATION.cff
Full Changelog: v1.0...v1.0.1
v1.0
Descrição
Publicação da Ferramenta heurística para a Hemeroteca Digital Brasileira - H_HDB.
Ferramenta de auxílio metodológico para pesquisa na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional.
Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.
Códigos estão armazenados no diretório src
e imagens no diretório img
.
Full Changelog: https://github.com/ericbrasiln/H_HDB/commits/v1.0