Skip to content

Releases: ericbrasiln/pyHDB

v1.7.1 - pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira

25 Jul 02:45
3c5ec76
Compare
Choose a tag to compare

O que mudou?

Simplificação do código utilizando função interna do Selenium para com webdriver do Chrome.
A partir da versão 4.6.0, o próprio selenium resolve e baixa o webdriver do Chrome, não sendo mais necessário baixar manualmente ou usar o webdriver_manager.

Full Changelog: v1.7...v1.7.1

v1.7

10 Jul 13:14
42cc48d
Compare
Choose a tag to compare

v1.7 - pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira

Atualização do argumento --headless

  • Inclusão da nova forma de definir o argumento headless nas opções do
    drive. Referente às issues #17 e #18, o argumento --headless agora é utilizado como '--headless=new' e segundo a documentação do Selenium:

    Using --headless=new should bring a better experience when using headless with Selenium.

    Veja o post completo aqui e essa [resposta no StackOverflow)(https://stackoverflow.com/questions/45631715/downloading-with-chrome-headless-and-selenium/73840130#73840130).

    Essa mudança corrigiu o erro de carregamento dos resultadosda busca. Realizei testes no Pop_Os! e no Windows 11.

  • Inclusão de user agent.

Correção de ortografia

  • Correções mínimas de ortografia nos comentários do código.

Correção na nomeação de relatórios

Correção do csv com dados gerais

  • Alteração do nome da coluna 'Frequência de Ocorrências por Página' por 'Número de páginas para uma ocorrência'.

Limpeza do título do relatório de acervo

  • Exclusão de espaços, caracteres especiais e repetidos.

Padronização do aviso de direitos autorais

  • Exlcusão de nome específico do jornal.

Essas alterações encerram a issue #13 e #18

Full Changelog: v1.6.1...v1.7

v1.6.1

14 Jan 10:41
Compare
Choose a tag to compare

pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira v.1.6.1

O que Mudou?

Correção no comando de fechar 'Aviso' by @ericbrasiln in #14

  • Atualização da linha 46 do arquivo scrape.py para a versão atual do Selenium: De warning = driver.find_element_by_id('RadWindowWrapper_PesqOpniaoRadWindow') para warning = driver.find_element(By.ID, "RadWindowWrapper_PesqOpniaoRadWindow"). Eu havia atualizado para a atual sintaxe do Selinium, mas essa linha não foi corrigida, o que gerava erro ao tentar fechar o aviso de jornal protegido.

Revisão da documentação by @ericbrasiln in #15

Full Changelog: v1.6...v1.6.1

pyHDB v.1.6

29 Aug 15:03
92a5433
Compare
Choose a tag to compare

O que mudou?

PR #10 cores no terminal compatibilidade com windows by @ericbrasiln

  • Exclusão de cliques extras no parâmetro periódico
  • Exclusão de .click() da variável p_arrow e click_per.
  • Esses cliques aumentavam a ocorrência de erros e eram desnecessários, visto que o parâmetro periódico nessa versão do programa é fixado em Todos
  • Solução da questão das cores no terminal
  • Inclusão na documentação da solução encontrada para o problema das cores do terminal no Windows. Issue #9

PR #11 Update issue templates by @ericbrasiln

  • Inclusão de templates para Bugs e pedidos de novos recursos

PR #12 Correção de erros na definição de parâmetros de busca by @ericbrasiln

src/parameters.py: Correção de erros na definição de parâmetros de busca

As funções de definição dos parâmetros de busca (set_place, set_time,set_journal,set_search) apresentavam erros em função de problemas de carregamento do site da HDB.

Buscando remediar o problema, incluí validações em cada função. Caso erros acontecam, uma mensagem aparece e o programa é encerrada.

README.md e pyHDB-docs/docs/index.md: Atualização da documentação

  • inclusão do wget na lista de bibliotecas
  • inclusão de maiores informações sobre powershell
  • inclusão de referências de lições do programming historian sobre powershell e bash

src/pyHDB_acervos.py: Atualização do script de acervos específicos

  • Atualização do texto (cores, termo de busca, pasta existente)

Full Changelog: v1.5...v1.6

v1.5

27 May 14:19
2426f8e
Compare
Choose a tag to compare

O que mudou?

#6 do branch Validações por @ericbrasiln

  • src/pyHDB.py: inclusão de cores para marcar dados e informações importantes. Inclusão de opção removendo a impressão de logs do webdriver.manager; correções de texto; inclusão da função de validação do período.
  • src/parameters.py: Inclusão de validações dos parâmetros inseridos pelo usuário. Tenta encontrar o termo na caixa de busca específica. Se não encontrar, imprime um recado e termina o programa. Também foram incluídas cores para marcar casos de erro.
  • src/validate_period.py: Criação de função para validação do período inserido pelo usuário. Testa se o input segue o padrão previsto pela HDB
  • src/requirements.txt: remoção da versão das biliotecas do requirements.txt

#7 do branch Validações por @ericbrasiln

  • Inclusão da informação sobre as validações na documentação;
  • correção de email para contato;
  • atualização do número da versão no documento de citação.

Full Changelog: v1.4...v1.5

v1.4

08 Apr 04:29
ae74f10
Compare
Choose a tag to compare

O que mudou?

Solução no erro de carregamento dapágina de resultados da HDB by @ericbrasiln in #4

pyHDB.py

  • correção de problemas na página de resultados solucionado (ver linhas 120-139)
  • print de possível solução de erro (165-169)

pyHDB_acervos.py

  • correções ortográficas

docs

  • atualização das infos sobre instalação + citação + contatos
  • comentários sobre Chrome e sistema operacional
  • Inclusão de imagens ilustrativas da instalação + nova img do texto incial da ferramenta.
  • Atualização de links
  • Inclusão de agradecimentos no nav bar
  • footnotes

.gitignore

  • inclusão de pasta de resultados

README.md

  • Adequação do texto em relação à documentação do site.

Citação

  • atualização do número da versão para 1.4 no CITATION.cff, no README.md e citation.md do mkdocs.

Full Changelog: v1.3...v1.4

v1.3

04 Apr 02:31
e33cc11
Compare
Choose a tag to compare

O que mudou

  • Criação de site de documentação criado com mkdocs.
  • Atualização do selenium mais recente (find_element e definição de opções do webdriver).
  • script para raspar acervos renomeado
  • inclusão do requirements.txt na pasta src
  • correções ortográficas no README.md. Inclusão de explicação sobre script para acervos

Ver informações detalhadas do PR link: #3

Full Changelog: v1.2...v1.3

v1.2

17 Nov 01:33
6baa826
Compare
Choose a tag to compare

pyHDB: Ferramenta heurística para a Hemeroteca Digital Brasileira

Ferramenta de auxílio metodológico para pesquisa na Hemeroteca Digital Brasileira da Biblioteca Nacional.

Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.

Descrição

Mudança de nome da ferramenta de H_HDB para pyHDB.

Agradeço a Leonardo Nascimento (UFBA) pela sugestão do novo nome.

As alterações foram realizadas no README.md, nas descrições de cada arquivo na pasta src, no arquivo de citação e foram adicionados novos logos atualizados na pasta img.


What's Changed

New Contributors

Full Changelog: v1.0.1...v1.2

v1.0.1

13 Nov 17:40
2879f5d
Compare
Choose a tag to compare

Descrição

Ferramenta de auxílio metodológico para pesquisa na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional.

Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.

Códigos estão armazenados no diretório src e imagens no diretório img.

Mudanças


Full Changelog: v1.0...v1.0.1

v1.0

13 Nov 17:31
Compare
Choose a tag to compare

Descrição

Publicação da Ferramenta heurística para a Hemeroteca Digital Brasileira - H_HDB.

Ferramenta de auxílio metodológico para pesquisa na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional.

Desenvolvida por Eric Brasil como parte de pesquisa acadêmica da área de História Digital.

Códigos estão armazenados no diretório src e imagens no diretório img.

Full Changelog: https://github.com/ericbrasiln/H_HDB/commits/v1.0