-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
create a scrapper program that will scrapp jobs ( V1) #23
Comments
The first version will be done soon.
I will schedule it with kubernetes |
so much troubles to build docke image with on arm64 . I will deploy try to deploy on AWS or github action |
Good t know you can run indepent webdriver ta simulation browner :: |
|
@billmetangmo statut ? |
Changement sur la feature proposée: Scraper non pas tous les jobs sur le web mais les offres d'emploi d'entreprises dans laquelle nous sommes ( ou avons été) afin de permettre de proposer des offres de stages/premier emploi par cooptation aux mentorés ( cela permet aussi cela entre les membres du collectif - peut aussi être un argument supplémentaire pour rejoindre le collectif). |
V1:
|
Scraper en utilisant les screenshots est plus cost efficient en plus d'êtr egénéraliste: https://news.ycombinator.com/user?id=its_down_again Browser Ai automation (screen scraping)
|
Failure ! Get back to the old code . |
Résultat obtenu par ce commit f35c087 To get the openai key to use , go to:
|
Next steps:
|
Par ce commit 47caa5a J'ai rajouté une fonction pour récupérer la position d'un bouton Next sur une page , une fois ceci fait. On peut la passer àa la ofnction click_next_page qui va cliquer sur next jusqu'à ce qu'il n'y ait plus de page. Je me dis que ça peut être le mécanisme général pour ce type de page |
@Joyce-Tchamdjou last commit with refactor to SOLID 666182e |
|
Liste des sites carrières qui me modifient pas l'url quand on filtre |
Extia: récupérer des élements uqi sont pas des offres d'emploi par exemple +-------------------------------------+--------------------+ SFEIR: il y a 2 qui sautent, j'i ali'mpression car le décupage fait perdre des élements, il faut que ça se recoupe. WIREMIND: il y a 2 qui sautent aussi à cause de cookies |
Le cas de Dior nécessite un type de scrapper complètement différent de ceux qui ont été faits jusqu'ici parce que c'est un next-scroll. Donc lorsqu'on clique sur "Next", la page ne se recharge pas complètement mais juste s'allonge. |
create a scrapper program that will scrapp jobs :
The text was updated successfully, but these errors were encountered: