Skip to content

Commit

Permalink
Apply suggestions from code review
Browse files Browse the repository at this point in the history
Co-authored-by: François Parmentier <[email protected]>
  • Loading branch information
leogail and parmentf authored Dec 9, 2024
1 parent 19679f2 commit 3d94dd1
Show file tree
Hide file tree
Showing 6 changed files with 11 additions and 11 deletions.
4 changes: 2 additions & 2 deletions services/data-homogenise/README.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,5 @@
# [email protected]

Homogénéise les valeurs d'un champs.
Homogénéise les valeurs d'un champ.

Parcourt l'ensemble des valeurs d'un champs et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurences seront remplacées par cette première valeur.
Parcourt l'ensemble des valeurs d'un champ et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurrences seront remplacées par cette première valeur.
4 changes: 2 additions & 2 deletions services/data-homogenise/config.json
Original file line number Diff line number Diff line change
@@ -1,7 +1,7 @@
{
"environnement": {
"EZS_TITLE": "Homogénéise les valeurs d'un champs.",
"EZS_DESCRIPTION": "Parcourt l'ensemble des valeurs d'un champs et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurences seront remplacées par cette première valeur.",
"EZS_TITLE": "Homogénéise les valeurs d'un champ.",
"EZS_DESCRIPTION": "Parcourt l'ensemble des valeurs d'un champ et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurrences seront remplacées par cette première valeur.",
"EZS_METRICS": true,
"EZS_CONCURRENCY": 2,
"EZS_CONTINUE_DELAY": 18000,
Expand Down
2 changes: 1 addition & 1 deletion services/data-homogenise/package.json
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,7 @@
"private": true,
"name": "ws-data-homogenise",
"version": "0.0.0",
"description": "Homogénéise les valeurs d'un champs.",
"description": "Homogénéise les valeurs d'un champ",
"repository": {
"type": "git",
"url": "git+https://github.com/Inist-CNRS/web-services.git"
Expand Down
4 changes: 2 additions & 2 deletions services/data-homogenise/swagger.json
Original file line number Diff line number Diff line change
@@ -1,8 +1,8 @@
{
"openapi": "3.0.0",
"info": {
"title": "data-homogenise - Homogénéise les valeurs d'un champs.",
"description": "Parcourt l'ensemble des valeurs d'un champs et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurences seront remplacées par cette première valeur.",
"title": "data-homogenise - Homogénéise les valeurs d'un champ",
"description": "Parcourt l'ensemble des valeurs d'un champ et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurrences seront remplacées par cette première valeur.",
"version": "0.0.0",
"termsOfService": "https://services.istex.fr/",
"contact": {
Expand Down
4 changes: 2 additions & 2 deletions services/data-homogenise/v1/homogenise.ini
Original file line number Diff line number Diff line change
Expand Up @@ -3,8 +3,8 @@ mimeType = application/json

# OpenAPI Documentation - JSON format (dot notation)
post.operationId = post-v1-homogenise
post.summary = Homogénéise les valeurs d'un champs.
post.description = Parcourt l'ensemble des valeurs d'un champs et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurences seront remplacées par cette première valeur.
post.summary = Homogénéise les valeurs d'un champ
post.description = Parcourt l'ensemble des valeurs d'un champ et regroupe les valeurs sémantiquement ou syntaxiquement très proches. La première valeur rencontrée considérée comme proche est prise comme référence et les prochaines occurrences seront remplacées par cette première valeur.
post.tags.0 = homogenise
post.requestBody.content.application/x-gzip.schema.type = string
post.requestBody.content.application/x-gzip.schema.format = binary
Expand Down
4 changes: 2 additions & 2 deletions services/data-homogenise/v1/homogenise.py
Original file line number Diff line number Diff line change
Expand Up @@ -5,9 +5,9 @@
from sentence_transformers import SentenceTransformer

similarity_threshold = int(sys.argv[sys.argv.index('-p') + 1] if '-p' in sys.argv else 70)/100
if similarity_threshold < 0 :
if similarity_threshold < 0:
similarity_threshold=0.7
if similarity_threshold >1:
if similarity_threshold > 1:
similarity_threshold = 0.7
model = SentenceTransformer('./v1/all-MiniLM-L6-v2')

Expand Down

0 comments on commit 3d94dd1

Please sign in to comment.