Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Avoid using unnecessay key variables in multi-table feature construction
Contexte - schema en etoile, construction de variable - comme la cle d'une sous-table (du moins la sous-partie commune à la cle de la table mere) ne peut contenir d'information dejà traitee dans le dictionnaire parent, cette cle n'est pas exploitee pour la construction de variable - exemple: SpliceJunction - la variable SampleId est utilise en cle de SpliceJunction - la variable SampleId est utilisee en cle de la table secondaire SpliceJunctionDNA - on n'exploite donc pas cette variable Probleme potrentiel: - si le champ cle de la table secondaire a un autre nom, cette variable secondaire peut alors etre traitee à tort comme un champ non cle distinct de la cle du dictionnaire parent, et etre exploitee pour la construction de variable - exemple: - SpliceJunction, en renommant Sample_Id en SampleId dans la table secondaire - les resultats de modelisation en generant 100 variables seraient alors differents à tort En fait, le probleme est deja traite correctement dans le code - KDMultiTableFeatureConstruction::ComputeAllClassesCompliantRules - on a uniquement enrichi le commentaire, et corrige les typos Ajout d'un jeu de test dedie LearningTest\TestKhiops\MultiTables\SchemaDifferentKeyNames
- Loading branch information