Bonjour a tous,
Je requete dans une deux grande tables sensees etre identiques de tres nombreuses lignes. Jusqu'a 400 000 de chaques cotes avec entre 2 et 30 colonnes.
J'aimerais les comparer pour savoir a quel point elles sont differentes si elles le sont.
Jusqu'a maintenant, je comparais dans mon code c# la celule y de la ligne x de la table 1 avec la celule y de la ligne x de la table 2 en ayant trie au prealable mon resultat via un order by dans ma requete sql.
Le probleme, c'est que lorsque j'ai des lignes supplementaires d'un cote ou de l'autre, ca n'est plus du tout efficace. Si par exemple j'ai une ligne manquante des le debut, alors tout est decale et mon resultat donnant 99% de difference n'est pas tres pertinent.
Ma premiere idee fut de rechercher pour chaque ligne de gauche une ligne correspondante a droite mais ca ne me parait pas optimale non plus et je ne trouve pas d'algorithme qui me convienne.
Vous auriez une idee ?
Partager