Bonjour à tous,
Tout d'abord, je ne sais pas du tout si je suis au bon endroit pour traiter de mon sujet, alors je m'excuse par avance si ce n'est pas le cas...
Je travaille actuellement sur un projet BI de moteur de recherche dans le domaine du vin.
Le besoin est de collecter les informations et les prix de vins de dizaines de fournisseurs transmettant des fichiers Excel.
Mon problème est que le nom d'un même producteur ou d'une même appellation peut être orthographié de moultes manières différentes d'un fichier à l'autre.
Exemple :
Colonne A : Nom de Chaque fournisseur
Colonne B : Intitulé du vin donné par le fournisseur
Colonne C : "APPELLATION 1" Retraitement manuel du premier niveau d'appellation
Colonne D : "APPELLATION 2" Retraitement manuel du second niveau d'appellation
Exemple concret :
Colonne B :
Chambolle Musigny 1er Cru Les Fuées
Chambolle Musigny Les Fuees
Chambolle Musigny Les Fuées
Chambolle Musigny- Les Fuées- 1er Cru
Chambolle Musigny Les Fuees
Chambolle Musigny 1er Cru Les Les Fuées
Colonne C : J'ai retraité pour chaque ligne et nommé "Chambolle Musigny"
Colonne D : J'ai retraité pour chaque ligne et nommé "Fuees"
Je me demandais donc si sur la base de mon travail, un outil d'IA ou une technique pourrait m'aider à "macher" le travail par de l'automatisation pour les prochains fournisseurs. Me proposant lorsqu'il détecte grosso modo les mêmes caractères, de remplir seul "Chambolle Musigny" en Colonne C et "Fuees" en Colonne D. Pour un nouveau fournisseur qui pourrait par exemple intituler son vin "Chambollé-Musigny, Les Fuées Grand cru"
Pouvez-vous me venir en aide?
Un grand merci à tous!![]()
Partager