IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

JavaScript Discussion :

javascript regexp qui match un mot indépendamment des accents rencontrés


Sujet :

JavaScript

  1. #1
    Membre actif
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    729
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 729
    Points : 250
    Points
    250
    Par défaut javascript regexp qui match un mot indépendamment des accents rencontrés
    Bonjour,

    par exemple, je recherche à trouver dans une chaine de caractères le mot designation pour le remplacer par une autre chaine de caractère. En plus je voudrais que ce code le fasse pour toutes les occurrences de ce mot indépendamment des accents et des majuscules/minuscules, c'est à dire qu'il me remplace aussi le mot désignation ou dèsignation ou dêsignation ou Désignation ou Dèsignation ou Dêsignation par cette autre chaine de caractère. Cela doit aussi marcher pour d'autres mots avec tout type d'accent, par exemple le a avec à ou â etc...

    J'utilise angular aussi. Il y a peut être une solution de ce coté

    Merci d'avance

  2. #2
    Expert éminent
    Avatar de Watilin
    Homme Profil pro
    En recherche d'emploi
    Inscrit en
    Juin 2010
    Messages
    3 094
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : En recherche d'emploi

    Informations forums :
    Inscription : Juin 2010
    Messages : 3 094
    Points : 6 755
    Points
    6 755
    Par défaut
    Bonjour,
    ton problème est assez proche de celui des collations (en français interclassements) des bases de données, qui consiste à déterminer dans quel ordre doivent être rangés des mots, et donc savoir où se place le é par rapport au e, etc.

    Actuellement les fonctionnalités regexp de JavaScript sont assez limitées et ne reconnaissent que les 26 caractères de a à z (majuscules et minuscules) comme étant des lettres. Pour ajouter les accents, tu n’as pas beaucoup d’options : les coder à la main dans une grosse regexp, au risque d’en oublier, ou bien faire confiance à une bibliothèque tierce.

    Voici un exemple de « grosse regexp » que j’utilise dans un de mes projets :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    var collationRx =
      /([áàâäæãå]+)|([éèêë]+)|([íìîï]+)|([óòôöœõø]+)|([úùûü]+)|([ýÿ]+)|([ç]+)|([ñ]+)|([ð]+)|([ß]+)|([þ]+)/g;
     
    var collationFn = function (_, a, e, i, o, u, y, c, n, d, ss, th) {
      if (a) return "a".repeat(a.length);
      if (e) return "e".repeat(e.length);
      if (i) return "i".repeat(i.length);
      if (o) return "o".repeat(o.length);
      if (u) return "u".repeat(u.length);
      if (y) return "y".repeat(y.length);
      if (c) return "c".repeat(c.length);
      if (n) return "n".repeat(n.length);
      if (d) return "d".repeat(d.length);
      if (ss) return "ss".repeat(ss.length);
      if (th) return "th".repeat(th.length);
    };
    (Note : j’ai même dû en supprimer quelques parties qui ne passaient pas sur ce forum…)

    Elle s’utilise avec la méthode replace comme ceci :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    var text = "Dès Noël où un zéphyr haï me vêt de glaçons würmiens je dîne d’exquis rôtis de bœuf au kir à l’aÿ d’âge mûr & cætera !";
    console.log(text.toLowerCase().replace(collationRx, collationFn));
    // "des noel ou un zephyr hai me vet de glacons wurmiens je dine d’exquis rotis de bouf au kir a l’ay d’age mur & catera !"
    La piste d’une bibli tierce pourrait t’amener sur quelque chose de plus fiable, malheureusement je n’ai pas suffisamment d’expérience pour t’en conseiller une digne de ce nom. Je te laisse faire des recherches ou attendre l’intervention de quelqu’un d’autre

    Un peu de lecture : JavaScript has a Unicode problem

  3. #3
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    Mars 2002
    Messages
    39 640
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 74
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2002
    Messages : 39 640
    Points : 66 665
    Points
    66 665
    Billets dans le blog
    1
    Par défaut
    @Watilin

    Je connaissais le principe du callback pour le replace, mais pas le repeat
    quel est est l'intérêt ?

  4. #4
    Expert éminent
    Avatar de Watilin
    Homme Profil pro
    En recherche d'emploi
    Inscrit en
    Juin 2010
    Messages
    3 094
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : En recherche d'emploi

    Informations forums :
    Inscription : Juin 2010
    Messages : 3 094
    Points : 6 755
    Points
    6 755
    Par défaut
    C’est pour les cas où l’occurence fait plusieurs caractères de long. Ça a peu de chances de se produire en langue naturelle, mais j’avais un truc comme ça dans mon jeu de tests.

    Si on prend une chaîne reconnue par le groupe /([éèêë]+)/, par exemple "béêë", la correspondance aura une longueur de 3 et sera remplacée par "e".repeat(3). Le résultat sera "beee". Sans le repeat, ça aurait donné "be"

  5. #5
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    Mars 2002
    Messages
    39 640
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 74
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2002
    Messages : 39 640
    Points : 66 665
    Points
    66 665
    Billets dans le blog
    1
    Par défaut
    Très intéressant
    Merci pour cette précision

Discussions similaires

  1. [MySQL-5.6] trouver des lignes dans une table qui correspondent à certains mots dans une string
    Par trucmuche2005 dans le forum Requêtes
    Réponses: 1
    Dernier message: 07/12/2017, 15h06
  2. RegExp rechercher mot avec des caractères qui diffèrent
    Par magic_dav dans le forum VBScript
    Réponses: 3
    Dernier message: 25/07/2012, 15h41
  3. RegExp qui verifie qu un mot = PLC
    Par xoco dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 17/04/2009, 17h34
  4. Réponses: 3
    Dernier message: 08/09/2003, 15h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo