IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Requêtes MySQL Discussion :

Score incohérent avec une recherche sur des index fulltext


Sujet :

Requêtes MySQL

  1. #1
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut Score incohérent avec une recherche sur des index fulltext
    Bonjour,

    MySQL 5.6 + PhpMyAdmin 4.2.12

    J'ai développé un petit module de recherche dans un site qui fonctionne très bien jusqu'à ce qu'un utilisateur découvre une "anomalie"...
    En mode résumé, j'ai une table "document" contenant 3 champs ayant un index FULLTEXT (codification, intitule et commentaire) dans une base InnoDB
    D'après mes tests il y a un souci de score. Exemple ici avec la recherche "com" sur un jeu d'essai :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    SELECT 
    	d.id AS id, 
    	d.codification AS codification, 
    	d.intitule AS intitule,
    	d.commentaire AS commentaire,
    	MATCH(codification) AGAINST ('com*' IN BOOLEAN MODE) AS score_codification,
    	MATCH(intitule) AGAINST ('com*' IN BOOLEAN MODE) AS score_intitule, 
    	MATCH(commentaire) AGAINST ('com*' IN BOOLEAN MODE) AS score_commentaire
    FROM document AS d
    WHERE 
    	d.fk_processus = 18
    Nom : firefox_2019-01-14_15-27-18.png
Affichages : 414
Taille : 31,4 Ko

    J'obtiens des scores 0 sur les 3 colonnes alors qu'il y a bien la présence de "com". Au début j'ai cru à un problème lié au caractère "-"
    Voici un contre exemple avec la recherche avec "san" (qui fonctionne bien pour le coup)

    Nom : firefox_2019-01-14_15-39-05.png
Affichages : 365
Taille : 21,1 Ko

    voici la structure de la table:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    CREATE TABLE IF NOT EXISTS `document` (
    `id` int(5) unsigned NOT NULL,
      `codification` varchar(20) NOT NULL,
      `intitule` varchar(130) NOT NULL,
      `commentaire` text,
      `contenu` text,
      `fk_processus` int(2) unsigned NOT NULL
    ) ENGINE=InnoDB AUTO_INCREMENT=275 DEFAULT CHARSET=latin1;
     
    ALTER TABLE `document` ADD PRIMARY KEY (`id`);
    ALTER TABLE `document` ADD UNIQUE KEY `codification` (`codification`);
    ALTER TABLE `document` ADD FULLTEXT KEY `search_codification` (`codification`); 
    ALTER TABLE `document` ADD FULLTEXT KEY `search_intitule` (`intitule`);
    ALTER TABLE `document` ADD FULLTEXT KEY `search_commentaire` (`commentaire`);
    ALTER TABLE `document` ADD FULLTEXT KEY `search_contenu` (`contenu`);
    ALTER TABLE `document` MODIFY `id` int(5) unsigned NOT NULL AUTO_INCREMENT,AUTO_INCREMENT=275;
    Des idées ?
    Merci d'avance !

  2. #2
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 759
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 759
    Points : 52 540
    Points
    52 540
    Billets dans le blog
    5
    Par défaut
    Par défaut MySQL n'index pas les mots de moins de 4 lettres.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  3. #3
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    Comme indiqué dans mon contre exemple... ça fonctionne très bien avec "san"

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 759
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 759
    Points : 52 540
    Points
    52 540
    Billets dans le blog
    5
    Par défaut
    Ce sont les mystères de MySQmerde !!!!!

    A lire : https://blog.developpez.com/sqlpro/p...oudre_aux_yeux

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  5. #5
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    Merci pour cet article... ce qui est sûr c'est que tu n'aimes pas MySQL. Mais franchement 95% de choses que tu lui reproche ne sont utilisées que par 5% des personnes.

    Dans mon cas, j'ai développé pas mal de site basé sur MySQL... jamais eu de souci. Jusqu'à aujourd'hui

  6. #6
    Expert éminent sénior Avatar de Artemus24
    Homme Profil pro
    Agent secret au service du président Ulysses S. Grant !
    Inscrit en
    Février 2011
    Messages
    6 378
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Agent secret au service du président Ulysses S. Grant !
    Secteur : Finance

    Informations forums :
    Inscription : Février 2011
    Messages : 6 378
    Points : 19 054
    Points
    19 054
    Par défaut
    Salut à tous.

    Voici un exmple avec votre jeu d'essai :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    --------------
    START TRANSACTION
    --------------
     
    --------------
    DROP DATABASE IF EXISTS `base`
    --------------
     
    --------------
    CREATE DATABASE `base`
            DEFAULT CHARACTER SET `latin1`
            DEFAULT COLLATE       `latin1_general_ci`
    --------------
     
    --------------
    DROP TABLE IF EXISTS `document`
    --------------
     
    --------------
    CREATE TABLE `document`
    ( `id`             integer unsigned NOT NULL PRIMARY KEY,
      `codification`   text             NOT NULL,
      `intitule`       text             NOT NULL,
      `commentaire`    text                 NULL,
      fulltext key `ft1` (`codification`),
      fulltext key `ft2` (`intitule`),
      fulltext key `ft3` (`commentaire`)
    ) ENGINE=InnoDB
      DEFAULT CHARSET=`latin1` COLLATE=`latin1_general_ci`
      ROW_FORMAT=COMPRESSED
    --------------
     
    --------------
    INSERT INTO `document` (`id`,`codification`,`intitule`,`commentaire`) VALUES
      ( 45, 'HABT-COMX-G001', 'Logo HABITATS Couleur Jpeg',            NULL),
      ( 69, 'IME0-COM G001',  'Plan d''accès IME',                     NULL),
      (127, 'SAMO COM-G001',  'Plan d''accès SESSAD 1 com',            NULL),
      (128, 'SAMO COM-G002',  'Plan d''accès SESSAD 2',                NULL),
      (155, 'ASSO COM-G001',  'Plaquette',                             'com'),
      (156, 'ASSO COM-G002',  'Plan d''accès',                         'comm'),
      (157, 'ASSO COM-G003',  'Plan du site',                          'xcomx'),
      (158, 'ASSO COM-G004',  'Logo Couleur JPEG',                     '-COM-'),
      (159, 'ASSO COMM-G005', 'Logo Couleur GIF',                      NULL),
      (160, 'ASSO COM-G006',  'Logo Noir et Blanc JPEG communication', NULL)
    --------------
     
    --------------
    select * from document
    --------------
     
    +-----+----------------+---------------------------------------+-------------+
    | id  | codification   | intitule                              | commentaire |
    +-----+----------------+---------------------------------------+-------------+
    |  45 | HABT-COMX-G001 | Logo HABITATS Couleur Jpeg            | NULL        |
    |  69 | IME0-COM G001  | Plan d'accès IME                      | NULL        |
    | 127 | SAMO COM-G001  | Plan d'accès SESSAD 1 com             | NULL        |
    | 128 | SAMO COM-G002  | Plan d'accès SESSAD 2                 | NULL        |
    | 155 | ASSO COM-G001  | Plaquette                             | com         |
    | 156 | ASSO COM-G002  | Plan d'accès                          | comm        |
    | 157 | ASSO COM-G003  | Plan du site                          | xcomx       |
    | 158 | ASSO COM-G004  | Logo Couleur JPEG                     | -COM-       |
    | 159 | ASSO COMM-G005 | Logo Couleur GIF                      | NULL        |
    | 160 | ASSO COM-G006  | Logo Noir et Blanc JPEG communication | NULL        |
    +-----+----------------+---------------------------------------+-------------+
    --------------
    commit
    --------------
     
    --------------
    show variables like "%version%"
    --------------
     
    +-------------------------+------------------------------+
    | Variable_name           | Value                        |
    +-------------------------+------------------------------+
    | innodb_version          | 8.0.13                       |
    | protocol_version        | 10                           |
    | slave_type_conversions  |                              |
    | tls_version             | TLSv1,TLSv1.1,TLSv1.2        |
    | version                 | 8.0.13                       |
    | version_comment         | MySQL Community Server - GPL |
    | version_compile_machine | x86_64                       |
    | version_compile_os      | Win64                        |
    | version_compile_zlib    | 1.2.11                       |
    +-------------------------+------------------------------+
    --------------
    show variables like 'innodb_ft%'
    --------------
     
    +---------------------------------+------------+
    | Variable_name                   | Value      |
    +---------------------------------+------------+
    | innodb_ft_aux_table             |            |
    | innodb_ft_cache_size            | 8000000    |
    | innodb_ft_enable_diag_print     | OFF        |
    | innodb_ft_enable_stopword       | OFF        |
    | innodb_ft_max_token_size        | 10         |
    | innodb_ft_min_token_size        | 0          |
    | innodb_ft_num_word_optimize     | 2000       |
    | innodb_ft_result_cache_limit    | 2000000000 |
    | innodb_ft_server_stopword_table |            |
    | innodb_ft_sort_pll_degree       | 2          |
    | innodb_ft_total_cache_size      | 640000000  |
    | innodb_ft_user_stopword_table   |            |
    +---------------------------------+------------+
    --------------
    SELECT  *,
            MATCH(`codification`) AGAINST ('com*' IN BOOLEAN MODE) AS score_codification,
            MATCH(`intitule`)     AGAINST ('com*' IN BOOLEAN MODE) AS score_intitule,
            MATCH(`commentaire`)  AGAINST ('com*' IN BOOLEAN MODE) AS score_commentaire
      FROM  `document`
    --------------
     
    +-----+----------------+---------------------------------------+-------------+----------------------------+----------------+--------------------+
    | id  | codification   | intitule                              | commentaire | score_codification         | score_intitule | score_commentaire  |
    +-----+----------------+---------------------------------------+-------------+----------------------------+----------------+--------------------+
    |  45 | HABT-COMX-G001 | Logo HABITATS Couleur Jpeg            | NULL        | 0.000000001885928302414186 |              0 |                  0 |
    |  69 | IME0-COM G001  | Plan d'accès IME                      | NULL        | 0.000000001885928302414186 |              0 |                  0 |
    | 127 | SAMO COM-G001  | Plan d'accès SESSAD 1 com             | NULL        | 0.000000001885928302414186 |              1 |                  0 |
    | 128 | SAMO COM-G002  | Plan d'accès SESSAD 2                 | NULL        | 0.000000001885928302414186 |              0 |                  0 |
    | 155 | ASSO COM-G001  | Plaquette                             | com         | 0.000000001885928302414186 |              0 | 0.2734021842479706 |
    | 156 | ASSO COM-G002  | Plan d'accès                          | comm        | 0.000000001885928302414186 |              0 | 0.2734021842479706 |
    | 157 | ASSO COM-G003  | Plan du site                          | xcomx       | 0.000000001885928302414186 |              0 |                  0 |
    | 158 | ASSO COM-G004  | Logo Couleur JPEG                     | -COM-       | 0.000000001885928302414186 |              0 | 0.2734021842479706 |
    | 159 | ASSO COMM-G005 | Logo Couleur GIF                      | NULL        | 0.000000001885928302414186 |              0 |                  0 |
    | 160 | ASSO COM-G006  | Logo Noir et Blanc JPEG communication | NULL        | 0.000000001885928302414186 |              0 |                  0 |
    +-----+----------------+---------------------------------------+-------------+----------------------------+----------------+--------------------+
    --------------
    COMMIT
    --------------
     
    Appuyez sur une touche pour continuer...
    A la colonne commentaire pour la ligne 157, "xcomx" ne donne aucun résultat pour le score_commentaire, mais c'est normal.

    Quel type de jeu de caractères utilisez-vous ? UTF8 je suppose, dans tous les cas ?

    @+
    Si vous êtes de mon aide, vous pouvez cliquer sur .
    Mon site : http://www.jcz.fr

  7. #7
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    Bonjour Artemus24
    ma base et table sont en latin1 et latin1_swedish_ci.
    J'ai repris ton script mais je n'obtiens pas les même résultats...
    bon, entre temps j'ai upgradé mon serveur en Debian 9.6 avec MariaDB 10
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
     
    MariaDB [(none)]> CREATE DATABASE `base`
        ->         DEFAULT CHARACTER SET `latin1`
        ->         DEFAULT COLLATE       `latin1_general_ci`;
    Query OK, 1 row affected (0.00 sec)
     
    MariaDB [(none)]> use base;
    Database changed
     
    MariaDB [base]> CREATE TABLE `document`
        -> ( `id`             integer unsigned NOT NULL PRIMARY KEY,
        ->   `codification`   text             NOT NULL,
        ->   `intitule`       text             NOT NULL,
        ->   `commentaire`    text                 NULL,
        ->   fulltext key `ft1` (`codification`),
        ->   fulltext key `ft2` (`intitule`),
        ->   fulltext key `ft3` (`commentaire`)
        -> ) ENGINE=InnoDB
        ->   DEFAULT CHARSET=`latin1` COLLATE=`latin1_general_ci`
        ->   ROW_FORMAT=COMPRESSED;
    Query OK, 0 rows affected, 2 warnings (0.07 sec)
     
    MariaDB [base]> INSERT INTO `document` (`id`,`codification`,`intitule`,`commentaire`) VALUES
        ->   ( 45, 'HABT-COMX-G001', 'Logo HABITATS Couleur Jpeg',            NULL),
        ->   ( 69, 'IME0-COM G001',  'Plan d''accès IME',                     NULL),
        ->   (127, 'SAMO COM-G001',  'Plan d''accès SESSAD 1 com',            NULL),
        ->   (128, 'SAMO COM-G002',  'Plan d''accès SESSAD 2',                NULL),
        ->   (155, 'ASSO COM-G001',  'Plaquette',                             'com'),
        ->   (156, 'ASSO COM-G002',  'Plan d''accès',                         'comm'),
        ->   (157, 'ASSO COM-G003',  'Plan du site',                          'xcomx'),
        ->   (158, 'ASSO COM-G004',  'Logo Couleur JPEG',                     '-COM-'),
        ->   (159, 'ASSO COMM-G005', 'Logo Couleur GIF',                      NULL),
        ->   (160, 'ASSO COM-G006',  'Logo Noir et Blanc JPEG communication', NULL);
    Query OK, 10 rows affected (0.01 sec)
    Records: 10  Duplicates: 0  Warnings: 0
     
    MariaDB [base]> select * from document;
    +-----+----------------+---------------------------------------+-------------+
    | id  | codification   | intitule                              | commentaire |
    +-----+----------------+---------------------------------------+-------------+
    |  45 | HABT-COMX-G001 | Logo HABITATS Couleur Jpeg            | NULL        |
    |  69 | IME0-COM G001  | Plan d'accès IME                      | NULL        |
    | 127 | SAMO COM-G001  | Plan d'accès SESSAD 1 com             | NULL        |
    | 128 | SAMO COM-G002  | Plan d'accès SESSAD 2                 | NULL        |
    | 155 | ASSO COM-G001  | Plaquette                             | com         |
    | 156 | ASSO COM-G002  | Plan d'accès                          | comm        |
    | 157 | ASSO COM-G003  | Plan du site                          | xcomx       |
    | 158 | ASSO COM-G004  | Logo Couleur JPEG                     | -COM-       |
    | 159 | ASSO COMM-G005 | Logo Couleur GIF                      | NULL        |
    | 160 | ASSO COM-G006  | Logo Noir et Blanc JPEG communication | NULL        |
    +-----+----------------+---------------------------------------+-------------+
    10 rows in set (0.00 sec)
     
    MariaDB [base]> show variables like "%version%";
    +-------------------------+--------------------------+
    | Variable_name           | Value                    |
    +-------------------------+--------------------------+
    | innodb_version          | 5.6.41-84.1              |
    | protocol_version        | 10                       |
    | slave_type_conversions  |                          |
    | version                 | 10.1.37-MariaDB-0+deb9u1 |
    | version_comment         | Debian 9.6               |
    | version_compile_machine | x86_64                   |
    | version_compile_os      | debian-linux-gnu         |
    | version_malloc_library  | system jemalloc          |
    | version_ssl_library     | YaSSL 2.4.4              |
    | wsrep_patch_version     | wsrep_25.23              |
    +-------------------------+--------------------------+
    10 rows in set (0.00 sec)
     
    MariaDB [base]> show variables like 'innodb_ft%';
    +---------------------------------+------------+
    | Variable_name                   | Value      |
    +---------------------------------+------------+
    | innodb_ft_aux_table             |            |
    | innodb_ft_cache_size            | 8000000    |
    | innodb_ft_enable_diag_print     | OFF        |
    | innodb_ft_enable_stopword       | ON         |
    | innodb_ft_max_token_size        | 84         |
    | innodb_ft_min_token_size        | 3          |
    | innodb_ft_num_word_optimize     | 2000       |
    | innodb_ft_result_cache_limit    | 2000000000 |
    | innodb_ft_server_stopword_table |            |
    | innodb_ft_sort_pll_degree       | 2          |
    | innodb_ft_total_cache_size      | 640000000  |
    | innodb_ft_user_stopword_table   |            |
    +---------------------------------+------------+
    12 rows in set (0.00 sec)
     
    MariaDB [base]> SELECT  *,
        ->         MATCH(`codification`) AGAINST ('com*' IN BOOLEAN MODE) AS score_codification,
        ->         MATCH(`intitule`)     AGAINST ('com*' IN BOOLEAN MODE) AS score_intitule,
        ->         MATCH(`commentaire`)  AGAINST ('com*' IN BOOLEAN MODE) AS score_commentaire
        ->   FROM  `document`;
    +-----+----------------+---------------------------------------+-------------+--------------------+----------------+-------------------+
    | id  | codification   | intitule                              | commentaire | score_codification | score_intitule | score_commentaire |
    +-----+----------------+---------------------------------------+-------------+--------------------+----------------+-------------------+
    |  45 | HABT-COMX-G001 | Logo HABITATS Couleur Jpeg            | NULL        | 0.4885590672492981 |              0 |                 0 |
    |  69 | IME0-COM G001  | Plan d'accès IME                      | NULL        |                  0 |              0 |                 0 |
    | 127 | SAMO COM-G001  | Plan d'accès SESSAD 1 com             | NULL        |                  0 |              0 |                 0 |
    | 128 | SAMO COM-G002  | Plan d'accès SESSAD 2                 | NULL        |                  0 |              0 |                 0 |
    | 155 | ASSO COM-G001  | Plaquette                             | com         |                  0 |              0 |                 0 |
    | 156 | ASSO COM-G002  | Plan d'accès                          | comm        |                  0 |              0 |                 1 |
    | 157 | ASSO COM-G003  | Plan du site                          | xcomx       |                  0 |              0 |                 0 |
    | 158 | ASSO COM-G004  | Logo Couleur JPEG                     | -COM-       |                  0 |              0 |                 0 |
    | 159 | ASSO COMM-G005 | Logo Couleur GIF                      | NULL        | 0.4885590672492981 |              0 |                 0 |
    | 160 | ASSO COM-G006  | Logo Noir et Blanc JPEG communication | NULL        |                  0 |              1 |                 0 |
    +-----+----------------+---------------------------------------+-------------+--------------------+----------------+-------------------+
    10 rows in set (0.00 sec)

  8. #8
    Expert éminent sénior Avatar de Artemus24
    Homme Profil pro
    Agent secret au service du président Ulysses S. Grant !
    Inscrit en
    Février 2011
    Messages
    6 378
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Agent secret au service du président Ulysses S. Grant !
    Secteur : Finance

    Informations forums :
    Inscription : Février 2011
    Messages : 6 378
    Points : 19 054
    Points
    19 054
    Par défaut
    Salut Tchupacabra.

    J'ai fait le test sous mysql 8.0.13 et non sous mariadb.
    J'ai refait le même test, mais cette fois-ci sous mariadb 10.3.11 et j'obtiens le même résultat.

    Citation Envoyé par Tchupacabra
    ma base et table sont en latin1 et latin1_swedish_ci.
    Je suis en latin1_general_ci.
    Avez-vous bien précisez ceci dans votre fichier my.ini :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    init-connect = 'SET NAMES latin1 COLLATE latin1_general_ci'
    Citation Envoyé par Tchupacabra
    J'ai repris ton script mais je n'obtiens pas les même résultats...
    La différence vient peut-être de votre paramétrage. je vous donne mon paramétrage pour FTS :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    # -------------------------#
    #     Full Text Search     #
    # -------------------------#
     
    ft-max-word-len            = 10
    ft-min-word-len            = 1
    ft-stopword-file           = ""
     
    innodb-ft-enable-stopword  = off
    innodb-ft-max-token-size   = 10
    innodb-ft-min-token-size   = 0
    Je remarque ceci dans votre exemple lors de la création de la table 'document' :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Query OK, 0 rows affected, 2 warnings (0.07 sec)
    Quel est la nature de ces deux warnings ?

    Voici le fichier my.ini pour mariadb que j'utilise :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    216
    217
    218
    219
    220
    221
    222
    223
    224
    225
    226
    227
    228
    229
    230
    231
    232
    233
    234
    235
    236
    237
    238
    239
    240
    241
    242
    243
    244
    245
    246
    247
    248
    249
    250
    251
    252
    253
    254
    255
    256
    257
    258
    259
    260
    261
    262
    263
    264
    265
    266
    267
    268
    269
    270
    271
    272
    273
    274
    275
    276
    277
    278
    279
    280
    281
    282
    283
    284
    285
    286
    287
    288
    289
    290
    291
    292
    293
    294
    295
    296
    297
    298
    299
    300
    301
    302
    303
    304
    305
    306
    307
    308
    309
    310
    311
    312
    313
    314
    315
    316
    317
    318
    319
    320
    321
    322
    323
    324
    325
    326
    327
    328
    329
    330
    331
    332
    333
    334
    335
    336
    337
    338
    339
    340
    341
    342
    343
    344
    345
    346
    347
    348
    349
    350
    351
    352
    353
    354
    355
    356
    357
    358
    359
    360
    361
    362
    363
    364
    365
    366
    367
    368
    369
    370
    371
    372
    373
    374
    375
    376
    377
    378
    379
    # ********************* #
    #                       #
    #     Sphere "Bleu"     #
    #                       #
    # ********************* #
     
    # ====================== #
    #     mariadb Client     #
    # ====================== #
     
    [client]
    port   = 3307
    socket = mariadb
     
    # ----------------------- #
    #     access features     #
    # ----------------------- #
     
    user     = root
    password = root
    host     = 127.0.0.1
     
    # --------------- #
    #     Charset     #
    # --------------- #
     
    default-character-set = latin1
     
     
    # ====================== #
    #     mariadb Server     #
    # ====================== #
     
    [wampmariadbd]
    port   = 3307
    socket = mariadb
     
    # -------------- #
    #     Master     #
    # -------------- #
     
    server-id = 1
    skip-slave-start
     
    # --------------- #
    #     Charset     #
    # --------------- #
     
    character-set-server     = latin1
    collation-server         = latin1_general_ci
    character-set-filesystem = latin1
     
    init-connect             = 'SET collation_connection = latin1_general_ci; SET NAMES latin1 COLLATE latin1_general_ci'
     
    # ------------------- #
    #     Date & Time     #
    # ------------------- #
     
    default-time-zone = SYSTEM
     
    explicit-defaults-for-timestamp = on
     
    # ------------------- #
    #     Directories     #
    # ------------------- #
     
    basedir = f:/Wamp/bin/mariadb/mariadb10.3.11/
    datadir = f:/Wamp/bin/mariadb/mariadb10.3.11/data
    tmpdir  = f:/Wamp/tmp
     
    # -------------------------#
    #     Full Text Search     #
    # -------------------------#
     
    ft-max-word-len  = 10
    ft-min-word-len  = 1
    ft-stopword-file = ""
     
    # ---------------#
    #     InnoDB     #
    # ---------------#
     
    default-storage-engine              = InnoDB
    default-tmp-storage-engine          = InnoDB
     
    innodb-adaptive-hash-index          = on
     
    innodb-buffer-pool-dump-now         = off
    innodb-buffer-pool-dump-at-shutdown = off
    innodb-buffer-pool-instances        = 2
    innodb-buffer-pool-load-at-startup  = OFF
    innodb-buffer-pool-size             = 1G
     
    innodb-data-file-path               = ibdata1:12M:autoextend
    innodb-data-home-dir                = f:/Wamp/bin/mariadb/mariadb10.3.11/data/ibdata/
    innodb-doublewrite                  = 1
    #skip-innodb_doublewrite
     
    innodb-encrypt-tables               = on
    innodb-encrypt-log                  = on
     
    innodb-encryption-threads           = 4
    innodb-encryption-rotate-key-age    = 5
     
    innodb-file-per-table               = 1
     
    innodb-flush-log-at-trx-commit      = 1
    #innodb-force-recovery               = 1
     
    innodb-ft-enable-stopword           = off
    innodb-ft-max-token-size            = 10
    innodb-ft-min-token-size            = 0
     
    innodb-io-capacity                  = 2000
    innodb-max-dirty-pages-pct          = 80
    innodb-lock-wait-timeout            = 600
     
    innodb-log-buffer-size              = 16M
    innodb-log-file-size                = 20M
    innodb-log-files-in-group           = 2
    innodb-log-group-home-dir           = f:/Wamp/bin/mariadb/mariadb10.3.11/data/ibdata/
     
    innodb-optimize-fulltext-only       = 1
     
    innodb-page-size                    = 16K
    innodb-purge-threads                = 10
     
    innodb-read-io-threads              = 4
     
    innodb-stats-on-metadata            = 0
     
    innodb-tablespaces-encryption       = 1
    innodb-thread-concurrency           = 16
     
    innodb-write-io-threads             = 4
     
    # ---------------- #
    #     Language     #
    # ---------------- #
     
    lc-messages   = fr_FR
    lc-time-names = fr_FR
     
    # ------------#
    #     Log     #
    # ------------#
     
    #binlog-cache-size  = 1M
    #binlog-format      = mixed
     
    #log-bin            = f:/Wamp/logs/mariadb_bin
    log-error           = f:/Wamp/logs/mariadb_error.log
     
    ###log-queries-not-using-indexes          = 1
    #log-throttle-queries-not-using-indexes = 60
     
    general-log         = off
    general-log-file    = f:/Wamp/logs/mariadb_general.log
     
    # ------------#
    #     Max     #
    # ------------#
     
    max-allowed-packet     = 16M
    max-connections        = 20
    max-connect-errors     = 10
    max-error-count        = 64
    max-heap-table-size    = 1G
    max-user-connections   = 0
    max-sp-recursion-depth = 255
     
    # --------------------#
    #     Buffer-Size     #
    # --------------------#
     
    join-buffer-size      = 512M
    read-buffer-size      = 512M
    read-rnd-buffer-size  = 512M
    sort-buffer-size      = 512M
     
    # ---------------#
    #     MyIsam     #
    # ---------------#
     
    bulk-insert-buffer-size   = 64M
     
    key-buffer-size           = 2G
     
    myisam-max-sort-file-size = 1G
    myisam-recover-options    = 1
    myisam-repair-threads     = 1
    myisam-sort-buffer-size   = 128M
    myisam-stats-method       = nulls_unequal
    myisam-use-mmap           = OFF
     
    # -------------------#
    #     Networking     #
    # -------------------#
     
    back-log           = 50
     
    net-buffer-length  = 8K
    net-read-timeout   = 60
    net-write-timeout  = 60
     
    # ---------------------------#
    #     Performance-Schema     #
    # ---------------------------#
     
    # performance-schema                                = ON
    # performance-schema-events-waits-history-size      = 20
    # performance-schema-events-waits-history-long-size = 1500
     
    # --------------------------#
    #     Plugin & File_key     #
    # --------------------------#
     
    plugin-load-add                          = file_key_management.dll
     
    file-key-management
    file-key-management-filename             = "F:/Wamp/bin/mariadb/mariadb10.3.11/keys.txt"
    file_key_management_encryption_algorithm = AES_CBC
     
    # --------------#
    #     Query     #
    # --------------#
     
    query-alloc-block-size       = 8M
    query-cache-limit            = 1G
    query-cache-min-res-unit     = 4096
    query-cache-size             = 512M
    query-cache-type             = On
    query-cache-wlock-invalidate = Off
     
    # -------------#
    #     Skip     #
    # -------------#
     
    #skip-innodb-doublewrite
     
    skip-external-locking
    #skip-log-warnings
    # skip-innodb-adaptive-hash-index
     
    # --------------------#
    #     Slow & Long     #
    # --------------------#
     
    long-query-time     = 0
     
    slow-query-log      = 0
    slow-query-log-file = f:/Wamp/logs/mariadb_slow.log
     
    # ------------#
    #     Ssl     #
    # ------------#
     
    skip-ssl
     
    # --------------#
    #     Table     #
    # --------------#
     
    table-definition-cache = 512
    table-open-cache       = 512
     
    # -------------------#
    #     Temp Table     #
    # -------------------#
     
    tmp-table-size = 1G
     
    # ---------------#
    #     Thread     #
    # ---------------#
     
    thread-cache-size = 8
    thread-stack      = 256K
     
    # ------------------------------#
    #     Timeout Configuration     #
    # ------------------------------#
     
    connect-timeout     = 600
    interactive-timeout = 600
    wait-timeout        = 600
     
    # --------------------#
    #     Transaction     #
    # --------------------#
     
    transaction-isolation = SERIALIZABLE
     
    # ---------------#
    #     Tuning     #
    # ---------------#
     
    concurrent-insert = 2
    open-files-limit  = 8192
     
    # secure-file-priv  = f:/wamp/tmp/
     
     
    # =================== #
    #     mysql Admin     #
    # =================== #
     
    [mysqldadmin]
    force
     
     
    # ================== #
    #     mysql Dump     #
    # ================== #
     
    [mysqldump]
    add-drop-database
    add-drop-table
    add-drop-trigger
     
    default-character-set = utf8
     
    flush-logs
    flush-privileges
     
    lock-all-tables
    max-allowed-packet    = 16M
    no-autocommit
    order-by-primary
    quick
    routines
     
    skip-comments
    skip-opt
    skip-set-charset
    skip-tz-utc
     
    triggers
     
     
    # ===================== #
    #     My Isam Check     #
    # ===================== #
     
    [myisamchk]
    key-buffer-size  = 128M
    sort-buffer-size = 128M
    read-buffer      = 2M
    write-buffer     = 2M
     
     
    # ====================== #
    #     mysql Hot Copy     #
    # ====================== #
     
    [mysqlhotcopy]
    interactive-timeout
     
     
    # ===================== #
    #     mysql Monitor     #
    # ===================== #
     
    [mysql]
    default-character-set = latin1
    no-auto-rehash
    #safe-updates
    skip-reconnect
    table
     
     
    # ================== #
    #     mysql Safe     #
    # ================== #
     
    [mysqld_safe]
    open-files-limit = 8192
     
    log-error        = f:/Wamp/logs/mariadb_error.log
    @+
    Si vous êtes de mon aide, vous pouvez cliquer sur .
    Mon site : http://www.jcz.fr

  9. #9
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    Salut,

    bon j'ai résolu mon problème !
    surprise en découvrant mon mot de recherche "COM" dans le contenu des INNODB_FT_DEFAULT_STOPWORD :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    MariaDB [(none)]> SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;
    +-------+
    | value |
    +-------+
    | a     |
    | about |
    | an    |
    | are   |
    | as    |
    | at    |
    | be    |
    | by    |
    | com   |
    | de    |
    | en    |
    | for   |
    | from  |
    | how   |
    | i     |
    | in    |
    | is    |
    | it    |
    | la    |
    | of    |
    | on    |
    | or    |
    | that  |
    | the   |
    | this  |
    | to    |
    | was   |
    | what  |
    | when  |
    | where |
    | who   |
    | will  |
    | with  |
    | und   |
    | the   |
    | www   |
    +-------+
    36 rows in set (0.00 sec)
    Problème résolu en rajoutant simplement dans le groupe [mysqld] du fichier my.cnf :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    innodb-ft-enable-stopword  = off
    Mes scores sont à présent corrects. Et je comprends pourquoi ils étaient bons avec "SAN"...

    PS : les warnings sont liés à "ROW_FORMAT=COMPRESSED" :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    MariaDB [base]> CREATE TABLE `document`
        -> ( `id`             integer unsigned NOT NULL PRIMARY KEY,
        ->   `codification`   text             NOT NULL,
        ->   `intitule`       text             NOT NULL,
        ->   `commentaire`    text                 NULL,
        ->   fulltext key `ft1` (`codification`),
        ->   fulltext key `ft2` (`intitule`),
        ->   fulltext key `ft3` (`commentaire`)
        -> ) ENGINE=InnoDB
        ->   DEFAULT CHARSET=`latin1` COLLATE=`latin1_general_ci`
        ->   ROW_FORMAT=COMPRESSED;
    Query OK, 0 rows affected, 2 warnings (0.06 sec)
     
    MariaDB [base]> show warnings;
    +---------+------+-----------------------------------------------------------------------+
    | Level   | Code | Message                                                               |
    +---------+------+-----------------------------------------------------------------------+
    | Warning | 1478 | InnoDB: ROW_FORMAT=COMPRESSED requires innodb_file_format > Antelope. |
    | Warning | 1478 | InnoDB: assuming ROW_FORMAT=COMPACT.                                  |
    +---------+------+-----------------------------------------------------------------------+
    2 rows in set (0.00 sec)

    Merci pour ton aide Artemus24

  10. #10
    Expert éminent sénior Avatar de Artemus24
    Homme Profil pro
    Agent secret au service du président Ulysses S. Grant !
    Inscrit en
    Février 2011
    Messages
    6 378
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Agent secret au service du président Ulysses S. Grant !
    Secteur : Finance

    Informations forums :
    Inscription : Février 2011
    Messages : 6 378
    Points : 19 054
    Points
    19 054
    Par défaut
    Salut Tchupacabra.

    En regardant de plus près mon paramétrage de "Full Text Search dans mon fichier "my.ini", j'ai pourtant indiqué que je n'utilisais pas le fichier standard des "stopword".
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    innodb-ft-enable-stopword  = off
    De ce fait, aucun mot n'est rejeté !

    Mais cela n'explique pas pourquoi certains cas fonctionnent alors que le mot "com" est rejeté.

    Je suppose que vous n'avez pas bien configuré votre fichier my.ini à ce sujet.

    Si c'est résolu, tant mieux !

    @+
    Si vous êtes de mon aide, vous pouvez cliquer sur .
    Mon site : http://www.jcz.fr

  11. #11
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    Citation Envoyé par Artemus24 Voir le message
    Salut Tchupacabra.

    En regardant de plus près mon paramétrage de "Full Text Search dans mon fichier "my.ini", j'ai pourtant indiqué que je n'utilisais pas le fichier standard des "stopword".
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    innodb-ft-enable-stopword  = off
    De ce fait, aucun mot n'est rejeté !
    j'avais bien compris... c'est vrai je ne l'ai pas bien précisé mais c'est modifiant mon fichier my.cnf comme toi que j'ai déterminé le paramètre en cause.

    Citation Envoyé par Artemus24 Voir le message
    Mais cela n'explique pas pourquoi certains cas fonctionnent alors que le mot "com" est rejeté.

    Je suppose que vous n'avez pas bien configuré votre fichier my.ini à ce sujet.
    Bah si justement le mot "COM" faisait parti de la liste des mots exclus !

    Par contre les scores n'ont pas changés sur ma base en production
    J'ai trouvé sur la toile qu'il fallait envisager un REPAIR... mais :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    MariaDB [mabase]> repair table document;
    +---------------------+--------+----------+---------------------------------------------------------+
    | Table               | Op     | Msg_type | Msg_text                                                |
    +---------------------+--------+----------+---------------------------------------------------------+
    | mabase.document | repair | note     | The storage engine for the table doesn't support repair |
    +---------------------+--------+----------+---------------------------------------------------------+
    1 row in set (0.00 sec)
    Comment faut-il faire pour réinitialiser le Full Text Search ????

  12. #12
    Expert éminent sénior Avatar de Artemus24
    Homme Profil pro
    Agent secret au service du président Ulysses S. Grant !
    Inscrit en
    Février 2011
    Messages
    6 378
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Agent secret au service du président Ulysses S. Grant !
    Secteur : Finance

    Informations forums :
    Inscription : Février 2011
    Messages : 6 378
    Points : 19 054
    Points
    19 054
    Par défaut
    Salut Tchupacabra.

    Citation Envoyé par Tchupacabra
    Bah si justement le mot "COM" faisait parti de la liste des mots exclus !
    Même si le mot "COM" fait parti des mots exclus, vous obtenez quand même un résultat pour :
    --> les lignes id=45 et id=159 dans la colonne "score_codification".
    --> la ligne id=156 dans la colonne "score_commentaire
    --> la ligne id=160 dans la colonne "score_intitule".
    Ce qui a été sélectionné, ce sont les mots "comm" et "comx" !

    Citation Envoyé par Tchupacabra
    Par contre les scores n'ont pas changés sur ma base en production
    C'est tout à fait normal car vos index FTS ont été construits avec le paramétrage que vous avez indiqué.
    Si vous changez le paramétrage, vous devez recréer vos index FTS.

    Citation Envoyé par Tchupacabra
    Comment faut-il faire pour réinitialiser le Full Text Search ????
    Ceci est à faire en dehors des heures où les utilisateurs accèdent à vos bases.
    Vous devez :
    1) modifier le paramétrage dans votre fichier "my.cnf" en production.
    2) relancer mysql afin que le serveur puisse prendre en compte le nouveau paramétrage.
    3) détruire les anciens index FTS.
    --> https://dev.mysql.com/doc/refman/8.0/en/drop-index.html
    4) créer les nouveaux index FTS !
    --> https://dev.mysql.com/doc/refman/8.0...ate-index.html

    @+
    Si vous êtes de mon aide, vous pouvez cliquer sur .
    Mon site : http://www.jcz.fr

  13. #13
    Membre actif
    Inscrit en
    Octobre 2005
    Messages
    908
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 908
    Points : 271
    Points
    271
    Par défaut
    J'ai modifié my.cnf et redémarré MariaDB...
    puis j'ai supprimé/recréé mon premier index 'codification' :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    DROP INDEX `search_codification` ON document;
    ALTER TABLE document ADD FULLTEXT KEY `search_codification` (`codification`);
    Premiers tests concluant !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 17/03/2015, 12h40
  2. Réponses: 1
    Dernier message: 24/07/2009, 15h40
  3. Réponses: 3
    Dernier message: 11/10/2008, 13h32
  4. faire une recherche sur des "
    Par richard038 dans le forum Requêtes
    Réponses: 6
    Dernier message: 24/07/2006, 22h30
  5. probleme avec des filtres de recherche sur des dates
    Par MCarole dans le forum Access
    Réponses: 2
    Dernier message: 24/07/2006, 10h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo