IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

[Tableaux] Mot les plus utilisés


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 30
    Par défaut [Tableaux] Mot les plus utilisés
    Bonjour,

    je me retrouve confronté à une demande singulière.
    Dans une base contenant plus de 45 000 entrées d'actualités, je dois pouvoir faire un top 10 des mots les écrits
    j'ai de suite penser à un regex mais après je ne vois pas trop quel chemin suivre pour aboutir à ce top 10 des mots les plus écrits dans les actualités en évitant les mots tel que 'le, la, les, et, etc...'
    Vous auriez des pistes ?

    Merci
    Kenji

  2. #2
    Membre éprouvé Avatar de julien.63
    Profil pro
    balayeur
    Inscrit en
    Décembre 2005
    Messages
    1 348
    Détails du profil
    Informations personnelles :
    Localisation : France, Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : balayeur

    Informations forums :
    Inscription : Décembre 2005
    Messages : 1 348
    Par défaut
    salut,
    une proposition qui n'a pas la prétention d'être LA solution:
    * créér un tableau dont les clés seront les mots et les valeurs le nombre d'occurence.
    * tu passes tes enregistrements un par un et tu isoles chaque mot.
    * si le tableau ne contient pas la clé (le mot courant) tu la crées avec la valeur un
    * sinon tu incrémentes de un

    pour éviter les le, la, des..., je vois trois possibilités:
    * soit tu détermines un longueur de mot minimum (par exemple 4)
    * soit, plus exhaustif, tu te crées un tableau contenant tous les mots à exclure
    * soit un mix des deux solutions: éliminer tous les mots de 2 caractères, plus d'autres plus longs mais non pertinent.

    voilà premières idées à enrichir...

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 30
    Par défaut
    Salut,

    en effet c'est une solution mais le risque en passant par un tableau est qu'il va être assez important , la table fait 130 mo de texte.
    un tableau pourrais t il supporter autant d'enregistrement avec un temps d'exécution rapide ?

    merci

  4. #4
    Membre éprouvé Avatar de julien.63
    Profil pro
    balayeur
    Inscrit en
    Décembre 2005
    Messages
    1 348
    Détails du profil
    Informations personnelles :
    Localisation : France, Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : balayeur

    Informations forums :
    Inscription : Décembre 2005
    Messages : 1 348
    Par défaut
    Peut être qu'il faut procéder en plusieurs requêtes pour ne pas tout charger d'un coup... 20 enregistrements par 20 ?

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 30
    Par défaut
    je vais suivre cette piste de tableau
    en mettant un javascript avec timeout sur 5 sec en bas de page pour relancer le script automatiquement ensuite.
    surtout que ce ne sera utile que pour une seule fois a des fins statistiques donc je vais chercher au plus rapide

    merci pour les pistes

    Kenji

  6. #6
    Membre éprouvé Avatar de julien.63
    Profil pro
    balayeur
    Inscrit en
    Décembre 2005
    Messages
    1 348
    Détails du profil
    Informations personnelles :
    Localisation : France, Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : balayeur

    Informations forums :
    Inscription : Décembre 2005
    Messages : 1 348
    Par défaut
    je ne suis pas sûr que tu aies besoin de javascript (ou j'ai mal compris ce que tu veux faire). Tu peux faire une boucle qui s'incrémente de 20 à chaque tour. Et dans cette boucle du fait ta requête et ton traitement. Qu'en penses-tu?

Discussions similaires

  1. [MySQL] Explorer table sql et récupérer mot les plus fréquent.
    Par rupileos dans le forum PHP & Base de données
    Réponses: 3
    Dernier message: 22/04/2010, 14h38
  2. Réponses: 16
    Dernier message: 24/12/2009, 20h44
  3. analyse de trafic (determiner les AS les plus utilisés)
    Par aicou dans le forum Développement
    Réponses: 0
    Dernier message: 28/09/2009, 13h46
  4. speed dial, pas de site les plus utilisés
    Par lepierot dans le forum Firefox
    Réponses: 0
    Dernier message: 04/11/2008, 16h48
  5. Recherche d'enregistrements les plus utilisés
    Par olivier94 dans le forum Access
    Réponses: 2
    Dernier message: 21/03/2007, 20h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo