IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++Builder Discussion :

Recuperer les 3 mots les plus utilisés dans une page web


Sujet :

C++Builder

Vue hybride

lisco Recuperer les 3 mots les plus... 18/12/2009, 10h24
cedni Salut C est juste une idée... 18/12/2009, 14h13
lisco Bonjour, j'arrive toujours... 19/12/2009, 08h52
lisco Ya personne pour m'aider?... 19/12/2009, 17h45
cedni Dans ton autre sujet , on t a... 20/12/2009, 09h27
Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 237
    Par défaut Recuperer les 3 mots les plus utilisés dans une page web
    Bonjour,

    J'ai une petite application qui doit me recuperer une page html et ensuite me recuperer et m'afficher les 3 mots les plus utilises dans cette page web.

    J'ai réussi à recuperer la page html et ensuite je l'ai stocké dans un TStringList!!!Et là je suis bloqué car je sais pas comment lire dans mon TStringList pour recuperer les 3 mots les plus utilisés dans mon fichier!!!
    ça me semble dur car dans le fichier html y a pas mal de tags(<.../>) y a pleins de trucs de ce genre!!!

    Je veux de l'aide svp pour queu je puisse avancer . Merci d'avance
    Voici ce que j'ai commencé :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    void __fastcall TForm1::Fonction()
    {
      AnsiString maLigne ;
      TStringList *liste = new TStringList() ;
       liste->LoadFromFile("C:\monFichier") ;
       for (i = 0; i < liste->Count; i++)
       {
         maLigne = liste->Strings[i] ;
     
       }
     
       delete liste ;
     
    }
    I need your help please!!!Merci !!!

  2. #2
    Membre émérite
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 573
    Par défaut
    Salut

    C est juste une idée

    Sqlite
    une base
    une table , deux champs , mot et nombre

    Remplacer tous les espaces , les virgules , les points par des sauts à la ligne
    Ensuite creer ton tableau pour la fonction suivante

    Une fonction avec un insert ou un update
    qui boucle de i = 1er indice à tableau.length
    Avec une condition qui verifie si le mot n est pas par exemple :
    "le , un , de , et , ..."
    et
    Si le mot existe , incrementation de nombre
    Sinon insertion du nouveau mot

    Enfin une requete sql rangée par nombre decroissant
    select nom into matable order by nombre desc

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 237
    Par défaut
    Bonjour, j'arrive toujours pas à avancer car le fichier html est tres compliqué, il y a pleins de tags genre <..../> et des "/" ect....
    Je voudrais maintenant placer chaque mot du TStringList dans un tableau et ensuite regarder combien de fois ce mot existet dans le tableau!!!Je sais pas comment decouper chaque element du TStringList car ce sont des phrase.
    Est ce quelqu'un peut m'aider??rapel :je dois recuperer les 3 mots les plus utilisés dans un fichier html.
    Est - il possible de lire par mot et les stocker dans un tableau en C++builder?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    void __fastcall TForm1::Fonction()
    {
      AnsiString maLigne ;
      TStringList *liste = new TStringList() ;
       liste->LoadFromFile("C:\monFichier") ;
       for (i = 0; i < liste->Count; i++)
       {
         maLigne = liste->Strings[i] ;
     
       }
     
       delete liste ;
     
    }
    Je vous remercie d'avance. I need your help please!

  4. #4
    Membre éclairé
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 237
    Par défaut
    Ya personne pour m'aider?
    j'ai besoin d'aide svp, je cherche depuis des jours mais c'est tres compliqué je vois aucune solution de comment lire un fichier web ou html que j'ai recuperer à partir d'une URL et retourner les 3 mots les plus utilisé dans la page!!!

    Help please! et merci d'avance

  5. #5
    Membre émérite
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 573
    Par défaut
    Dans ton autre sujet , on t a filé un lien vers la faq qui explique comment recuperer le ""corps "" d une page web afficher dans un browser , le ""corps"" signifie : un ensemble de mots , dépourvu des balises

    Ensuite je t ai expliqué comment faire avec sqlite ...

  6. #6
    Membre éclairé
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 237
    Par défaut
    Merci pour tout ton aide Cedni et tout le monde aussi! Mais j'ai toujours pas trouver mon bonheur!!

    Cedni tu m'as parlé de Sqlite ? je connais pas du tout encore moins les requêtes sql qui ne font pas parti de mon prijet.
    Dans mon projet je dois utiliser la méthode Get du composant TIdHTTP et c'est bien efficace car en mettant l'url et un TStream il nous récupère la page html correspond!!!

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    bool __fastcall TForm1::loadHtml(AnsiString AUrl, TMemoryStream *StreamString)
    {
      bool download = false ;
       try
       {
    	  idhttp->Get(AnsiString(AnsiString(Url)).c_str(), StreamString) ;
    	  download = true ;
     
       }
       catch (...)
       {
    	  download = false ;
     
       }
     
       delete StreamString ;
     
       return download ;
    appel de la fonction :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    void __fastcall TForm1::BoutonClick(TObject *Sender)
    {
      AnsiString AdresseURL = AURL->Text ;
      memory = new TMemoryStream() ;
      downloadHtml(AdresseURL, memory) ;
    }
    Mon gros problème est que j'arrive pas à exploiter le texte que j'ai récupérer!!!Comment je peux accéder à ce que j'ai récupère dans la mémoire?Sinon aussi je peux le stocker dans un TFileStream mais là le problème aussi c'est que j'ai un fichier inexploitable avec pleins de balises de partout!!!

    En outre avec le code que m'a fourni Crayon :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    void __fastcall TForm1::WebBrowserDocument(TObject *ASender, const IDispatch *pDisp, OleVariant &URL)
    {  .........
    }
    Je sais pas quoi mettre comme paramètre quand j'appelle cette fonction dans un evenement click?
    Si quelqu'un peut m'aider svp!!Merci d'avance

Discussions similaires

  1. Rafraichir 3 images dans une page web toute les minutes
    Par jameson dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 16/06/2011, 13h49
  2. Logiciel pour récupérer que les mails dans une page web
    Par mouss4rs dans le forum Autres Logiciels
    Réponses: 0
    Dernier message: 24/07/2010, 14h41
  3. Trouver le mot le plus long dans une chaîne
    Par bassoum dans le forum x86 16-bits
    Réponses: 1
    Dernier message: 02/11/2008, 10h45
  4. Lire les mails d'un serveur Exchange dans une page php
    Par ljonathan dans le forum Langage
    Réponses: 2
    Dernier message: 18/08/2008, 11h48
  5. Réponses: 5
    Dernier message: 06/08/2006, 19h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo