IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

C et Scan HTML


Sujet :

C

  1. #1
    Nouveau candidat au Club
    Profil pro
    Inscrit en
    Octobre 2006
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2006
    Messages : 2
    Par défaut C et Scan HTML
    Bonjour,

    Je dois pour une projet creer un programme en C qui scanne des pages HTML et en extrait les liens dans un fichier txt. J'ai bien pense a me servir des balises dans le code html pour reperer les liens mais pour ce qui est de la partie scan du fichier j'avoue rammer un peu. Donc si quelqu'un avait une piste ou quelques conseils a donner a un debutant je suis preneur .

    Merci,
    Kulgan

  2. #2
    Expert éminent
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 68
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Par défaut
    Citation Envoyé par Kulgan
    Je dois pour une projet creer un programme en C qui scanne des pages HTML et en extrait les liens dans un fichier txt. J'ai bien pense a me servir des balises dans le code html pour reperer les liens
    Ben oui, c'est fait pour...
    mais pour ce qui est de la partie scan du fichier j'avoue rammer un peu. Donc si quelqu'un avait une piste ou quelques conseils a donner a un debutant je suis preneur
    Tu as oublié de poster le code avec lequel tu as un problème...

  3. #3
    Nouveau candidat au Club
    Profil pro
    Inscrit en
    Octobre 2006
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2006
    Messages : 2
    Par défaut
    Le probleme c'est que pour l'instant j'ai pas de code je voulais juste des pistes pour savoir par quel bout prendre la chose

  4. #4
    Expert éminent
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 68
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Par défaut
    Citation Envoyé par Kulgan
    Le probleme c'est que pour l'instant j'ai pas de code je voulais juste des pistes pour savoir par quel bout prendre la chose
    Problème de conception alors ? Quel rapport avec le langage C ?

    Soit à analyser

    <a href="url">commentaire</a>

    Chaque caractère lu est un évènement qui sert à faire progresser, remettre à zéro ou laisser dans l'état, un séquenceur qui cherche <a href=", puis stocke les caractères de l'url jusqu'à la séquence ">

    C'est pas bien compliqué...

    Automate à nombre d'états déterminé (Finite State Machine ou FSM), ça te dis quelque chose ?

    http://emmanuel-delahaye.developpez.com/clib.htm
    Module FSM

  5. #5
    Membre Expert
    Homme Profil pro
    Dév. Java & C#
    Inscrit en
    Octobre 2002
    Messages
    1 414
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Dév. Java & C#
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2002
    Messages : 1 414
    Par défaut
    Attention: l'attribut "href" n'est pas forcément le premier.

    On peut avoir aussi <a class="lien_externe" href="www.nasa.gov">NASA</a>.

    Je pense qu'il existe des bibliothèques qui permettent de scanner des documents HTML comme par exemple HTML Tidy Library Project

  6. #6
    Expert confirmé
    Avatar de Skyounet
    Homme Profil pro
    Software Engineer
    Inscrit en
    Mars 2005
    Messages
    6 380
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Software Engineer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2005
    Messages : 6 380
    Par défaut
    Y'a pas longtemps, sur le forum y'avait un concours pour faire un parser HTML qui extrait les liens d'un code HTML.

    Cherche un peu sur le forum.

  7. #7
    Rédacteur
    Avatar de Franck.H
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Janvier 2004
    Messages
    6 951
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : Service public

    Informations forums :
    Inscription : Janvier 2004
    Messages : 6 951
    Par défaut
    Y'a des concours maintenant sur developpez.com ? Super mais je savais pas ... ca se passe où en générale (pour le C bien sûr ) ?
    Mon Site
    Ma bibliothèque de gestion des chaînes de caractères en C

    L'imagination est plus importante que le savoir. A. Einstein

    Je ne répond à aucune question technique par MP, merci d'avance !

  8. #8
    Expert confirmé
    Avatar de Skyounet
    Homme Profil pro
    Software Engineer
    Inscrit en
    Mars 2005
    Messages
    6 380
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Software Engineer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2005
    Messages : 6 380
    Par défaut
    Citation Envoyé par Franck.H
    Y'a des concours maintenant sur developpez.com ? Super mais je savais pas ... ca se passe où en générale (pour le C bien sûr ) ?
    Nop c'était juste un tit concours comme ça. Mais on peut en refaire, si d'autres personnes sont d'accord...

Discussions similaires

  1. Algorithme de conversion de RTF vers HTML
    Par youtch dans le forum Algorithmes et structures de données
    Réponses: 10
    Dernier message: 10/09/2002, 12h35
  2. Balises HTML dans un fichier XML
    Par Bastet79 dans le forum XML/XSL et SOAP
    Réponses: 12
    Dernier message: 04/09/2002, 15h29
  3. composant builder4 pour afficher du code html
    Par BranRuz dans le forum C++Builder
    Réponses: 2
    Dernier message: 04/09/2002, 11h35
  4. delphi XML / HTML caractéres speciaux !
    Par adem dans le forum EDI
    Réponses: 2
    Dernier message: 29/08/2002, 17h48
  5. [XSLT] inclure du XSL dans une balise html
    Par iaa dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 05/08/2002, 15h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo