IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Extraction de texte


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Novembre 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Ardennes (Champagne Ardenne)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Novembre 2017
    Messages : 2
    Par défaut Extraction de texte
    Bonjour à tous,

    Je début en python et je voudrais réaliser un projet simple.

    j'ai un fichier HTML dans lequel je voudrais aller chercher des valeurs.

    Voici mon code python :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    chaine = "AD " # Texte à rechercher
     
    fichier = open("index.html","r")
    for ligne in fichier:
        if chaine in ligne:
            print (chaine)
    fichier.close()
    Il fonctionne bien, il chercher dans ma page ma chaine "AD" puis l'affiche, mais je voudrais aller plus loin en affichant tout le texte qu'il y a derrière jusqu'au prochain "<"

    exemple de mon code html :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <span id='sorttable_sortfwdind'>&nbsp;&#x25BE;</span></td><td>AD (98.8%)</td><td>SEP (100.0%)</td>
    En gros je voudrais qu'il m'affiche : "AD (98,8%)"

    Je ne trouve pas comment lui faire affichier ce qu'il y a après ma chaine.

    Vous avez une piste a me donner?

    Merci :)

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 716
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 716
    Par défaut
    Salut,

    Citation Envoyé par westox Voir le message
    Vous avez une piste a me donner?
    Soit une ligne qui contient 'AD':
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> line = 'xxxAD (zzz)   '
    >>> 'AD' in line
    True
    on peut utiliser la méthode index pour trouver la position de 'AD':
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    >>> line.index('AD')
    3
    puis, la position du ')' à partir de là:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    >>> line.index(')', 3)
    10
    puis, extraire le segment qui vous intéresse:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    >>> line[3:10+1]
    'AD (zzz)'
    Ce sont des opérations de bases sur les chaînes de caractères que vous pouvez apprendre avec n'importe quel bon tuto. mais qu'on utilise rarement pour récupérer des informations dans des fichiers HTML. On préférera utiliser les expressions régulières et/ou des bibliothèques comme BeautifoulSoup... mais bon si vous débutez, il faut apprendre les bases avant de pouvoir utiliser ces outils là.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Novembre 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Ardennes (Champagne Ardenne)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Novembre 2017
    Messages : 2
    Par défaut
    Salut wiztricks,

    Parfait ça fonctionne nickel,
    je vais regarder au niveau des liens que tu m'as donné pour en apprendre plus.

    Merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Extraction de texte dans une page HTML
    Par ninox_ dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 02/05/2007, 17h29
  2. [RegEx] Extraction de texte situé entre deux balises
    Par morpho365 dans le forum Langage
    Réponses: 7
    Dernier message: 27/03/2007, 18h18
  3. Extraction de texte dans un fichier
    Par chris91 dans le forum Langage
    Réponses: 4
    Dernier message: 18/08/2006, 16h09
  4. Extraction de texte de pages web?
    Par VinnieMc dans le forum Web
    Réponses: 4
    Dernier message: 01/03/2006, 19h42
  5. cibler l'extraction du text
    Par yos dans le forum XSL/XSLT/XPATH
    Réponses: 4
    Dernier message: 09/02/2006, 14h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo