IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Point de départ pour analyser le contenu de pages web ?


Sujet :

Langages de programmation

  1. #1
    Candidat au Club
    Femme Profil pro
    Auditeur informatique
    Inscrit en
    septembre 2019
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : septembre 2019
    Messages : 4
    Points : 3
    Points
    3
    Par défaut Point de départ pour analyser le contenu de pages web ?
    Bonjour,

    J'ai des bases en principe de programmation (logique, boucles, variables, incrémentation, etc...), mais je ne connais aucun vrai langage, ni php, ni js, html5... J'ai déjà fait plein de sites de A à Z ou avec CMS en refaisant le template à chaque fois, mais aucune grosse programmation de fonctions etc...

    J'aimerais avoir des conseils pour savoir sur quel langage me lancer, suivant ce que je souhaite faire :
    Mon but est de créer un code (pour moi) qui va chercher le contenu d'une page en entier (y compris le truc en js qui charge la page à mesure qu'on scrolle), et qui analyse ces textes : nombre de lettres, de consonnes, de voyelles, nombre de lettres entre changement consonne/voyelle, avant retour à la ligne, compte des ponctuations, rythme lettres/chiffres, etc... Recueillir le plus d'informations possible.

    Ca ne servira pas à créer de site, c'est uniquement pour une utilisation personnelle en local, et définitivement.

    Voilà merci d'avance pour les réponses.

  2. #2
    Futur Membre du Club
    Homme Profil pro
    Retraité
    Inscrit en
    juillet 2011
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : juillet 2011
    Messages : 7
    Points : 7
    Points
    7
    Par défaut
    Citation Envoyé par ikodan Voir le message
    Bonjour,
    J'aimerais avoir des conseils pour savoir sur quel langage me lancer, suivant ce que je souhaite faire :
    Mon but est de créer un code (pour moi) qui va chercher le contenu d'une page en entier (y compris le truc en js qui charge la page à mesure qu'on scrolle), et qui analyse ces textes : nombre de lettres, de consonnes, de voyelles, nombre de lettres entre changement consonne/voyelle, avant retour à la ligne, compte des ponctuations, rythme lettres/chiffres, etc... Recueillir le plus d'informations possible.
    Ca ne servira pas à créer de site, c'est uniquement pour une utilisation personnelle en local, et définitivement.
    A peu près n'importe quel langage évolué fait l'affaire. Le tout c'est de l'installer et de l'apprendre.

    Personnellement j'utilise Python qui me permet de récupérer une page web à partir de son adresse et de la traiter ensuite.

    Cela s'installe facilement à cette adresse https://www.python.org/ et la seule difficulté parfois c'est de créer le raccourci Idle.

    Idle c'est le nom de l'éditeur pour composer des programmes, on le trouve dans le dossier Python38\Lib\idlelib\idle.pyw

    Après vous ouvrez l'éditeur vous tapez print("bonjour"), vous vérifiez que ca marche et vous lisez un manuel sur https://docs.python.org/fr/3/

    Par exemple pour récupérer une page web dans la variable texte c'est:

    Code Python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    # Récupérer la page HMTL de l'URL
    # -------------------------------------
     
    import mechanize, html, re                            # les boites à outils !
    url = "page"
    try:
          page = mechanize.urlopen(url)                   # class Response (handle sur un fichier)
          texte = page.read()                                   # class bytes
          texte = texte.decode(encoding='Latin-1')    # sinon = UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2
    except:
          texte = "Erreur"

  3. #3
    Candidat au Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    octobre 2020
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Finance

    Informations forums :
    Inscription : octobre 2020
    Messages : 1
    Points : 2
    Points
    2
    Par défaut
    Tu peux utiliser Selenium:

    https://github.com/SeleniumHQ/selenium

    Ca permet d'extraire facilement de l'information d'un site web et aussi de cliquer sur les boutons.

Discussions similaires

  1. Réponses: 0
    Dernier message: 07/11/2011, 11h06
  2. Réponses: 3
    Dernier message: 31/05/2007, 20h40
  3. [MySQL] Point de départ pour un nouveau site (structure + questions)
    Par bisol dans le forum PHP & Base de données
    Réponses: 18
    Dernier message: 31/05/2007, 11h00
  4. Réponses: 3
    Dernier message: 09/05/2007, 10h49
  5. pour se diriger vers une page web
    Par Ickou dans le forum Langage
    Réponses: 4
    Dernier message: 31/03/2006, 16h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo