IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

selenium télécharger ficiers référencés cette fois [Python 3.X]


Sujet :

Python

Mode arborescent

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut selenium télécharger ficiers référencés cette fois
    Je suis désolé, je suis encore planté sur un autre type de fichiers.
    Je me logue avec mot de passe, tout se passe bien. Je vais ensuite dans la rubrique que je souhaite : parfait.
    J'ai des images du style pdf.jpg, ...
    J'ai essayé à peu près tout ce que j'ai trouvé, y compris des trucs débiles.
    Voici ce que j'ai lorsque je copie le xpath, le css, ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    xpath : /html/body/div[2]/div[2]/div[4]/a[7]
     
    chemin CSS : html body div#corps div.central div a
     
    sélecteur CSS : .central > div:nth-child(7) > a:nth-child(27)
     
    extérieur du html : <a href="index.php?module=Ftp&amp;voir=inclusion&amp;dist=direct/FtpChimie/bulletin/corr2022/c22lc1c.pdf" target="_blank"><img src="pdf.jpg" alt="c22lc1c.pdf"></a>
     
    intérieur du html : <img src="pdf.jpg" alt="c22lc1c.pdf">
    J'ai essayé avec notamment :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    liste_ext = ["pdf.jpg","doc.jpg","docx.jpg","tex.jpg","odt.jpg"]
    contenu_lien = "index.php?module=Ftp&amp;voir=inclusion&amp;dist=direct/FtpChimie/bulletin"
    print(contenu_lien)
    def download_fichiers_chim():
        for ext in liste_ext:
            try:
                print('img[src=\"{}\"]'.format(ext))
                # nombre_liens = driver.find_elements(By.CSS_SELECTOR, 'img[src=\"{}\"]'.format(ext))
                # nombre_liens = driver.find_elements(By.CSS_SELECTOR, "//*[contains(@href, {})]".format(contenu_lien))
                # nombre_liens = driver.find_elements(By.XPATH,  '/html/body/div[2]/div[2]/div[4]')
                nombre_liens = driver.find_elements(By.XPATH,  '//a[contains(@href,{})]'.format(contenu_lien))
                # nombre_liens = driver.find_elements(By.XPATH,  '//a[starts-with(@href,{})]'.format(contenu_lien))
                # nombre_liens = driver.find_elements(By.XPATH,  '//div[contains(@href,{})]'.format(contenu_lien))
                print(nombre_liens)
                for i in range(len(nombre_liens)):
                    # liens = driver.find_elements(By.CSS_SELECTOR, 'img[src=\"{}\"]'.format(ext))
                    # liens = driver.find_elements(By.CSS_SELECTOR, "//*[contains(@href, {})]".format(contenu_lien))
                    # liens = driver.find_elements(By.XPATH,  '/html/body/div[2]/div[2]/div[4]')
                    liens = driver.find_elements(By.XPATH,  '//a[contains(@href,{})]'.format(contenu_lien))
                    # liens = driver.find_elements(By.XPATH,  '//a[starts-with(@href,{})]'.format(contenu_lien))
                    # liens = driver.find_elements(By.XPATH,  '//div[contains(@href,{})]'.format(contenu_lien))
                    for j, lien in enumerate(liens):
                        if i != j: 
                            continue
                        print(lien)
                        # ref = lien.get_attribute("href")
                        # driver.get(ref)
                        lien.click()
                        # time.sleep(5)
            except:
                pass
    A un moment donné, j'ai réussi à télécharger une dizaine de fichiers, mais uniquement du odt.
    Si quelqu'un a une idée, ,je suis un peu paumé. Au pire, je ferai tout à la main...
    Images attachées Images attachées  

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Python 3.X] selenium télécharger des fichiers non référencés
    Par marco056 dans le forum Général Python
    Réponses: 5
    Dernier message: 04/02/2023, 19h37
  2. encore un problème, cette fois sur la fonction Find
    Par NulenVBA dans le forum Macros et VBA Excel
    Réponses: 9
    Dernier message: 16/12/2008, 19h37
  3. RegExp Code postal cette fois ci
    Par SpaceFrog dans le forum Général JavaScript
    Réponses: 6
    Dernier message: 01/04/2008, 10h59
  4. Réponses: 5
    Dernier message: 08/02/2007, 18h05
  5. JNI : de C à Java cette fois
    Par jojo29 dans le forum Entrée/Sortie
    Réponses: 2
    Dernier message: 20/04/2006, 18h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo