fichier csv, mauvais output dans excel

**Yuseph** · 19/11/2020, 19h53

yo les gars,

jcomprends pas pourquoi quand j'ouvre dans excel les en tetes font une colonne et le contenu une seule colonne aussi.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
from urllib import request
from bs4 import BeautifulSoup
import json
import csv
 
page_url = 'https://alansimpson.me/python/scrape_sample.html'
ouverture = request.urlopen(page_url)
lecture = BeautifulSoup(ouverture, 'html5lib')
recup_2 = lecture.article   # récupérer dans la balise article de la page web
liste = []
for link in recup_2.find_all('a'):
    try:
        url = link.get('href')
        img = link.img.get('src')
        text = link.span.text
        liste.append({'url' : url, 'img': img, 'text': text})
    except AttributeError:
        pass
 
with open(r'C:\Users\Youcef\Documents\page_web.csv', 'w', newline='') as fichier_csv:
    recup_3 = csv.writer(fichier_csv)
    recup_3.writerow(['url','img','text'])
    for ligne in liste:
        recup_3.writerow([str(ligne['url']),str(ligne['img']),str(ligne['text'])])

**wiztricks** · 19/11/2020, 20h13

Salut,

Dans un fichier CSV les colonnes sont materialisées par un "delimiteur" qui doit être précisé si différent de celui "par défaut".

- W

**Yuseph** · 19/11/2020, 21h16

bien joué ma biche

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
with open(r'C:\Users\Youcef\Documents\page_web.csv', 'w', newline='') as fichier_csv:
    recup_3 = csv.writer(fichier_csv, delimiter = ";")
    recup_3.writerow(['url','img','text'])
    for ligne in liste:
        recup_3.writerow([str(ligne['url']),str(ligne['img']),str(ligne['text'])])

**Sve@r** · 19/11/2020, 22h11

Salut

Envoyé par Yuseph

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
for link in recup_2.find_all('a'):
    try:
        url = link.get('href')
        img = link.img.get('src')
        text = link.span.text
        liste.append({'url' : url, 'img': img, 'text': text})
    except AttributeError:
        pass

Tu commences à te démerder en Python.
Ceci dit, je ne comprends pas trop pourquoi tu penses avoir un AttributeError mais perso je remplacerais pass par continue.
Dans l'état ça ne change rien. Mais si demain il y avait en dessous une suite de code qui dépende de liste, ce "quelque chose" serait quand-même exécuté alors qu'avec un continue, le code n'est pas traité.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
for link in recup_2.find_all('a'):
    try:
        url = link.get('href')
        img = link.img.get('src')
        text = link.span.text
        liste.append({'url' : url, 'img': img, 'text': text})
    except AttributeError:
        continue
 
    # Cette partie ne sera pas exécutée si AttributeError...
    ... (autre chose)...

**Yuseph** · 20/11/2020, 11h11

C'est l'auteur du bouquin. il dit que les navigateurs laissent passer beaucoup d'oublis de caractères et de typos (fautes de frappe). du coup on peut avoir sa boucle interrompue pour une attributeError.
Et effectivement les fautes yen a qui passe, sur cette même page j'ai vu que la balise article était refermée par une balise aricle

fichier csv, mauvais output dans excel

Python

Vue hybride

Discussions similaires

Partager

Partager