openoffice calc : mettre une formule de concatenation dans la cellule de fichiers et extraire le résultat une

Version imprimable

Voir 40 message(s) de cette discussion en une page

23/09/2024, 12h40
ANewB

Citation:

Envoyé par jurassic pork

L'erreur serait plutot du côté du converters surtout si tu n'as pas de colonne Genre dans tes données sources . Essaie ceci pour main (il faut que la colonne D se nomme Genre (mettre Genre en D1) :

Code:

def main():

en modifiant les chemins pour que cela corresponde à tes chemins

JP,

j'avais anticipé en ayant toutes les cellules D1 nommées Genre... et là, c'est toujours le même "Expected type 'int', got 'str' instead" pour le USECOLS='D' de la ligne "df = pd.read_excel(fic, usecols='D')"
23/09/2024, 12h59
jurassic pork

là je sèche un peu 'D' serait-il chez toi pris pour un caractère et alors la valeur du code ascii de D (en tout cas pas chez moi thonny python 3.10) mais cela serait l'erreur inverse. Sinon essaie "D" ou alors 'D '
23/09/2024, 13h20
ANewB

Citation:

Envoyé par jurassic pork

là je sèche un peu 'D' serait-il chez toi pris pour un caractère et alors la valeur du code ascii de D (en tout cas pas chez moi thonny python 3.10). Sinon essaie "D" ou alors 'D '

Non, rien. Et comment, au lieu d'indiquer la colonne "D", on indique la 4ème colonne ? ça ne changerait rien ?
23/09/2024, 13h27
jurassic pork

en tout cas je viens de trouver la raison : il y a un bug dans pycharm voir ici et ici . Le bug ne semble pas encore résolu :(
23/09/2024, 15h32
jurassic pork

Pour "tromper" pycharm tu peux essayer :

Code:

df = pd.read_excel(fic, usecols= range(3,4))

ou

Code:

df = pd.read_excel(fic, usecols= [3])

Ces 2 codes fonctionnent dans mon IDE Thonny python 3.10

Citation:

Envoyé par jurassic pork

Pour "tromper" pycharm tu peux essayer :

Code:

df = pd.read_excel(fic, usecols= range(3,4))

ou

Code:

df = pd.read_excel(fic, usecols= [3])

Ces 2 codes fonctionnent dans mon IDE Thonny python 3.10

Désolé, mais aucune des deux solutions ne fonctionne. Le message d'erreur reste le même. Est-ce faut faire autrement, passer par autre chose que PyCharm ?
Et si on ne spécifie pas la colonne D, mais la première colonne venue et qu'on ajoute une colonne au fur et à mesure ?

-----J'ai installé Thonny, j'ai installé odfpy et pandas sur Thonny. J'ai collé le script (avec D, avec 3...) et j'ai la réponse suivante de la console :
Code:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Traceback (most recent call last): File "C:\Users\Utilisateur\AppData\Roaming\Python\Python310\site-packages\pandas\core\indexes\base.py", line 3805, in get_loc return self._engine.get_loc(casted_key) File "index.pyx", line 167, in pandas._libs.index.IndexEngine.get_loc File "index.pyx", line 175, in pandas._libs.index.IndexEngine.get_loc File "pandas\\_libs\\index_class_helper.pxi", line 70, in pandas._libs.index.Int64Engine._check_type KeyError: 'Genre' The above exception was the direct cause of the following exception: Traceback (most recent call last): File "C:\Users\Utilisateur\Thonny-Python\script-avec-pandas.py", line 31, in <module> main() File "C:\Users\Utilisateur\Thonny-Python\script-avec-pandas.py", line 24, in main maliste.append(', '.join(map(str, df['Genre'].tolist()))) File "C:\Users\Utilisateur\AppData\Roaming\Python\Python310\site-packages\pandas\core\frame.py", line 4102, in __getitem__ indexer = self.columns.get_loc(key) File "C:\Users\Utilisateur\AppData\Roaming\Python\Python310\site-packages\pandas\core\indexes\base.py", line 3812, in get_loc raise KeyError(key) from err KeyError: 'Genre'

23/09/2024, 19h36
jurassic pork

ben en fait tu peux ne pas utiliser usecols et cela fonctionne :

Code:

df = pd.read_excel(fic)

le seul inconvénient si cela en est un c'est que l'on récupère toutes les colonnes dans df. Mais cela n'est pas grave car on ne traite que la colonne Genre.

Citation:

Envoyé par jurassic pork

ben en fait tu peux ne pas utiliser usecols et cela fonctionne :

Code:

df = pd.read_excel(fic)

le seul inconvénient si cela en est un c'est que l'on récupère toutes les colonnes dans df. Mais cela n'est pas grave car on ne traite que la colonne Genre.

Bon, sur PythonCharm, j'ai le message d'erreur (avec le remplacement indiqué ci-dessus) :

Code:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
  File "index.pyx", line 167, in pandas._libs.index.IndexEngine.get_loc
  File "index.pyx", line 196, in pandas._libs.index.IndexEngine.get_loc
  File "pandas\\_libs\\hashtable_class_helper.pxi", line 7081, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas\\_libs\\hashtable_class_helper.pxi", line 7089, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 'Genre'
 
The above exception was the direct cause of the following exception:
 
Traceback (most recent call last):
  File "C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\avecpandas.py", line 31, in <module>
    main()
  File "C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\avecpandas.py", line 24, in main
    maliste.append(', '.join(map(str, df['Genre'].tolist())))
                                      ~~^^^^^^^^^
  File "C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\.venv\Lib\site-packages\pandas\core\frame.py", line 4102, in __getitem__
    indexer = self.columns.get_loc(key)
              ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\.venv\Lib\site-packages\pandas\core\indexes\base.py", line 3812, in get_loc
    raise KeyError(key) from err
KeyError: 'Genre'
 
Process finished with exit code 1

23/09/2024, 19h58
jurassic pork

1 pièce(s) jointe(s)

tant qu'on aura pas vu tes fichiers source , on pourra longtemps tourner en rond.
En pièce jointe mes 2 fichiers source d'essai.
23/09/2024, 23h26
ANewB

3 pièce(s) jointe(s)

Citation:

Envoyé par jurassic pork

tant qu'on aura pas vu tes fichiers source , on pourra longtemps tourner en rond.
En pièce jointe mes 2 fichiers source d'essai.

Bonsoir,
j'ai remplacé mes fichiers dans lesquels il y avait les listes "Genre", par les vôtres (même contenu). Même résultat que précédemment... (même message d'erreur)Pièce jointe 659660 Pièce jointe 659662 Pièce jointe 659661 Pièce jointe 659660 Pièce jointe 659662 Pièce jointe 659661
24/09/2024, 08h03
jurassic pork

Hello,
l'erreur que tu as c'est qu'il ne trouve pas la colonne Genre dans la dataFrame df. Il n'y a pas beaucoup de raisons possibles car avec les fichiers que j'ai fourni il n'y a pas cette erreur chez moi. Soit tu lis d'autres fichiers que ceux que j'ai fourni, soit dans ton code il y a une erreur. Pour voir d'où cela vient rajoute dans ton code juste après le

Code:

df = pd.read_excel(fic)

l' instruction suivante pour afficher les valeurs de fic et de df avant le plantage :

Code:

print('fichier : ',fic,'\ndf : \n',df)

chez moi j'ai par exemple :

Citation:

fichier : d:/dev/LibreOffice\Fic1_AZE.ods
df :
Unnamed: 0 Unnamed: 1 Unnamed: 2 Genre
0 NaN NaN NaN documentaire
1 NaN NaN NaN fiction
2 NaN NaN NaN Science-fiction, futur
...

sinon on peut aussi référencer dans une dataframe une colonne par son index au lieu de son nom avec iloc. Exemple:

Code:

maliste.append(', '.join(map(str,df.iloc[:, 3].tolist())))

3 représente la 4ème colonne car l'index part de zéro.

Ami calmant, J.P
24/09/2024, 09h25
ANewB

[QUOTE=jurassic pork;12045963]Hello,

sinon on peut aussi référencer dans une dataframe une colonne par son index au lieu de son nom avec iloc. Exemple:

Code:

maliste.append(', '.join(map(str,df.iloc[:, 3].tolist())))

3 représente la 4ème colonne car l'index part de zéro.

Bonjour JP,
pour le coup, il y a un résultat. La colonne D s'affiche avec "nan" dès qu'il y a une cellule vide.
24/09/2024, 10h34
jurassic pork

Citation:

Envoyé par ANewB

colonne D s'affiche avec "nan" dès qu'il y a une cellule vide.

et qu'as-tu pour le :

Code:

print('fichier : ',fic,'\ndf : \n',df)

?

Citation:

Envoyé par jurassic pork

et qu'as-tu pour le :

J'ai cela:

Code:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\.venv\Scripts\python.exe C:\Users\Utilisateur\PycharmProjects\essai-modifier_AZE-ods.py\avecpandas.py 
fichier :  C:/Users/Utilisateur/Desktop/Nouveau-dossier/essai-a-jeter\Nouveau-dossier\Fic1_AZE.ods 
df : 
    Unnamed: 0  Unnamed: 1  Unnamed: 2                   Genre
0         NaN         NaN         NaN            documentaire
1         NaN         NaN         NaN                 fiction
2         NaN         NaN         NaN  Science-fiction, futur
3         NaN         NaN         NaN               reportage
4         NaN         NaN         NaN                      10
5         NaN         NaN         NaN                     NaN
6         NaN         NaN         NaN                 comédie
7         NaN         NaN         NaN                 fiction
fichier :  C:/Users/Utilisateur/Desktop/Nouveau-dossier/essai-a-jeter\Nouveau-dossier\Fic2_AZE.ods 
df : 
    Unnamed: 0  Unnamed: 1  Unnamed: 2                   Genre
0         NaN         NaN         NaN                thriller
1         NaN         NaN         NaN  film*; science-fiction
2         NaN         NaN         NaN                nouvelle
3         NaN         NaN         NaN     essai*; philosophie
 
Process finished with exit code 0

24/09/2024, 11h41
jurassic pork

Alors cela doit fonctionner avec df['Genre'] ? il y a encore des choses qui ne fonctionnent pas ?
24/09/2024, 12h51
ANewB

Citation:

Envoyé par jurassic pork

Alors cela doit fonctionner avec df['Genre'] ? il y a encore des choses qui ne fonctionnent pas ?

ça affiche le résultat
-je ne comprends pas dans le code comment ne récupérer les infos qu'à partir de "D2" ou "D1" ?
-à quoi servent col1 et col2 du coup ?
24/09/2024, 13h24
jurassic pork

Je ne suis pas un spécialiste de pandas . Il faut regarder dans les paramètres de read_excel , normalement on doit pouvoir obtenir les données que l'on veut ( nombre de lignes, à partir de quelle ligne, sans en-tête etc ...)
24/09/2024, 14h30
ANewB

Citation:

Envoyé par jurassic pork

Je ne suis pas un spécialiste de pandas . Il faut regarder dans les paramètres de read_excel , normalement on doit pouvoir obtenir les données que l'on veut ( nombre de lignes, à partir de quelle ligne, sans en-tête etc ...)

Merci !
Bonne fin de journée
24/09/2024, 19h12
umfred

Je pense que maintenant la seule raison possible que ça ne fonctionne pas, c'est qu'il y a d'autres caractères dans la cellule que simplement "Genre", par là, je veut dire qu'il y a probablement des espaces avant ou après le mot, par exemple " Genre" ou "Genre " et pas "Genre".

Voir 40 message(s) de cette discussion en une page