erreur que je ne comprends pas

**s2a07** · 10/04/2022, 09h06

Bonjour je suis vraiment bloque aidez moi svp

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
import pandas as pd
 

 
#first u have to open  the file and seperate every line like below:
 

 
 
 
with open(r'C:\Users\User\Desktop\rockyou-withcount.txt', "r",encoding="ISO-8859-1") as f:
 
    lines = f.readlines()
 
 
 
df_result = pd.DataFrame(columns=('id', 'password'))
 
 
 
for i,line in enumerate(lines):
 
    id, password = line.split()
 
    df_result.loc[i] = [id, password]
 

 

 
for i in df_result.index:
 
    result = 1 - spatial.distance.cosine(df_result["id"][i], df_result["password"][i])
 
    print(result)
 
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_2980/3535905508.py in <module>
     10 
     11 for i,line in enumerate(lines):
---> 12     id, password = line.split()
     13     df_result.loc[i] = [id, password]
     14 
 
ValueError: too many values to unpack (expected 2)

pourquoi la distance cosin ne s'affiche pas

**Arioch** · 10/04/2022, 09h54

Bonjour,

prenez bien attention aux messages d'erreur que Python vous renvoit.

Ici, l'erreur est clairement désignée et expliquée : lisez

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
>>> toto = '1;2;3;4'
>>> tutu, titi = toto.split(';')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: too many values to unpack (expected 2)

Ici, je veux spliter une chaine en fonction du point-virgule. Ma chaine, une fois splitée, va retourner 4 éléments.

J'assigne les deux premiers à deux variables mais Python ne sait pas quoi faire des deux suivantes.

Vous êtes dans le même cas. Votre variable line contient plus d'élements que ce que vous croyez.

Et tout est clairement expliqué dans l'erreur, suffit juste de la lire.

**s2a07** · 10/04/2022, 10h08

Oui mais je parse un fichier rockyou witcount avec deux colonnes comment faire svp je sèche

**Sve@r** · 10/04/2022, 10h17

Bonjour

Envoyé par s2a07

je suis vraiment bloque

Par rapport à toutes les autres fois où tu es venu chouiner sans raison et sans pouvoir tirer profit du message d'erreur tu veux dire?

Envoyé par s2a07

Oui mais je parse un fichier rockyou witcount avec deux colonnes

Visiblement au-moins une ligne en a plus que deux !!!

Envoyé par s2a07

comment faire svp je sèche

Ben sais pas. T'as pensé au print() ? Pourtant ça t'a déjà été conseillé...

**wiztricks** · 10/04/2022, 10h50

Envoyé par s2a07

pourquoi la distance cosin ne s'affiche pas

Ça ne s'affiche pas parce que çà plante avec l'erreur "too many values to unpack (expected 2)".

Comme line.split() fabrique une liste en découpant la ligne suivant les "blancs", ça veut dire que les "blancs" ne sont pas un bon séparateur pour récupérer les 2 colonnes de certaines lignes.

A vous d'étudier les lignes de votre fichier (des chaines de caractères) pour les découper plus intelligemment.

- W

**s2a07** · 10/04/2022, 11h26

merci wiztricks j'ai resolu le problème en tronquant mes données par contre j'ai cette erreur en calculant le cosine
UFuncTypeError: ufunc 'multiply' did not contain a loop with signature matching types (dtype('<U6'), dtype('<U6')) -> dtype('<U6')
a votre avis que dois je faire

**wiztricks** · 10/04/2022, 11h41

Envoyé par s2a07

a votre avis que dois je faire

comprendre l'erreur: dtype('<U6'), c'est une chaîne de 6 caractères Unicode.
Et çà ne trouve pas de fonction (ufunc 'multiply') acceptant les paramètres passés (dtype('<U6'), dtype('<U6'))

=> spatial.distance.cosine ne s'applique pas à ce que vous lui proposez.
Que faire? Déjà revoir votre intention (pour quoi vous voulez calculer çà) et soit mettre en forme vos données pour qu'elles soient comestibles par spatial.distance.cosine soit faire autre chose.

- W

**s2a07** · 10/04/2022, 13h00

j'ai modifié le code mais la je me retrouve avec ca

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
 
import math
 
import re
 
from collections import Counter
 
import pandas as pd
 
WORD = re.compile(r"\w+")
 

 

 
def get_cosine(vec1, vec2):
 
    intersection = set(vec1.keys()) & set(vec2.keys())
 
    numerator = sum([vec1[x] * vec2[x] for x in intersection])
 

 
    sum1 = sum([vec1[x] ** 2 for x in list(vec1.keys())])
 
    sum2 = sum([vec2[x] ** 2 for x in list(vec2.keys())])
 
    denominator = math.sqrt(sum1) * math.sqrt(sum2)
 

 
    if not denominator:
 
        return 0.0
 
    else:
 
        return float(numerator) / denominator
 

 

 
def text_to_vector(text):
 
    words = WORD.findall(text)
 
    return Counter(words)
 

 

 

 

 

 
#first u have to open  the file and seperate every line like below:
 

 
 
 
with open(r'C:\Users\User\Desktop\rockyou.txt', "r",encoding="ISO-8859-1") as f:
 
    lines = f.readlines()
 
 
 
df_result = pd.DataFrame(columns=('id', 'password'))
 
 
 
for i,line in enumerate(lines):
 
    id, password = line.split()
 
    df_result.loc[i] = [id, password]
 
print(df_result)
 

 
for i in df_result.index:
 
    result = cosine(text_to_vector(df_result["id"][i]), text_to_vector(df_result["password"][i]))
 
    print(result)
 
        id   password
0   290729     123456
1    79076      12345
2    76789  123456789
3    59462   password
4    49952   iloveyou
5    33291   princess
6    21725    1234567
7    20901    rockyou
8    20553   12345678
9    16648     abc123
10   16227     nicole
11   15308     daniel
12   15163   babygirl
13   14726     monkey
14   14331     lovely
15   14103    jessica
 
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_1056/1836551814.py in <module>
     42 
     43 for i in df_result.index:
---> 44     result = float(cosine(text_to_vector(df_result["id"][i]), text_to_vector(df_result["password"][i])))
     45     print(result)
 
TypeError: 'float' object is not callable

je suis extenue svp corrigez moi j'aimerais tellement trouver ce fichu cosine

**Arioch** · 10/04/2022, 13h44

Et vous ne lisez toujours pas les messages d'erreur...

TypeError: 'float' object is not callable

**Sve@r** · 10/04/2022, 14h29

Envoyé par s2a07

je suis extenue

Ouais, moi aussi quand je te lis.

**s2a07** · 10/04/2022, 14h37

j'ai amelioré le code mais je suis bloque

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
 
import re
import math
from collections import Counter
 
 
def get_cosine(vec1, vec2):
    intersection = set(vec1.keys()) & set(vec2.keys())
    numerator = sum([vec1[x] * vec2[x] for x in intersection])
 
    sum1 = sum([vec1[x]**2 for x in vec1.keys()])
    sum2 = sum([vec2[x]**2 for x in vec2.keys()])
    denominator = math.sqrt(sum1) * math.sqrt(sum2)
 
    if not denominator:
        return 0.0
    else:
        return float(numerator) / denominator
 
 
def text_to_vector(text):
    word = re.compile(r'\w+')
    words = word.findall(text)
    return Counter(words)
 
 
def get_result(content_a, content_b):
    text1 = content_a
    text2 = content_b
 
    vector1 = text_to_vector(text1)
    vector2 = text_to_vector(text2)
 
    cosine_result = get_cosine(vector1, vector2)
    return cosine_result

voici l'erreur

AttributeError Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_13352/1715887280.py in <module>
48
49 for i in df_result.index:
---> 50 result = get_cosine([df_result["id"][i]],[df_result["password"][i]])
51 print(result)

~\AppData\Local\Temp/ipykernel_13352/1715887280.py in get_cosine(vec1, vec2)
5
6 def get_cosine(vec1, vec2):
----> 7 intersection = set(vec1.keys()) & set(vec2.keys())
8 numerator = sum([vec1[x] * vec2[x] for x in intersection])
9

AttributeError: 'list' object has no attribute 'keys'

a quel ligne dois je modifier mon code svp

**s2a07** · 10/04/2022, 14h39

voici mon code

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
 
import re
import math
from collections import Counter
 
 
def get_cosine(vec1, vec2):
    intersection = set(vec1.keys()) & set(vec2.keys())
    numerator = sum([vec1[x] * vec2[x] for x in intersection])
 
    sum1 = sum([vec1[x]**2 for x in vec1.keys()])
    sum2 = sum([vec2[x]**2 for x in vec2.keys()])
    denominator = math.sqrt(sum1) * math.sqrt(sum2)
 
    if not denominator:
        return 0.0
    else:
        return float(numerator) / denominator
 
 
def text_to_vector(text):
    word = re.compile(r'\w+')
    words = word.findall(text)
    return Counter(words)
 
 
def get_result(content_a, content_b):
    text1 = content_a
    text2 = content_b
 
    vector1 = text_to_vector(text1)
    vector2 = text_to_vector(text2)
 
    cosine_result = get_cosine(vector1, vector2)
    return cosine_result
 
 
 
 
with open(r'C:\Users\User\Desktop\rockyou.txt', "r",encoding="ISO-8859-1") as f:
    lines = f.readlines()
 
df_result = pd.DataFrame(columns=('id', 'password'))
 
for i,line in enumerate(lines):
    id, password = line.split()
    df_result.loc[i] = [id, password]
    print(df_result)
 
for i in df_result.index:
    result = get_cosine([df_result["id"][i]],[df_result["password"][i]])
    print(result)

**papajoker** · 10/04/2022, 14h51

#8
Pourquoi ne pas lire ton code plutôt que de poster une requete ici au moindre désagrément ?

tu écris une fonction : get_cosine() qui retourne quel type ? j'ai besoin de caster le retour de cette fonction ?
pourquoi appeler cosine() ? qui vient d'ou ?

ps: si d'autres erreurs, rien ne t'empeche de mettres des print() dans get_cosine() ou autres fonctions

EDIT:
#11
encore une erreur claire, mais tu ne cherches pas à trouver

Trop difficile d'écrire un print(vec1, type(vec1)) juste avant le "plantage"

---------
Cela fait une semaine que tu es sur tes 10 lignes de code ? Si tu avais utilisé autant de temps à faire des tutos, aujourd'hui tu aurais pu écrire ton script en une heure

Envoyé par s2a07

voici mon code

son code

Puisque tu ne fais que du copier/coller, pourquoi pas demander directement à l'auteur ?

**Sve@r** · 10/04/2022, 15h31

Envoyé par s2a07

mais je suis bloque

Ouais, pour pas changer.

Envoyé par s2a07

AttributeError: 'list' object has no attribute 'keys'
a quel ligne dois je modifier mon code svp

A la ligne mentionnée dans le message d'erreur (celle qui appelle "keys" pour une liste qui, comme on le sait tous, enfin tous ceux qui ont ouvert un tutoriel Python au-moins une fois dans leur vie, ne possède pas de méthode "keys").

**s2a07** · 10/04/2022, 15h34

Comment mettre des print dans le cosine
Je ne sais pas mettre des print dans une fonction
Puis je avoir de l'aide

**wiztricks** · 10/04/2022, 15h42

Envoyé par s2a07

Puis je avoir de l'aide

Vous avez juste recopié ce bout de code ici.
Impossible de l'adapter sans avoir les connaissances qui vont avec.
Et passer du temps dans les tutos pour les maîtriser n'est pas quelque chose qu'on peut faire à votre place.

- W