Bonjour,
Je mène un projet sur un classifieur de type perceptron multicouches permettant de détecter la langue d'un texte à partir de la fréquence des bigrammes de ce dernier.
Les performances obtenues par le classifieur dépendent du nombre d’exemples vus lors de l’apprentissage. Je veux tracer une courbe d’apprentissage donnant les performances du réseau selon la taille des données d’apprentissage pour chacune des langues.
Je pars d'un fichier enregistré sur mon ordi puis
Voici le code qui me pose problème.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 l_corpus_train=[ ['en', './train/en_partut-ud-train.txt'], ['fr', './train/fr_sequoia-ud-train.txt'], ['it', './train/it_partut-ud-train.txt'], ['nl', './train/nl_lassysmall-ud-train.txt'], ['sl', './train/sl_sst-ud-train.txt'], ['es', './train/es_ancora-ud-train.txt'], ['pt', './train/pt_bosque-ud-train.txt'], ['de', './train/de_gsd-ud-train.txt'], ['ca', './train/ca_ancora-ud-train.txt'] ]
Je souhaite afficher sur le même graphique, une courbe par langue.
Pour l'instant, j'ai crée mon graph vide mais je ne ne sais pas comment créer ces courbes
je pense utiliser "nums_subplots" sans savoir comment
voilà le type de graph que je veux obtenir, une langue = une courbe
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28 from keras.models import Sequential from keras.layers import Dense, Activation, Dropout model = Sequential() nbLangues = len(codeLangues.keys()) print('nbLangues =', nbLangues) model.add(Dense(units=100, activation='tanh', input_dim=28*28)) model.add(Dense(units=nbLangues, activation='softmax')) model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) import matplotlib.pyplot as plt accuracy = {} #nums_subplots plt.xlim(500, 1000) plt.ylim(0,1) plt.xlabel("datasize") plt.ylabel("accuracy") plt.title('titre') plt.legend() plt.show()
je vous remercie si vous pouvez m'apporter des pistes
Pauline
Partager