1 pièce(s) jointe(s)
Prédiction de la langue d’un texte
Bonjour,
Je mène un projet sur un classifieur de type perceptron multicouches permettant de détecter la langue d'un texte à partir de la fréquence des bigrammes de ce dernier.
Les performances obtenues par le classifieur dépendent du nombre d’exemples vus lors de l’apprentissage. Je veux tracer une courbe d’apprentissage donnant les performances du réseau selon la taille des données d’apprentissage pour chacune des langues.
Je pars d'un fichier enregistré sur mon ordi puis
Code:
1 2 3 4 5 6 7 8 9 10 11
| l_corpus_train=[
['en', './train/en_partut-ud-train.txt'],
['fr', './train/fr_sequoia-ud-train.txt'],
['it', './train/it_partut-ud-train.txt'],
['nl', './train/nl_lassysmall-ud-train.txt'],
['sl', './train/sl_sst-ud-train.txt'],
['es', './train/es_ancora-ud-train.txt'],
['pt', './train/pt_bosque-ud-train.txt'],
['de', './train/de_gsd-ud-train.txt'],
['ca', './train/ca_ancora-ud-train.txt']
] |
Voici le code qui me pose problème.
Je souhaite afficher sur le même graphique, une courbe par langue.
Pour l'instant, j'ai crée mon graph vide mais je ne ne sais pas comment créer ces courbes
je pense utiliser "nums_subplots" sans savoir comment
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| from keras.models import Sequential
from keras.layers import Dense, Activation, Dropout
model = Sequential()
nbLangues = len(codeLangues.keys())
print('nbLangues =', nbLangues)
model.add(Dense(units=100, activation='tanh', input_dim=28*28))
model.add(Dense(units=nbLangues, activation='softmax'))
model.compile(loss='categorical_crossentropy',
optimizer='adam',
metrics=['accuracy'])
import matplotlib.pyplot as plt
accuracy = {}
#nums_subplots
plt.xlim(500, 1000)
plt.ylim(0,1)
plt.xlabel("datasize")
plt.ylabel("accuracy")
plt.title('titre')
plt.legend()
plt.show() |
voilà le type de graph que je veux obtenir, une langue = une courbe
Pièce jointe 651372
je vous remercie si vous pouvez m'apporter des pistes
Pauline