Bonjour à tous
Je suis entrain de bosser actuellement sur un script qui calcule les probabilité des séquence de mots dans 2 fichier texte et là je trouve un probleme au niveau de Perl.
Je decris la situation :
J'ai deux fichier :
fichier 1 : Fichier 2:
Bonjour les amis Good morning my friends
Bonjour Good morning
Je suis entrain de cehrcher une methose pour calculer la probabilté P(Bonjour, Good morning)
sachant que ici:
P(Bonjour, Good morning) = nombre de fois où je trouve "bonjour" et "good morning" divisé par (nombre de mot du fichier1* nombre de sequence de taille 2 du fichier2)
Je vois que c'est compliqué Mais je garde toujours l'espoir en vos compétences.
Merci
Partager