C:\Users\tchize\Downloads>"c:\Program Files\Java\jdk1.8.0_11\bin"\java corpus.ExtractionNGram2
Saisissez le nombre de gramme : Unigramme (n=1) | Bigramme (n=2) | Trigramme (n=3) n ==>
3
Le nombre de 3-gramme de la liste Non Dialecte Tunisien (NDT) = 193657
fichier NDT.txt est créé avec succès!
Le nombre de 3-gramme de la liste Dialecte Tunisien (DT) = 225696
fichier DT.txt est créé avec succès !
Saisissez votre mot:
évé
Le mot à identifier sera limité par deux espaces: _évé_
l'extraction de 3-grames: [_év, évé, vé_]
les fréquences de chaque 3-gram dans DT
trouver _év dans Mes corpus/DT.txt
trouver évé dans Mes corpus/DT.txt
trouver vé_ dans Mes corpus/DT.txt
_év = 0
évé = 0
vé_ = 0
les fréquences de chaque 3-gram dans NDT
trouver _év dans Mes corpus/NDT.txt
trouvé _év fréquence=7
trouver évé dans Mes corpus/NDT.txt
trouvé évé fréquence=6
trouver vé_ dans Mes corpus/NDT.txt
trouvé vé_ fréquence=12
_év = 7
évé = 6
vé_ = 12
la somme des fréqeunce DT ==225696
la somme des fréqeunce NDT ==193657
******************** DT ********************
_év = 0.0
évé = 0.0
vé_ = 0.0
**** la somme des proba DT = 0.0 ********
_év = 3.614638252167492E-5
évé = 3.0982613590007074E-5
vé_ = 6.196522718001415E-5
**** la somme des proba NDT = 1.2909422329169615E-4 ********
le mot _évé_ est un NDT
Cp1252
java.io.Console@74a14482
Partager