Bonjour,
je cherche à lire un fichier texte en ne sélectionnant que certaines lignes.
Pour celà, je pense utiliser une expression régulière. J'ai actuellement :
Mon fichier texte a cette allure (généré par TreeTagger) :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 String reg = "(?i)(?s)\\t(DET|ART|PRP|KON|PRO|DEM)"; Pattern p = Pattern.compile(reg); while((line = br.readLine()) != null) { Matcher m = p.matcher(line); if(!m.matches()) { list.add(line.split(SEPARATEUR)); } }
Je cherche à supprimer les mots « sans sens » (articles...).liberté NOM liberté
certains PRO:IND certain
termes NOM terme
répandus VER:pper répandus
comme KON comme
piratage NOM piratage
comportent VER:pres comporter
des PRP:det du
idées NOM idées
auxquelles PRO:REL auquel
nous PROER nous
espérons VER:futu espérons
que KON que
vous PROER vous
n' ADV ne
adhérerez VER:futu adhérerez
pas ADV pas
La regex utilisée actuellement ne détecte rien... et je ne comprends pas pourquoi.
Merci pour votre aide !
Alban
Partager