bonjour je cherche un algo de cesure d'un texte ! apres une multitude de recherche je ne trouve rien de bien concret.
D'avance merci
bonjour je cherche un algo de cesure d'un texte ! apres une multitude de recherche je ne trouve rien de bien concret.
D'avance merci
Ce qui est fait en TeX/LaTeX peut être intéressant:
http://www.fi.muni.cz/usr/sojka/papers/tug95b.pdf
Brutalement, j'aurai tendance à appliquer les règles de césure suivantes sur un parcours du texte, avec comptage des caractères par ligne :
Quand la longueur de ligne maximale est atteinte, revenir en arrière jusqu'à ce que l'on rencontre, au choix :
- un blanc
- une paire de consonne (pas nécessairement double)
- une voyelle
Au premier de ces trois élément rencontré, on introduit :
- un saut de ligne à la place du blanc
- un tiret de césure et un saut de ligne entre les deux consonnes
- un tiret de césure et un saut de ligne après la voyelle.
Bien sûr, il y a des exceptions ... pour la règle de la paire de consonnes, il ne faut pas couper les 'gn', 'ph', 'tr', 'dr', 'br', 'bl', 'gr', 'gl', 'pr', 'pl' ...
En fait, cette règle mérite une ré-écriture ... les doubles consonnes ('ss', 'll', 'mm', etc.) sont des emplacements systématiques de césure. Pour les autres cela dépend ...
Quelques petites règles complémentaires, si l'on veut compliquer :
- pas de césure sur les mots d'une syllabe.
- Eviter les césures trop proches des extrémités de mots (à apprécier) (recoupe d'ailleurs la règle précédente).
Voila. Ce sont des idées générales ...
Bon courage
La FAQ Perl est par ici
: La fonction "Rechercher", on aurait dû la nommer "Retrouver" - essayez et vous verrez pourquoi !
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager