Bonjour a tous !

Ayant déja sollicité votre aide pour choisir un algorithme de compression de données sans pertes ( le codage de Huffman ), je suis confronté a un autre problème .

Je dois développer une application qui doit faire 3 choses :

- compresser un fichier A
- compresser un fichier B
- compresser la concaténation de A et B en supprimant les redondances.

Sachant que A et B sont des fichiers de texte, comment vais je pouvoir faire pour exprimer le fait qu'il y'ait ou pas des redondances ?
En effet, le codage de Huffman, c'est bien joli si on code qu'un seul caractère. si on code 2 caractères la table de codage grandit énormément, alors si je veux coder des mots pour pouvoir voir si y'en a deux identiques, je n'ose même pas imaginer les combinaisons possibles ...

Auriez-vous une idée pour me faire avancer?

Merci d'avance !