Bonjour,

je cherche à déterminer quel serait le meilleur algorithme de compression de chaîne de caractères, sachant que le ratio de compression prime sur l'usage des resources (mémoire, temps).

Pour situer le problème, je cherche à réduire la taille d'un paramètre véhiculé dans une URL. Je ne vais pas détailler le bien fondé de la raison de faire ainsi plutot qu'autrement, surtout qu'il émane plus d'un principe philosophique qu'autre chose.

Les hypothèses sont :
1) En entrée : caractères imprimables, taille de 10 à 50000 caractères, beaucoup de motifs semblables (le type de chaîne ressemble à du SQL pour vous faire une idée)
3) en sortie : une chaîne de caractère (URL compatible).

J'ai besoin d'un fort taux de compression pour limiter les risques de rejet des navigateurs (http://www.boutell.com/newfaq/misc/urllength.html)

Pour l'instant, je procède ainsi :
1) conversion chaîne en tableau de bytes
2) compression Gzip
3) base 64 encodage du résultat

ce qui me permet de passer d'une taille de 17286 à 1796 par exemple. Ca parraît pas mail, mais peut-être existe-t-il un meilleur algo que gzip pour ce domaine bien précis.

Merci