Bonjour, merci pour ton implication. Jusqu'au boutiste la marmotte ! ^^

Désolé d'avoir répondu tard mais c'est parce que justement j'ai passé 3 jours non stop sur l'algo que j'avais proposé vers le milieu du topic, j'ai réglé le problème de la ponctuation, récupéré les offsets et fais une classe exprès pour stocker les entités communes.
En plus d'après ce que tu dis, mon algo ponctionne moins de ressources et p-ê même moins de temps (à vérifier j'ai pas dépassé les 200ko de fichiers de tests).

En gros l'idée c'est d'enlever les blancs inutiles dans le texte (espaces, tabulations, etc...), d'enlever la ponctuation. De faire un array_intersect, et de partir d'un mot, de construire une séquence jusqu'à ce qu'elle n'apparaisse plus dans les 2 textes à la fois (ceci en faisant un preg_match_all dans les 2 textes, il doit retourner true. Du coup ça règle le problème de la ponctuation car on compare avec le texte original, avec la ponctuation et en bonus on a les offsets ^^).

Merci tous pour votre GRANDE aide !