Déduction de similaritées

**SPKlls** · 15/05/2008, 18h21

Je parse des URL.
Ce que j'aimerai faire, ça serait pouvoir déduire les similarités des adresses.
Par exemple j'ai :

http://www.blabla.com/dossier/unautre/monfichier.exp
http://www.blabla.com/dossier/unautr...trefichier.ext

J'aimerai pouvoir en déduire que l'adresse de base de ces fichiers est :
http://www.blabla.com/dossier/unautre/

Bien sur j'ai déjà une idée pour arriver à ce résultat, mais je me demandais s'il existait pas déjà des fonctions, ou autre, tout prête.
Sinon, je pourrai toujours utiliser une boucle, et continuer tant que les caratères sont identiques...

**dividee** · 15/05/2008, 23h20

Si dans ton exemple, au lieu de "monfichier.exp", tu avais "unfichier.exp", tu voudrais que le résultat soit: http://www.blabla.com/dossier/unautre/un ? J'en doute car cet URL ne pointerait sans doute sur rien d'existant.

Si tu ne veux pas ça, il faut découper suivant les / et tester morceau par morceau:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
def common(u1,u2):
    r = []
    for e1,e2 in zip(u1.split('/'),u2.split('/')):
        if e1 == e2:
            r.append(e1)
        else:
            break
    return '/'.join(r)

Ou plus court, mais moins facile à comprendre:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
from itertools import takewhile
def common(u1,u2):
    return '/'.join(zip(*takewhile(lambda x: x[0]==x[1], zip(u1.split('/'),u2.split('/'))))[0])

**Fructidor** · 16/05/2008, 00h33

Bonjour,

une autre solution serait:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
 
import difflib
a=difflib.SequenceMatcher()
a.set_seqs("http://www.blabla.com/dossier/unautre/monfichier.exp","http://www.blabla.com/dossier/unautr...trefichier.ext")
a.get_matching_blocks()[0]

pas nécessairement plus court... mais utile a connaitre.

Déduction de similaritées

Python

Vue hybride

Discussions similaires

Partager

Partager