IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

[Algorithme] Pourcentage de similitude de 2 fichiers


Sujet :

Algorithmes et structures de données

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Septembre 2002
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Septembre 2002
    Messages : 2
    Points : 1
    Points
    1
    Par défaut [Algorithme] Pourcentage de similitude de 2 fichiers
    Bonjour,

    Est-ce que quelqu'un connaitrais un algorithme de pourcentage de similitude. C'est-à-dire qui puisse me dire si deux fichier sont égaux et à quel taux de pourcentage. Genre le fichier a1 et 80% identique du fichier a2.

    Auriez-vous un tel algo dans votre poche? Connaissez-vous un site internet en parlant clairement? J'ai déjà beaucoup cherché sans trop de résultat...

    Merci d'avance

    Magy_4

  2. #2
    Nouveau membre du Club

    Profil pro
    Inscrit en
    Mars 2002
    Messages
    11
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Mars 2002
    Messages : 11
    Points : 38
    Points
    38
    Par défaut
    Tu peux regarder du côté de la distance de Levenshtein.
    La distance Levenshtein est définie comme le nombre minimal de caractères qu'il faut remplacer, insérer ou effacer pour passer d'une chaine à une autre.

  3. #3
    Nouveau membre du Club
    Inscrit en
    Juin 2002
    Messages
    58
    Détails du profil
    Informations forums :
    Inscription : Juin 2002
    Messages : 58
    Points : 35
    Points
    35
    Par défaut
    Salut,

    Si tu veux faire un programme qui soit super performant, tu devrais te renseigner du coté de la genomique. Le problème est quasiement le meme, il faut trouver les ressemblence entre 2 genomes qui sont codées avec un nombre de lettres fixées. Par exemples pour l'ADN, on a les lettres A,T,C,G; pour les proteines, on a un nombre limité d'acide aminé dont la sequence forme le code de c'elles ci. De nombreux algorithmes existent à ce sujet la, il y en a de tres tres performent car les sequences à etudier sont monumentales. Le plus performent à ma connaissance est l'algo BLAST http://www.ncbi.nlm.nih.gov/BLAST/blast_overview.html. C'est basé sur la programmation dynamique. Je ne connais pas ton niveau en programmation, mais c'est loin d'etre evidant . Je crois d'ailleur d'il en existe sur de nombreuses distrib de linux (donc surement avec les souces).

    bon courage...

    Vic
    il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes (devise Shadok)

  4. #4
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Septembre 2002
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Septembre 2002
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Merci pour vos réponses.

    J'ai en effet trouver pas mal de chose dans le secteur de la bio. Mais pour ce que j'en ai besion et le temps que j'ai à disposition, je ne peux pas me lancer dedans, car comme vous l'avez dit c'est assez ardu.

    Par contre j'ai été voir du côté de l'algo de la distance de Levensthein et la j'ai trouvé mon bonheur, Grâce à cet algo j'ai pu faire mes comparaisons et trouver lequel est le plus similaire.

    Donc merci encore pour votre aide.

    Magy_4

  5. #5
    Membre du Club
    Inscrit en
    Août 2002
    Messages
    44
    Détails du profil
    Informations forums :
    Inscription : Août 2002
    Messages : 44
    Points : 49
    Points
    49
    Par défaut
    Pas besoin d'algo génétiques ici...

    Pour calculer le nombre d'insertions ou suppressions à réaliser (pas de remplacement direct), g un algo qui fait mieux que n^2 en moyenne.

    je l'explique dans un post sur clubic : http://forum.clubic.com/forum2.php3?post=5755&cat=13&page=1&interface=&config=&cache=&p=1&sondage=&owntopic=&trash=&subcat=&print=

    Il m'a fallu un paquet de temps pour le retrouver. Commence par le début, pke on commence sur cet algo, mais ensuite on passe à un autre (et ne tiens pas compte du tout premier post, qui parle du dernier algo traité).

    NB : la dernière version que je présente est encore optimisable (je l'ai fait). Et tu dois pouvoir trouver encore mieux sur le net.

    Si on accepte les remplacements directs, en général ce n'est pas très pratique. Mais c comme tu veux, c pas plus dur à coder.

Discussions similaires

  1. [Débutant] Calculer le pourcentage d'un traitement de fichier csv
    Par slim025 dans le forum C#
    Réponses: 3
    Dernier message: 20/05/2015, 18h33
  2. Réponses: 8
    Dernier message: 04/04/2012, 16h34
  3. Comment trouver le degré de similitudes en deux fichiers ?
    Par khawlatunisienne dans le forum Bioinformatique
    Réponses: 1
    Dernier message: 04/07/2011, 11h31
  4. Algorithme de création de signature de fichier
    Par Riko dans le forum Algorithmes et structures de données
    Réponses: 1
    Dernier message: 04/02/2009, 14h21
  5. [Tableaux] Similitude fonctions de fichiers et de tableaux
    Par beejeridou dans le forum Langage
    Réponses: 2
    Dernier message: 04/02/2007, 15h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo