Convertir séquence ADN => entier unique ?

**ctobini** · 24/09/2007, 11h48

Bonjour,

Je suis en train de créer une base de données MySQL avec une table contenant des séquences d'ADN devant être uniques. Je nourris la base à partir de fichiers plats que je traite en Perl (et oui...

).

Les 2 écueils sont les suivants :

- un index unique doit contenir la longueur du segment de la chaine à comparer, or la longueur est variable et la comparaison doit se faire sur la totalité de la chaine

- une indexation sur des chaines aussi longues (>= 500 caractères) va être lourde pour la base.

Je cherche donc une façon de convertir une séquence en entier unique, selon sa longueur et ordre des nucléotides.

Connaîtriez-vous un algo capable de faire ceci (soit directement utilisable par module, soit assez bien décrit pour être implémenté par quelqu'un qui n'a jamais fait d'algo (moi )) ?

En vous remerciant,

C. Tobini

**crochepatte** · 04/10/2007, 09h26

Hello,
Pour ma part, je pense que j'essaierai d'indexer la sequence d'ADN par un code hexadecimal pour gagner de la place (cela revient tout simplement à convertir un nombre en base 4 à un nombre en base 16...)....Pour les tres grandes chaines, cela restera tout de même lourd, et cela ne fonctionne que pour les quences d'ADN contenant uniquement des ATGC (base 4)...

Je sais pas si cela peut t'aider...

**ctobini** · 04/10/2007, 10h20

Bonjour et merci de ta réponse, désolé pour la mienne tardive,

J'ai finalement opté pour une indexation sur la totalité de la longueur. J'ai théoriquement un maximum de 500 caractères, en indiquant une taille supérieure, l'indexation se fait dynamiquement sur la taille d'index maximum.

C'est lourd mais je n'ai pour l'instant pas énormémement de sondes à gérer, je préfère avoir la certitude d'avoir une séquence unique par table que prendre le risque d'avoir des doublons, ce qui serait catastrophique

Merci encore et bonne journée,

C. Tobini

Convertir séquence ADN => entier unique ?

Bioinformatique Perl

Discussions similaires

Partager

Partager