Quelles sont les modules bioinformatiques que vous utilisez le plus (bioperl, CPAN)?
quels sont ceux qui posent souvent problèmes, bugs, etc?
Quelles sont les modules bioinformatiques que vous utilisez le plus (bioperl, CPAN)?
quels sont ceux qui posent souvent problèmes, bugs, etc?
- Les meilleurs cours et tutoriels Perl et Perl 6 pour vous former ;
- FAQ Perl, Perl 6 et Perl/Tk d'entraide ;
- Les news sur la rubrique Perl ;
- S'abonner au compte Twitter de la rubrique Perl ;
- Mes tutoriels developpez.com.
Pas de questions technique par messagerie privée (lisez les règles du forum Perl) et pour les nouveaux !
Bonjour,
Pour ma part, j'ai utilisé quelques modules Perl:
--> "String::Approx" utile pour la recherche de motifs flous, hélas, il est n'est pas robuste, et dans certain cas, les fonction de recherche de motifs ne fonctionnent pas correctement...
--> "CGI::Session" trés utile pour la perdurance de données entre plusieurs pages HTML...On peut ajouter pas mal de données dans une session, par contre , je n'ai pas reussi à y ajouter des objet Perl!!!
--> "Bioperl" Trés complet, j'ai utiliser quelques modules, tels que les parseurs de resultats de Blast...Par contre, j'ai eu du mal à l'installer, surtout si on desire installer tous les sous-modules inclus dans Bioperl...Cela demande une grande patience!!!
--> "LWP" utile pour recuperer des données sur le Web. Trés simple et pas de problemes rencontrés
Petite mise à jour d'autres modules qui sont utiles:
--> "GD" et "PerlMagik" modules graphiques: sont utiles pour generer des images afin d'illustrer des resultas: n'oublions pas que les biologistes aiment beaucoup les images!!! Les modules sont tres utiles et complets quand on sait bien les installer et les utiliser...Une remarque: trop peu de bons tutoriaux sur ces modules disponibles sur le net!!!
Voilà...![]()
Oui les modules les plus utilisés dans BioPerl sont les modules qui parsent les sorties de logiciels tel que Blast, HMMER, ou tout autre logiciel de bioinformatique.
Sinon les modules permettant les manipulations de formats sont aussi très utiles ...
Niveau bug je dirais qu'il faut faire très attention avec BioPerl à la compatibilté du module avec la version du logiciel que tu utilises. Si tu installe la dernière version de Blast qui vient juste de sortir il est fort probable que le module BioPerl ne soit pas encore mis a jours .... cela m'est arrivé très recement donc attention à ça![]()
Bonjour,
Moi, j'utilise
Bio::DB::Query::GenBank
J'ai parfois un problème si je mets dans ma requête un accession n'existant pas. "Acc1 OR Acc2 OR Acc3". Mais pas systématiquement. Soit la requête plante et ne me donne rien, soit elle me revoie les Acc trouvés sans se soucier qu'il y en ait eu un erroné.
J'ai aussi des problème si je dépasse 200 ACC alors que via l'interface GenBank cela fonctionne bien.
Jasmine,
j'ai bien fait d'ouvrir ce topic. Merci de continuer à y mettre vos remarques et modules.
En fait, il y a quelques années, j'utilisais certains modules bioperl et me suis rendu compte que ça planté souvent (j'abuse un peu, mais j'etais pas satisfait à 100%), donc pour parser des banques de données, je preferais reecrire à ma sauce histoire d'etre sur de ce que je voulais.
Mais bon, dans l'ensemble, c'est vraiment pas mal bioperl, mais je l'utilise plus.
- Les meilleurs cours et tutoriels Perl et Perl 6 pour vous former ;
- FAQ Perl, Perl 6 et Perl/Tk d'entraide ;
- Les news sur la rubrique Perl ;
- S'abonner au compte Twitter de la rubrique Perl ;
- Mes tutoriels developpez.com.
Pas de questions technique par messagerie privée (lisez les règles du forum Perl) et pour les nouveaux !
Oui dans l'ensemble c'est plutot pas malmais il y a pas mal de contrainte liée a son utilisation, un autre exemple de problème que j'ai plus rencontré lié au parsing de fichier de Séquences :
En fait il faut savoir que quand on utilise BioPerl pour lire un fichier GenBank ou EMBL BioPerl va charger chaque séquence en mémoire les unes après les autres ... ça c'est bien quand t'as des séquences avec peu de features dessus.
Mais du coup si tu veux faire une analyse sur un chromosome entier ça devient une autre histoire, puisque ton chromosome = 1 Séquence, du coup BioPerl charge TOUT en mémoire.
Avec de la levure et de la Droso ça passait, mais avec du riz c'était même pas la peine, et avec de l'homme j'ose aps immaginer ce que ça pourrait donner.
-------------------- WARNING ---------------------
MSG: CONTIG found. GenBank get_Stream_by_acc about to run.
---------------------------------------------------
J'ai aussi des problèmes avec les requêtes contenant des contig (comme AE005173) car ces séquences font planter mon programme. J'ai lu que d'autres personnes avaient eu le même problème mais je n'ai pas trouvé la solution. Apparement il faudrait modifier le format de ces séquence avant d'utiliser la fonction $gb->get_Stream_by_query($query). Il faudrait utiliser un format FASTA mais je n'ai pas compris comment.Ou alors ill faut les appeler via leur Acc mais si on touve des contig dans une requête plus générale cela ne fonctionne pas.
Continuer à donner une liste des modules que vous utilisé pour la bioinfo.
J'en ferais un résumé pour le mettre dans la FAQ.
J'ai mis à jour la FAQ qui sera bien mise en ligne.
Je n'ai toujours pas crée de section bioinfo car j'attends d'avoir un retour correct.
Voilà
- Les meilleurs cours et tutoriels Perl et Perl 6 pour vous former ;
- FAQ Perl, Perl 6 et Perl/Tk d'entraide ;
- Les news sur la rubrique Perl ;
- S'abonner au compte Twitter de la rubrique Perl ;
- Mes tutoriels developpez.com.
Pas de questions technique par messagerie privée (lisez les règles du forum Perl) et pour les nouveaux !
Bein moi j'utilise le plus souvent des modules de parsing de fiche EMBL ou de résultat d'alignement BLAST. Le défaut de Bioperl c'est qu'il ne libère pas l'espace mémoire à chaque chargement de séquence. Heureusement que je détruit à chaque fois la variable pour en créer une autre. En plus, il y a des séquences qui posent problème dans les derniers release de la base EMBL et c'est lié au champs classification. apparement ça va être reglé avec le module EMBLDRIVER mais je l'ai essayé mais ça ne marche pas.
En tout cas, c'est vraiment pratique Bioperl mais il faut savoir contourner ses defaults.
merci pour le topic.
Je viens de découvrir un module : ABI. Il permet d'analyser des chromatogrammes provenant du séquenceur d'Applied Biosystems.
http://search.cpan.org/~malay/ABI-1.0/ABI.pm
Salut,
Si ça intéresse toujours, j'utilise l'API d'ensEMBL, GD et XML::Twig.
Partager