Bonjour à tous,
Je suis débutante en python ( je code en perl habituellement), mais je dois utiliser scipy et donc apprendre python !

Alors, comme exemple de ce que je souhaite faire :

j'ai un fichierA avec des coordonnées :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
chromosome start stop
chrA 1114	1121
qui, en fait, "clusterise" les coordonnées du fichier B ci dessous :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
chromosome start stop count
chrA	1114	1115	2
chrA	1117	1118	2
chrA	1119	1120	1
chrA	1120	1121	1
Et en fait, je voudrais pour chaque cluster dans le fichier A, créer une liste x contenant les start de toutes les coordonnées du fichier B contenu dans le cluster (sachant qu'il faut bien faire attention au chromosome), et une liste y contenant les count de chaque position du fichier B, soit dans l'exemple :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
 
X=[1114,1117,1119,11120]
y=[2,2,1,1]
Une fois que j'ai ca, je veux faire une interpolation, mais j'ai déjà le code qui fonctionne, il me manque juste à faire mes listes X et Y en parcourant mes fichiers !

Merci pour vos conseils !

Je ne sais pas du tout comment m'y prendre, avec perl, j'aurai fais ça avec un hash, mais en python ......