hash de hash et maximum

**pontarose** · 14/02/2014, 14h02

Bonjour,

Je voudrais obtenir l'élément ayant la taille la plus grande pour un gène donnée.
Mais voilà je bloque pour le

Voiçi mon fichier:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
 
tata	geneA	738
toto	geneB	954
tutu	geneC	663
lili	geneC	768
riri	geneC	783
fifi	geneC	864
lala	geneC	888
papa	geneD	1766
mama	geneD	2067
nono	geneD	29

Résultat attendu:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
 
tata	geneA	738
toto	geneB	954
lala	geneC	888
mama	geneD	2067

Voiçi mon script:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 
my $fichier = 'fichier';
open my $fh, '<', $fichier or die "Impossible de lire le fichier $fichier\n";
my $i=0;
 
my %hash=();
while(my $ligne = <$fh>){
	$i++;
        chomp $ligne;
        my ($enst,$ensg,$taille) = split "\t", $ligne;
 	$hash{$ensg}{$taille}=$enst;#hash de hash
}
close($fh);
foreach my $t (keys %hash){
	foreach (keys %{$hash{$t}}){
 
#my $max;
#$max = {$_} if ({$_} > $max)
 
        }
}

**Gardyen** · 14/02/2014, 14h49

Envoyé par pontarose

Bonjour,

Je voudrais obtenir l'élément ayant la taille la plus grande pour un gène donnée.
Mais voilà je bloque pour le

[HS]
Quel dommage, la réponse est probablement facile mais il manque le
[/HS]

tu ne fais que stocker chaque valeur, ajoute un test sur l'existence et la valeur ?

**pontarose** · 14/02/2014, 15h33

je bloque sur la façon de trouver le maximum de mes valeurs pour un gène donnée.

Oui effectivement; il faudrait faire un test mais je n'arrive pas à écrire le fait de "regarder la valeur courante et voir si elle est plus petite ou plus grande que la précédente"

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
foreach my $t (keys %hash){
	foreach (keys %{$hash{$t}}){
		my $max =0;
		$max = ($_) if ($_) > $max;
        }
}

**6ril23** · 14/02/2014, 15h41

je pense que ça devrait fonctionner comme ça

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
my $fichier = 'fichier.txt';
open my $fh, '<', $fichier or die "Impossible de lire le fichier $fichier\n";
 
my %hash=();
while(my $ligne = <$fh>){
        chomp $ligne;
        my ($enst,$ensg,$taille) = split "\t", $ligne;
        if ( !exists $hash{$ensg} or ($hash{$ensg}{'taille'} < $taille) ){   # Attention a la gestion des tailles égales
                $hash{$ensg}{'taille'}=$taille;
                $hash{$ensg}{'espece'}=$enst;
        }
}
close($fh);
 
foreach my $gene (keys %hash){
        print "gene:$gene, taille : $hash{$gene}{'taille'}, espece:$hash{$gene}{'espece'}\n";
}

si tu ne veux que la plus grande et que tu n'as pas besoin des autres données ensuite, stocke uniquement ce que tu as besoin.
Les données en bioinformatiques sont souvent très volumineuses alors il faut essayer de ne pas parcourir à plusieurs reprises de longues listes, hash... car sinon tu risques d'avoir des temps de traitements très couteux en temps et en ressources info

**Lolo78** · 14/02/2014, 16h02

++.

Aucune raison de stocker l'ensemble du fichier dans un hash alors qu'il suffit de le parcourir séquentiellement et de mettre à jour le max pour chaque gène trouvé.

**pontarose** · 14/02/2014, 17h08

Merci à tous,

et merci pour les conseil ,j'ai du mal à voir comment concevoir mes scripts et il est vrai que j'ai tendance à toujours stocker (dans ma tête je pense étape par étape)

hash de hash et maximum

Bioinformatique Perl

Discussions similaires

Partager

Partager