Bonjour,

j'aimerais créer un script permettant de compter le nombre de doublons d'un tableau pour chaque cas. Par exemple, j'ai un CSV du type suivant (que je mets dans un Array) :

14/04/2011,titi,serveur1
14/04/2011,titi,serveur2
14/04/2011,titi,serveur1
14/04/2011,titi,serveur1
15/04/2011,titi,serveur2
15/04/2011,titi,serveur1
15/04/2011,titi,serveur2
15/04/2011,titi,serveur1
15/04/2011,titi,serveur2
15/04/2011,titi,serveur2
18/04/2011,titi,serveur2
18/04/2011,titi,serveur1
18/04/2011,titi,serveur1
18/04/2011,titi,serveur1
J'ai déjà cette méthode qui permet de supprimer les doublons :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
sub doublons_grep
{
  my ($ref_tableau) = @_;
  my %hash_sans_doublon;
  return grep { !$hash_sans_doublon{$_}++ } @{$ref_tableau};
}
my @connections_sans_doublon = doublons_grep( \@connections );
Mon but final est d'obtenir un tableau qui récapitule le nombre de fois qu'un utilisateur s'est connecté au serveur 1 ou au serveur 2, par jour.

Bien sûr, dans mon fichier, je n'ai pas seulement l'utilisateur "titi" (j'ai en revanche uniquement 2 serveurs). Pourriez-vous me donner des conseils pour atteindre mon but ? Pas du code tout mâché, mais un algo ou la méthode pour procéder. Peut-être que la méthode "compter le nombre de doublons pour chaque cas, puis supprimer les doublons" que j'ai choisi n'est pas la meilleure...

Je précise que je ne suis pas très expérimenté en Perl, donc n'hésitez pas à détailler votre pensée. Merci d'avance pour vos réponses !