sed, script bash ou autre pour trier un fichier
Bonjour,
Je souhaite analyser sous R des données qui sont contenues dans un fichier de 71230 lignes. Je viens de me rendre compte que R ne peut pas ouvrir le fichier en entier.
Chaque ligne est constitué de l'un des 4 statuts : Unknow, Somatic, Germline et LOH. Je ne suis intéressée que par les lignes Somatic (16007) et LOH (9101). J'ai donc juste besoin de 25108 lignes, ce que je pourrai ouvrir avec R.
Le problème est que mon fichier n'étant pas trié, je n'obtiens pour le moment que 14613 de mes 16007 lignes Somatic et j'ai le même problème pour LOH.
Je voudrais donc trier mon fichier par ordre décroissant sur une certaine colonne ou bien supprimer les lignes contenant les statuts qui ne m'intéressent pas.
J'ai regardé du côté de sed, mais j'ai l'impression que ce n'est pas possible. Existe-t-il un moyen simple pour faire ceci ?
Merci d'avance,
Jane