IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Remplacement de caractères sous conditions


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Janvier 2020
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : Conseil

    Informations forums :
    Inscription : Janvier 2020
    Messages : 16
    Par défaut Remplacement de caractères sous conditions
    Bonjour à tous,
    Je sollicite la communauté Linux car je suis devant un problème dont voici un court extrait de fichier:
    J'ai un tableau avec 1 million de lignes et 300 colonnes. Les colonnes de référence sont CHROM (Lu01), POS(n°), REF(A,G, C ou T) ALT(A, G, C ou T et les combinaisons sont possible) puis celles de mes échantillons à modifier sont les suivantes (ech1, ech2...)
    Mon objectif: Si dans mes colonnes ech1, ech2...
    - je trouve le motif ./.:...., alors je remplace cette case par celle la case de la colonne REF
    - Dans le cas ou j'ai sur un mème ligne 1/1 et 2/2, alors j'ai dans ma colonne ALT, 2 lettres séparées par une virgule. les cases 1/1 devront prendre la valeur de la lettre avant la virgule, et les case 2/2 la valeur après la virgule
    - je trouve uniquement le motif 1/1 sur une même ligne...., alors je remplace cette case par celle la case de la colonne ALT.


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    CHROM	POS	REF	ALT	ech1	ech2	ech3
    Lu01	10	G	A	1/1:99:30:30:2:27:90%:1,5465E-14:37:36:2:0:27:0	1/1:99:37:37:5:31:83,78%:1,6935E-15:37:37:5:0:31:0	1/1:18:4:4:0:4:100%:1,4286E-2:0:37:0:0:4:0
    Lu03	15	G	A	1/1:99:42:42:3:39:92,86%:8,4519E-21:37:37:3:0:39:0	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	1/1:18:4:4:0:4:100%:1,4286E-2:0:37:0:0:4:0
    Lu10	32	C	T	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	./.:.:.:.:.:.:.:.:.:.:.:.:.:.
    Lu01	33	G	T,C	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	2/2:24:5:5:0:5:100%:3,9683E-3:0:37:0:0:5:0
    Lu02	34	G	T	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	./.:.:.:.:.:.:.:.:.:.:.:.:.:.	1/1:99:47:47:5:41:87,23%:5,7183E-21:37:36:5:0:41:0

    Avez vous des idées ?
    Vous trouverez en PJ l'extrait du fichier pour une meilleure visualisation
    Merci bcp :-)
    Fichiers attachés Fichiers attachés

  2. #2
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 664
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 664
    Par défaut
    Bonjour,

    il n'est pas dit quel langage tu as le droit d'utiliser pour faire cet exercice.
    awk est tout à fait adapté pour ce type de manipulations.

    peux-tu te référer aux numéros de colonnes, ou (parce qu'il y en a trop, à des endroits trop éloignés) uniquement à leur titre (dans l'en-tête) ?
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  3. #3
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 293
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 293
    Par défaut
    Bonjour

    STOP ! Déjà, ton fichier vient de Windows et tu as un problème avec la fin de ligne. Il faut utiliser un utilitaire comme dos2unix pour le convertir. Ou alors, on peut faire la commande suivante :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -i 's@\r$@@' exemple.txt
    Après, on peut proposer un truc du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    $ awk -F '\t' '{ OFS=FS;for (c=5;c<=7;c++) {split($4,alt,",");if ($c ~ /\.\/\./) $c=$3; else if ($c ~ /1\/1/) $c=alt[1]; else if ($c ~ /2\/2/) $c=alt[2]}; } 1' exemple.txt
    #CHROM  POS     REF     ALT     ech1    ech2    ech3
    Lu01    10      G       A       A       A       A
    Lu01    15      G       A       A       G       A
    Lu01    32      C       T       C       C       C
    Lu01    33      G       T,C     G       G       C
    Lu02    34      G       T,C     G       G       T

  4. #4
    Membre averti
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Janvier 2020
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : Conseil

    Informations forums :
    Inscription : Janvier 2020
    Messages : 16
    Par défaut
    Merci, c'est exactement la solution à mon problème. Bravo encore et merci pour la rapidité !

  5. #5
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 293
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 293
    Par défaut
    À la relecture, ce n'est pas dans l'ordre.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk -F '\t' -vOFS='\t' '{split($4,alt,",");for (c=5;c<=7;c++) if ($c ~ /\.\/\./) $c=$3; else if ($c ~ /1\/1/) $c=alt[1]; else if ($c ~ /2\/2/) $c=alt[2]; } 1' exemple.txt
    • Pas la peine d'affecter OFS 1 million de fois.
    • Pas la peine de parser la colonne ALT pour chaque colonne ech*

  6. #6
    Membre averti
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Janvier 2020
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : Conseil

    Informations forums :
    Inscription : Janvier 2020
    Messages : 16
    Par défaut
    Merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Remplacer le contenu d'une cellule par une valeur sous condition
    Par zoocoral dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 13/11/2015, 06h50
  2. [XL-2013] Remplacer une ligne par X lignes sous conditions
    Par unlucky dans le forum Excel
    Réponses: 3
    Dernier message: 10/06/2015, 11h43
  3. Réponses: 36
    Dernier message: 13/11/2013, 16h46
  4. [WD17] Remplacer photo sous condition
    Par GEY3008 dans le forum WinDev
    Réponses: 6
    Dernier message: 05/05/2013, 10h47
  5. [WD-2010] Enlever automatiquement des caractères sous condition
    Par Nico414 dans le forum VBA Word
    Réponses: 2
    Dernier message: 08/08/2012, 10h05

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo