Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités

    Les scientifiques renomment les gènes humains pour empêcher qu'Excel ne les interprète comme des dates
    Les scientifiques renomment les gènes humains pour empêcher que Microsoft Excel ne les interprète comme des dates
    Le Comité HUGO en charge de la nomenclature publie un guide y relatif

    Les travailleurs de la filière génétique attribuent aux gènes humains des noms et des codes alphanumériques comme MARCH1 (Membrane Associated Ring-CH-Type Finger 1) encore connus sous le nom de symboles. Ces ensembles sont utilisés pour la coordination en matière de recherche dans le domaine. Problème avec Microsoft Excel dont on fait usage dans la sphère : le logiciel interprète les codes alphanumériques comme des dates, ce qui complique le travail des scientifiques. Le Comité HUGO en charge de la nomenclature vient à la rescousse avec un guide pour apporter réponse aux soucis avec le soft de la suite Office.


    Excel est un géant dans le monde des tableurs et est régulièrement utilisé par les scientifiques pour suivre leurs travaux et même mener des essais cliniques. Toutefois, le problème avec le logiciel de la suite Office de Microsoft est que son paramétrage est à gérer avec précaution pour les applications scientifiques. Mal s’y prendre lors de cette étape peut mener à des corruptions des données. La situation a été mise en avant au sein d’une étude parue au cours de l’année 2016. Dans les chiffres, le cinquième de 3597 articles publiés ont été affectés par des erreurs en lien avec l’utilisation du tableur. Le Comité de nomenclature résume bien le problème dans une vidéo et indique la procédure de prise en main de bases de données susceptibles d’être corrompues du fait d’un mauvais paramétrage du logiciel.


    La publication de la nouvelle nomenclature intervient pour sa part dans le but de résoudre le problème à la base, c’est-à-dire, lors de l’importation des données. Les symboles susceptibles d’être interprétés comme des dates du fait du formatage automatique d’Excel se sont donc vu renommer en conséquence : MARCH1 devient MARCHF1 ; SEPT1 devient SEPTIN1 ; etc. Si le guide n’a fait l’objet de publication que récemment, il faut dire que le travail est en cours depuis un moment. Le Comité de nomenclature rapporte avoir procédé à la modification des symboles d’une trentaine de gènes au courant de l’année précédente.


    À la réalité, les généticiens ne sont pas les seuls à être affectés par ce comportement du logiciel de la suite Office de Microsoft. Quelle que soit la branche de métier de laquelle on est issu (développement d’applications informatiques, sciences des données, etc.), le constat général est qu’Excel transforme en date toute donnée interprétable de la sorte ; c’est le comportement par défaut du logiciel. D’avis d’observateurs, le formatage automatique des données en date devrait être optionnel.


    Une autre approche pour Microsoft serait de prendre en compte les retours des professionnels de divers corps de métiers. La manœuvre permettrait de mettre sur pied des profils correspondant à des paramétrages adaptés à chaque cas d’utilisation du logiciel.

    Source : HGNC

    Et vous ?

    Vous arrive-t-il de faire face à avoir à contourner le formatage automatique de données en dates sous Excel ? Comment vous y prenez-vous ?
    Quels outils alternatifs à Excel utilisez-vous pour des besoins similaires ?
    Partagez-vous l’avis selon lequel Microsoft devrait rendre ce comportement optionnel ?

    Voir aussi :

    Microsoft Excel se dote de XLOOKUP, une nouvelle fonction de recherche pour résoudre les nombreuses limitations de VLOOKUP et HLOOKUP
    Laissez tomber Office 2019 et optez plutôt pour Office 365 et ses fonctionnalités basées sur l'IA, le nouveau slogan publicitaire de Microsoft
    Microsoft Ignite 2019 : les annonces qu'il ne fallait pas rater lors de la conférence. Au programme Microsoft Office, Cortana, Microsoft Teams et Fluid Framework
    Microsoft Office 365 reste l'application la plus populaire en entreprise et bat Google G Suite, d'après un rapport
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Modérateur

    Je me rappelle d'un temps (Excel 2003) où il n'était pas possible d'insérer des données commençant par zéro dans les cellules (comme les numéros de téléphone français) et que l'outil était limité à 65536 lignes (actuellement 1 048 576 lignes), que des galères... qu'est-ce qui empêche les scientifiques d'utiliser une vraie base de données relationnelle par rapport à Excel ?
    N'hésitez pas à consulter la FAQ Java, lire les cours et tutoriels Java, et à poser vos questions sur les forums d'entraide Java

    Ma page Developpez | Mon profil Linkedin | Vous souhaitez me contacter ? Contacter Gokan EKINCI

  3. #3
    Membre régulier
    Donc si je comprend bien, ils renomment des gènes car ils ne savent pas changer les formats de cellules de Excel (Texte par exemple)...
    Pourquoi faire simple quand on peut faire compliqué

  4. #4
    Membre actif
    Citation Envoyé par Gugelhupf Voir le message
    qu'est-ce qui empêche les scientifiques d'utiliser une vraie base de données relationnelle par rapport à Excel ?
    Le fait qu'ils n'ont pas besoin d'une base de données relationnelles, mais probablement plus de tracer des courbes et d'avoir une grande liberté de calcul et de partager ça facilement.

    C'est dommage, je n'ai aucun doute que les développeurs de LibreOffice ou de Jupyter ce seraient fait un honneur de faire le nécessaire pour convenir à leur besoins.

  5. #5
    Membre averti
    Donc en gros ils se plaignent de ne pas pouvoir désactiver le formatages auto. et affecter manuellement le format des cellules/colonnes/lignes alors que c'est précisément ce qu'ils devraient faire pour résoudre leur problème...

  6. #6
    Membre éprouvé
    Citation Envoyé par barmic Voir le message
    Le fait qu'ils n'ont pas besoin d'une base de données relationnelles, mais probablement plus de tracer des courbes et d'avoir une grande liberté de calcul et de partager ça facilement.

    C'est dommage, je n'ai aucun doute que les développeurs de LibreOffice ou de Jupyter ce seraient fait un honneur de faire le nécessaire pour convenir à leur besoins.
    j'ai ce besoin et cela fait belle lurette que j'utilise plus excel pour ça.
    une vrai base comme postgresql/cassandra ou autres relié à un Jupyter et/ou un grafana/kibana est 1000 fois mieux.

    excel c'est bien pour un faire les comptes ou une petite base client chez une petite entreprise (boulangerie, auto école....) mais pas pour de l'analyse/traitement scientifique ou pour faire des formulaires en entreprise (franchement c'est horrible)

  7. #7
    Expert éminent
    On est vendredi, c'est un joli article.

    C'est quoi ces trolls sérieux... Changer le type d'une colonne c'est pas très compliqué...

    « Toujours se souvenir que la majorité des ennuis viennent de l'espace occupé entre la chaise et l'écran de l'ordinateur. »
    « Le watchdog aboie, les tests passent »

  8. #8
    Expert confirmé
    Citation Envoyé par Patrick Ruiz Voir le message

    Vous arrive-t-il de faire face à avoir à contourner le formatage automatique de données en dates sous Excel ? Comment vous y prenez-vous ?
    Oui, j'utilise une manipulation incroyablement complexe, pas à la portée de n'importe qui et qui nécessite au moins 10 ans d'études poussée sur le logiciel pour la mettre en œuvre: je met la colonne au format texte avant d'y mettre des données

    Quels outils alternatifs à Excel utilisez-vous pour des besoins similaires ?
    Je propose d'utiliser à la place du papier et un crayon, pas de formatage automatique avec ça ! (enfin presque moi quand j'essaye il me met automatiquement la police "illisible")

    Partagez-vous l’avis selon lequel Microsoft devrait rendre ce comportement optionnel ?
    Mais c'est déjà optionnel ! Il suffit de savoir utilisé un minimum Excel
    J'aimerais bien aller vivre en Théorie, car en Théorie tout se passe bien.

  9. #9
    Membre confirmé
    Ajouter une ' devant le numero (0033...) pour ne pas faire de conversion?? Trop difficile

  10. #10
    Expert confirmé
    Au vu des commentaires, je comprends mieux pourquoi tout le monde méprise les informaticiens.
    Donc en fait, Excel n'a pas de problème, ce sont juste ses utilisateurs qui sont des imbéciles.
    D'ailleurs tous les gens qui vont au garage pour la vidange de leur voiture ou a la boulangerie pour acheter du pain, ce sont également des imbéciles car ce n'est vraiment pas compliqué a faire soi-même...

  11. #11
    Expert éminent sénior
    Citation Envoyé par SimonDecoline Voir le message
    Au vu des commentaires, je comprends mieux pourquoi tout le monde méprise les informaticiens.
    Donc en fait, Excel n'a pas de problème, ce sont juste ses utilisateurs qui sont des imbéciles.
    D'ailleurs tous les gens qui vont au garage pour la vidange de leur voiture ou a la boulangerie pour acheter du pain, ce sont également des imbéciles car ce n'est vraiment pas compliqué a faire soi-même...
    Non, mais demander 15 minutes à un informaticien de faire une macro embarquée qui fait ça - et se déclenche par exemple au lancement de l'EXCEL, ça ne me parait pas aberrant, quand même. C'est pas comme si les compétences EXCEL étaient introuvables sur le marché (surtout en cette période de vaches maigres). En comparaison, changer des tables de référence déjà présentes partout dans le monde, ça me parait être un chantier bien plus vaste, bien pus casse-gueule, et bien plus coûteux.
    Les 4 règles d'airain du développement informatique sont, d'après Michael C. Kasten :
    1)on ne peut pas établir un chiffrage tant qu'on a pas finalisé la conception
    2)on ne peut pas finaliser la conception tant qu'on a pas complètement compris toutes les exigences
    3)le temps de comprendre toutes les exigences, le projet est terminé
    4)le temps de terminer le projet, les exigences ont changé
    Et le serment de non-allégiance :
    Je promets de n’exclure aucune idée sur la base de sa source mais de donner toute la considération nécessaire aux idées de toutes les écoles ou lignes de pensées afin de trouver celle qui est la mieux adaptée à une situation donnée.

  12. #12
    Membre actif
    Citation Envoyé par calvaire Voir le message
    j'ai ce besoin et cela fait belle lurette que j'utilise plus excel pour ça.
    une vrai base comme postgresql/cassandra ou autres relié à un Jupyter et/ou un grafana/kibana est 1000 fois mieux.

    excel c'est bien pour un faire les comptes ou une petite base client chez une petite entreprise (boulangerie, auto école....) mais pas pour de l'analyse/traitement scientifique ou pour faire des formulaires en entreprise (franchement c'est horrible)
    J'aime beaucoup cassandra, mais je suis convaincu que les gens qui utilisent un tableur n'ont pas besoin de cassandra. Sous les dizaines de millions de lignes et/ou une charge à plusieurs dizaines de milliers de requêtes secondes, il contraint plus qu'il n'aide.

    Mais tout ce que tu décris demande un niveau de formations relativement fou. J'en utilise une partie (je n'ai pas eu l'occasion de toucher à grafana), mais tu dois apprendre un schéma, le langage de requêtage, python ou un autre plus un ou 2 autres trucs. Jupyter, grafana et kibana sont tes amis quand tu veux traiter tes données, pas quand tu veux les construire. Ce qui est le problème qui est décrit plus haut. Grafana et kibana ne feront jamais ça pour toi (ce n'est pas leur but), mais jupyter peu très bien ajouter quelque chose pour ça (ou rendre plus visible/améliorer un module déjà existant).

    Donc oui je suis d'accord qu'ils sont très bon, mais à minima :

    • ils ne répondent que partiellement au problème (ils n'aident pas à l'insertion des données)
    • ils ont une marche d'apprentissage bien plus élevée
    • ils posent des contraintes en terme de partage comme l'obligation d'avoir un accès au réseau (et potentiellement un bon réseau)

  13. #13
    Membre éprouvé
    D'accord avec SimonDecoline, c'est la machine qui doit s'adapter à l'humain, pas l'inverse. Et il n'y a pas que les chercheurs qui galèrent à cause du formatage automatique d'Excel, depuis le temps que ça cause des problèmes à tout le monde, Microsoft aurait pu prendre les devants et y remédier.

    Et c'est facile de dire "Ils n'ont qu'à faire appel à un informaticien" quand on ne réalise le problème qu'une fois les études publiées...

    Perso, je suis pour, dans la mesure du possible, avoir le moins d'"intelligence" possible dans nos outils: si on veut une date, on devrait explicitement dire qu'on veut une date, pas l'inverse.

  14. #14
    Expert éminent
    Citation Envoyé par Guntha Voir le message
    Perso, je suis pour, dans la mesure du possible, avoir le moins d'"intelligence" possible dans nos outils: si on veut une date, on devrait explicitement dire qu'on veut une date, pas l'inverse.
    Et à côté de cela monsieur madame tout le monde gueule parce que les essuies glace de la voiture ne se déclenchent pas automatiquement quand il y a de la pluie ?

    On est justement dans une ère où tout le monde ne veut pas s'embêter et que cela fasse le café tout seul.
    Après l'informatique c'est pas magique, donc normal qu'on trouve des cas particuliers qui embêtent plus qu'autre chose.
    Mais quand le contournement est applicable par n'importe qui... On demande pas de faire un tableau croisé dynamique quand même là !

    « Toujours se souvenir que la majorité des ennuis viennent de l'espace occupé entre la chaise et l'écran de l'ordinateur. »
    « Le watchdog aboie, les tests passent »

  15. #15
    Expert confirmé
    Citation Envoyé par transgohan Voir le message
    Et à côté de cela monsieur madame tout le monde gueule parce que les essuies glace de la voiture ne se déclenchent pas automatiquement quand il y a de la pluie ?
    Non. Ceux que je connais gueulent justement quand les essuies glace se déclenchent alors qu'ils n'ont rien demandé.
    Et on a à peu près le choix de prendre ou non cette option quand on achète une voiture.

    Sérieusement : les généticiens changent leur méthode de travail tellement ils en ont marre d'excel mais le problème serait que ce sont tous des imbéciles ? Là ce n'est plus de l'aveuglement, c'est le syndrome de Stockholm...

  16. #16
    Membre éprouvé
    Citation Envoyé par Guntha Voir le message
    D'accord avec SimonDecoline, c'est la machine qui doit s'adapter à l'humain, pas l'inverse. Et il n'y a pas que les chercheurs qui galèrent à cause du formatage automatique d'Excel, depuis le temps que ça cause des problèmes à tout le monde, Microsoft aurait pu prendre les devants et y remédier.

    Et c'est facile de dire "Ils n'ont qu'à faire appel à un informaticien" quand on ne réalise le problème qu'une fois les études publiées...

    Perso, je suis pour, dans la mesure du possible, avoir le moins d'"intelligence" possible dans nos outils: si on veut une date, on devrait explicitement dire qu'on veut une date, pas l'inverse.
    Pas besoin de faire appel à un informaticien ici...

    Changer le format d'une colonne, c'est un clic ...

    https://i.postimg.cc/zfWPWDtb/Annota...-07-115047.png


    Donc soit c'est un troll, soit il doit y avoir une autre complexité qui m'a échappée...


    ps2 : Alors, perso, j'ai essayé d'importer un fichier CSV dans Excel avec des valeurs textes du style "mars 18", "avril 19", ... et il n'y a aucune option pour conserver un format "texte". Ca transforme obligatoirement la donnée en format date "mars-18", "avril-19", et la donnée textuelle d'origine est perdue. En effet, si on retransforme la donnée en format texte standard, le résultat est du type "43160", et non plus "mars 18". Bref, c'est en effet plus compliqué qu'un simple clic !

  17. #17
    Expert confirmé
    Citation Envoyé par Guilp Voir le message
    Pas besoin de faire appel à un informaticien ici...

    Changer le format d'une colonne, c'est un clic ...

    https://i.postimg.cc/zfWPWDtb/Annota...-07-115047.png

    Donc soit c'est un troll, soit il doit y avoir une autre complexité qui m'a échappée...
    C'est illustré dans la vidéo : apparemment quand ils téléchargent un csv, excel convertit les genes en dates. Et ce n'est pas qu'une question de formatage, les données initiales ne semblent pas récupérables.

    Citation Envoyé par Guilp Voir le message
    ps: par contre, je n'ai pas fait les études nécessaires pour réussir à retirer une pièce jointe sur ce forum, donc désolé pour la pollution visuelle...
    Voilà c'est exactement ça : le forum n'a pas de problème, c'est juste toi qui est un imbécile si tu trouves qu'il ne te convient pas.

  18. #18
    Membre éprouvé
    Citation Envoyé par transgohan Voir le message
    Et à côté de cela monsieur madame tout le monde gueule parce que les essuies glace de la voiture ne se déclenchent pas automatiquement quand il y a de la pluie ?
    Je ne suis jamais monté dans une voiture avec des essuie-glace qui s'allument tout seuls, et je pète déjà des câbles devant l'auto-complétion de Visual Studio qui ne fait JAMAIS ce qui est intuitif pour moi, du coup je suis à la recherche d'alternatives Pour l'instant je penche pour lite pour la partie éditeur.

    Les problèmes de conversions en dates non-désirées datent au moins du début des années 2000, je trouve ça invraisemblable que depuis, Microsoft n'ait jamais recherché une meilleure solution.

    Comme tu dis dans ta signature

    Citation Envoyé par transgohan Voir le message
    « Toujours se souvenir que la majorité des ennuis viennent de l'espace occupé entre la chaise et l'écran de l'ordinateur. »
    Notre désaccord, c'est de quelle chaise et de quel écran on parle.

  19. #19
    Expert éminent
    Eh beh quel discours... On n'a traité personne d'imbécile à ce que je sache...
    Vive les insultes gratuites c'est toujours très gratifiant...

    Je terminerai avec comme intervention qu'Excel est fait pour gérer son format de données, le CSV ne l'est pas de premier abord. L'associer à l'ouverture de l'application est une hérésie (la seule que je serai prêt à ce stade à leur accorder).
    Quand on veut lui en importer alors on passe par la fonction d'import...
    Qui permet de définir les délimiteurs, et auparavant on prépare nos formats de colonnes.
    Ainsi pas de surprises.

    Bref... On utilise un outil comme il faut l'utiliser. Dès qu'on cherche des moyens détournés il est normal de se prendre les pieds dans le tapis.

    « Toujours se souvenir que la majorité des ennuis viennent de l'espace occupé entre la chaise et l'écran de l'ordinateur. »
    « Le watchdog aboie, les tests passent »

  20. #20
    Expert confirmé
    Citation Envoyé par transgohan Voir le message
    Eh beh quel discours... On n'a traité personne d'imbécile à ce que je sache...
    Vive les insultes gratuites c'est toujours très gratifiant...
    C'est vrai. Toutes mes excuses. Au lieu de cela, on a eu le droit à plein de sous-entendus et de 2e degré méprisant. J'imagine que l'hypocrisie et le cynisme sont aussi très gratifiant...

    Citation Envoyé par transgohan Voir le message
    Je terminerai avec comme intervention qu'Excel est fait pour gérer son format de données, le CSV ne l'est pas de premier abord. L'associer à l'ouverture de l'application est une hérésie (la seule que je serai prêt à ce stade à leur accorder).
    Quand on veut lui en importer alors on passe par la fonction d'import...
    Qui permet de définir les délimiteurs, et auparavant on prépare nos formats de colonnes.
    Ainsi pas de surprises.
    Beaucoup de gens s'en foutent de l'informatique, c'est juste un outil. On arrête pas de leur dire que excel leur permet de faire plein trucs mais quand ils l'installent bah désolé mais le csv qu'ils teléchargent, il s'ouvre automatiquement avec excel et apparemment n'importe comment. Et le standard pour partager des données, c'est plus souvent csv que excel. Donc c'est bien un problème pour pas mal de gens.

    Citation Envoyé par transgohan Voir le message
    Bref... On utilise un outil comme il faut l'utiliser. Dès qu'on cherche des moyens détournés il est normal de se prendre les pieds dans le tapis.
    Et donc quand l'outil demande de faire nimporte quoi pour fonctionner correctement, il faut s'y résigner et ne pas faire évoluer l'outil ?

###raw>template_hook.ano_emploi###