Étude : les data scientists aiment bien leur travail
Malgré le fait qu'ils passent la plupart du temps à réaliser des tâches fastidieuses
Le métier de data scientist ou data analyst sont de hauts responsables de la gestion et de l’analyse “des données massives”, communément plus connues sous le terme Big data. Ces derniers temps, les entreprises font de plus en plus appel à ces profils pour donner un sens aux données et en extraire de la valeur. Le but est de fournir une aide précieuse aux organisations pour qu’elles puissent prendre de bonnes décisions stratégiques et opérationnelles dans un environnement marqué par l’incertitude. En effet, ils sont impliqués dans de nombreuses technologies de pointe comme l’intelligence artificielle, l’apprentissage machine, ainsi que la mise en place des algorithmes et les analytiques.
Dans le futur, la quantité de données va continuer à augmenter, ce qui veut dire que les data scientists doivent trouver un moyen de réduire la charge de leur travail et simplifier les processus auxquels ils ont recours, surtout qu’il existe encore sur le marché de travail un déficit de data scientists et une explosion du nombre de projets concentrés sur l’IA.
Avec l’émergence et l’évolution rapide de technologies comme l’IA et l’apprentissage machine, le marché du travail offre de nombreuses opportunités pour les data scientists. Cette réalité se reflète dans une nouvelle étude réalisée par CrowFlow. 90 % des participants ont informé qu’ils sont contactés au moins une fois chaque mois pour de nouvelles opportunités de travail. Plus de la moitié sont contactés au moins une fois par semaine et 30 % sont contactés plusieurs fois par semaine.
Le métier de data scientist est devenu un métier prisé, du fait de son importance. Il peut être attractif pour certains et pas forcément pour d’autres, mais l’étude de CrowdFlow montre que ceux qui ont poursuivi ce projet de carrière sont très satisfaits de leur occupation. Plus de 90 % des data scientists qui ont participé à l’étude ont répondu qu’ils sont contents avec leur travail actuel et près de 50 % ont informé qu’ils en sont ravis.
Bien qu’ils soient heureux avec leur travail, la plupart des data scientists pensent qu’ils passent la plupart de leur temps à réaliser des tâches qu’ils n’aiment pas trop faire, alors qu’ils n’ont pas assez de temps pour les activités qu’ils aimeraient plus réaliser. En effet, ils aimeraient passer plus de temps à créer et à modéliser des données, faire du data mining et améliorer les algorithmes. Toutefois, ils passent la plupart de leur temps sur des tâches qui incluent le nettoyage et l’organisation des données, l’étiquetage des données et la collecte de groupes de données.
Les tâches que les data scientists aiment le plus réaliser et les tâches qu'ils n'aiment pas réaliser
Malgré la discordance qui semble exister entre le résultat global de l’étude et l’insatisfaction des data scientists en ce qui concerne les activités qu’ils font dans le cadre de leur travail, la plupart sont d’accord que leur travail fastidieux est d’une grande importance et permet d’avoir des données de qualité. Cela est d’autant plus important dans le contexte actuel, avec l’émergence de nouveaux systèmes de l’IA, le data training basé sur des données de qualité permet de faire ressortir les relations prédictives nécessaires pour l’apprentissage. Les data scientists sont bien d’accord que la cause principale de l’échec des systèmes de l’IA est le manque de data training de haute qualité.
Avec l’implication de l’IA dans de plus en plus de domaines, la pression exercée sur le dos des data scientists s’accroit, puisque toute erreur, même minime pourrait être catastrophique pour les humains. « Le nettoyage, l’étiquetage et l’organisation des données ne sont pas des tâches attrayantes ou amusantes, elles sont critiques, » a dit Robin Bordoli, PDG de CrowdFlower. « Les data scientists en sont conscients, c’est pourquoi ils passent beaucoup de temps à réaliser des tâches qu’ils n’aiment pas. La réalité est que les algorithmes sont loin d’être parfaits. Cependant, avec des training data de haute qualité, on peut dégager une plus-value commerciale même avec des algorithmes imparfaits. »
Source : CrowdFlower
Et vous ?
Qu'en pensez-vous ?
Voir aussi :
R plus prisé que SAS pour l'analyse de données, mais Python est le langage le plus populaire selon le Data Science Job Report 2017
Partager