IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités

    Homme Profil pro
    Dirigeant
    Inscrit en
    Juin 2016
    Messages
    3 160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Bénin

    Informations professionnelles :
    Activité : Dirigeant
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Juin 2016
    Messages : 3 160
    Points : 66 309
    Points
    66 309
    Par défaut Python serait la compétence la plus demandée pour la science des données au détriment de R
    Python serait la compétence la plus demandée pour la science des données au détriment de R
    selon une analyse portant sur plus de 15 000 offres d'emploi de spécialistes des données

    Python continuerait d'être la norme et la compétence la plus recherchée dans le domaine de la science des données, dépassant de loin les autres technologies et outils, comme R, SAS, Hadoop et Java. Une analyse réalisée dernièrement par Terence Shin, un spécialiste des données, a révélé que l'adoption de Python pour la science des données continue de croître alors même que le langage R, plus spécialisé, est en déclin. Cependant, cela ne veut pas dire que les spécialistes des données vont abandonner R de sitôt. L'on continuera probablement à voir Python et R utilisés pour leurs forces respectives.

    Si vous vous préparez à faire carrière en tant que scientifique spécialisé dans les données ou si vous cherchez des occasions afin de vous perfectionner dans votre rôle actuel, cette analyse des compétences recherchées pour 2021, basée sur plus de 15 000 offres d'emploi de spécialistes des données, pourrait vous donner une idée des langages de programmation et des outils logiciels dont l'importance augmente et diminue. Pour cette analyse, Shin a répertorié les offres d'emploi publiées sur Indeed, Monster et SimplyHired. Il a déclaré n'avoir pas pris en compte LinkedIn en raison de problèmes de Captcha.

    Nom : datascience-1024x576.jpg
Affichages : 147264
Taille : 90,2 Ko

    Shin a ensuite vérifié combien d'offres d'emploi comprenaient chacun des termes suivants :

    • Python, SQL, R, Java, Git, C, MATLAB, Excel, C++, JavaScript, C#, Julia, Scala, SAS ;
    • Scikit-learn, Pandas, NumPy, SciPy ;
    • Matplotlib, Looker, Tableau ;
    • TensorFlow, PyTorch, Keras ;
    • Spark, Hadoop, AWS, GCP, Hive, Azure, Google Cloud, MongoDB, BigQuery ;
    • Docker, Kubernetes, Airflow ;
    • NoSQL, MySQL, PostgreSQL ;
    • Caffe, Alteryx, Perl, Cassandra, Linux.

    Après avoir obtenu les chiffres de chaque source, il les a additionnés, puis divisés par le nombre total d'offres d'emploi de spécialistes des données pour obtenir un pourcentage. Par exemple, la valeur de 0,77 pour Python signifie que 77 % des offres d'emploi contenaient Python. Enfin, il a comparé les résultats à ceux d'une analyse effectuée en 2019 pour obtenir le pourcentage de changement de 2019 à 2021.

    Python accompagne le boom de la science des données

    Selon certains analystes, en 2021, la science des données devrait devenir une capacité à l'échelle de l'entreprise qui aurait un impact sur chaque secteur d'activité et département fonctionnel. Si cela s'avérait juste, alors le langage le plus susceptible de dominer devrait être celui qui est le plus accessible à la population la plus large de l'entreprise. Sur le graphique présenté par Shin montrant les 25 compétences les plus demandées en 2021 en science des données, Python arrive en tête, apparaissant dans plus de 77 % des offres emplois répertoriées. Le reste du top 5 est formé par SQL (59 %), R (54 %), Spark (26 %) et AWS (26 %).

    Nom : 1_Hk2Z7OXz6GkcnfLkHoNbvw.png
Affichages : 3164
Taille : 59,1 Ko

    Shin estime que R reste très pertinent dans la science des données, ce qui ne devrait pas changer dans un avenir proche. Cela dit, il estime que davantage de spécialistes des données passent de R à Python que l'inverse (deux fois plus, selon lui). D'après ses explications, l'on pourrait expliquer ce phénomène par l'amélioration de la convivialité, des performances et de l'écosystème de Python, entre autres. Shin a déclaré que R reste largement utilisé pour le calcul statistique, mais comme de plus en plus d'entreprises adoptent la science des données d'un point de vue technique et non scientifique, Python devrait continuer à monter en flèche.

    En observant davantage les graphiques, l'on remarque que les technologies/outils qui semblent connaître la croissance la plus rapide sont celles qui semblent avoir une courbe d'apprentissage plus facile. Ainsi, si TensorFlow et PyTorch ont tous deux connu une croissance, celle de PyTorch a largement dépassé celle de TensorFlow, probablement en raison de la popularité de Python. La popularité de PyTorch commence également à se répercuter sur les projets eux-mêmes, le nombre cumulé de contributeurs à PyTorch pourrait ainsi dépasser le nombre de contributeurs à TensorFlow dans un avenir proche.

    Autres observations issues de l'analyse de Shin

    Les principaux langages de programmation

    Pour obtenir une vision plus granulaire, le graphique ci-dessous présente les principaux langages de programmation pour les spécialistes des données.

    Nom : 1_fo2VNCZjTSe7lkylSgfrjg.png
Affichages : 3185
Taille : 34,8 Ko

    Principales bibliothèques Python

    Le graphique ci-dessous présente les principales bibliothèques Python pour les spécialistes des données.

    Nom : 1_4bEfALL8-lOUujINQw_e0Q.png
Affichages : 3139
Taille : 32,6 Ko

    TensorFlow se classe premier, car c'est l'une des bibliothèques Python les plus populaires pour l'apprentissage profond. PyTorch est une alternative solide, ce qui explique son classement. Ensuite, il estime que Scikit-learn serait la bibliothèque la plus importante de Python pour l'apprentissage automatique. Après avoir nettoyé et manipulé vos données avec Pandas et/ou NumPy, Scikit-learn est utilisé pour construire des modèles d'apprentissage automatique, car il possède de nombreux outils utilisés pour la modélisation et l'analyse prédictive.

    Compétences dont la croissance et le déclin sont les plus rapides

    Le graphique ci-dessous montre les compétences dont la croissance est la plus rapide entre 2019 et 2021.

    Nom : 1_sJ8Zk1uIt79lNXe5KsTHZQ.png
Affichages : 3110
Taille : 35,5 Ko

    Le graphique ci-dessous montre les compétences dont le déclin est le plus rapide entre 2019 et 2021.

    Nom : 1_zfPM5RRj8q5S8gnHEiWIPw.png
Affichages : 3140
Taille : 36,4 Ko

    Source : Terence Shin

    Et vous ?

    Quel est votre avis sur le sujet ?

    Voir aussi

    DataSpell : JetBrains lance un nouvel environnement de développement intégré pour la science des données et vous invite à rejoindre le programme d'accès anticipé à l'EDI

    Science des données : Julia, R ou Python ? Un petit aperçu des avantages et inconvénients du langage Julia

    La demande et les salaires de spécialistes en science des données augmentent plus rapidement que le nombre de demandeurs d'emploi, d'après Indeed

    Python est plus utilisé pour la data science que pour le développement Web, d'après une enquête réalisée par la Python Software Foundation

    Sondage : entre R et Python, lequel des deux langages est le plus conseillé pour la science des données ?

  2. #2
    Membre averti
    Profil pro
    Inscrit en
    Septembre 2012
    Messages
    199
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2012
    Messages : 199
    Points : 316
    Points
    316
    Par défaut
    "Python continuerait d'être la norme..."
    Compter les termes des offres d'emploi ne permet pas de l'affirmer. Une très grande majorité des recrutement se font en marché caché (bouche à oreille, candidature spontanée, dépôt de CV sur le site de l'entreprise...), sans compter la formation continue. Une annonce parait quand on manque de postulants. Cela ne reflète pas de ce qui est la norme ou pas.

    R est principalement utilisé dans le secteur financier et de la santé. Python dans les autres. Généraliser en terme de norme pour la science des données n'a aucun sens.

  3. #3
    Membre chevronné Avatar de denisys
    Profil pro
    Développeur informatique
    Inscrit en
    Mai 2002
    Messages
    1 155
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Mai 2002
    Messages : 1 155
    Points : 2 064
    Points
    2 064
    Par défaut
    Apres, murs réflexions, a la lecture de article..
    Sans sous estimer, les capacités de Python, dans le domaine de la science des données.
    Offres d’emploi, ne veux pas dire performances, dans le domaines des extractions de données, ainsi que le travaille de ces données.
    Sans oublier, que en France,
    Tout le monde peut être un Cabinet de recrutement.
    Sans comprendre, la demande du besoin, mais publier, une appelle d’offre d’emploi.
    Avec l’espoir, de faire, son chiffre d’affaire !!!

Discussions similaires

  1. Réponses: 7
    Dernier message: 06/01/2022, 11h55
  2. Réponses: 0
    Dernier message: 06/04/2021, 20h24
  3. Réponses: 14
    Dernier message: 06/01/2015, 18h22
  4. Java reste la compétence la plus demandée en entreprise
    Par Stéphane le calme dans le forum Emploi
    Réponses: 13
    Dernier message: 31/01/2014, 14h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo