IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

reconversion data science-recherche formation


Sujet :

Big Data

  1. #1
    Candidat au Club
    Femme Profil pro
    Conseil en assistance à maîtrise d'ouvrage
    Inscrit en
    Avril 2017
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Conseil en assistance à maîtrise d'ouvrage
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2017
    Messages : 4
    Points : 4
    Points
    4
    Par défaut reconversion data science-recherche formation
    Bonjour à tous,
    Je suis à la recherche des formations pour reconversion en data science
    si vous avez des pistes pour des centres,cours en ligne ,formation continue .........
    j'ai trouvé JEDHA connaissez vous cette formation?

    Remarque je suis salariée




    Merci pour votre aide

  2. #2
    Expert Oracle confirmé

    Homme Profil pro
    Consultant Big Data
    Inscrit en
    Mars 2003
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Consultant Big Data
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2003
    Messages : 448
    Points : 926
    Points
    926
    Par défaut
    Bonjour,

    Vaste question, à laquelle je vais essayer de vous apporter qq éléments de réflexion.



    Pour moi, il y a effectivement 3 possibilités de se former :

    1) suivre un MOOC, une formation en ligne donc, plus ou moins longue. Je ne connais pas Jedha, mais ce genre de formation ne manque pas.

    Posez aussi la question à votre employeur pour voir aussi si il ne propose pas par hasard un accès à une plateforme de formation en ligne. Mon nouvel employeur m'a ainsi fait bénéficier d'un accès à Pluralsight.



    2) reprendre des cours. Habitant sur Paris, c'est la formule qui a été la plus plébiscitée par mes collègues. Ils sont ainsi plusieurs à être retournés sur les bancs du CNAM pour suivre une formation en Data Science.



    3) enfin je n'ai connu qu'une seule personne qui a suivi la très réputée filière Data Science de Télécom Paris.

    Attention là on rentre dans une autre dimension : formation d'un an à 10.000 euros que la personne s'est payée elle-même, sans compter les 28 jours de congés pris sans solde pour suivre les cours, et sans compter les cours qu'elle a du reprendre avant au CNAM et aussi par un professeur particulier pour se remettre à niveau en math, stats, proba et je ne sais quoi avant de pouvoir intégrer Télécom Paris.

    Mais à ce prix là, ce n'est pas seulement une formation que vous vous payez. Vous intégrez aussi tout un réseau de connaissances....



    Du coup, les questions à se poser sont nombreuses :

    1) le temps que l'on va devoir y consacrer : c'est pour moi un point crucial, un des plus importants. Car tous ceux qui croient s'en sortir avec 5 à 6 heures par semaine se trompent lourdement.

    Toutes mes connaissances, ainsi que moi, en sommes sortis sur les rotules. Pendant votre formation, surtout si vous travaillez, vous n'avez plus de vie !

    Pour ma part, j'y ai passé 15 à 20 heures par semaine, et cela chaque semaine, sans répit pendant les 5 mois de formation. Et après 1 mois de vacances, rebelotte pendant 1 mois et demi avec le projet à faire.



    2) pensez à votre niveau de départ, surtout avec les langages de programmation. Moi je ne connaissais pas Python avant de faire du Big Data, et cela m'a beaucoup ralenti dans les exercices à faire (sur une VM Cloudera).

    Donc vérifiez le niveau de connaissances exigées au départ, notamment en Python et en R, ainsi que le bagage mathématique nécessaire et le niveau de connaissances en algorithmes (supervisés, non supervisés, cluster, K-Means, arbres de décision...) avant de vous lancer



    3) penchez vous sur l'aspect financement : vous avez des MOOC par exemple que l'on peut suivre gratuitement, mais moi j'avais préféré payer à l'époque les 360 euros demandés pour la spécialisation Big Data de 6 mois et demi.

    Bien m'en a pris car vous êtes ainsi certifiés.

    Cela signifie que si vous payez :
    - il vous faut une Webcam pour prendre en photo votre visage et aussi une pièce d'identité
    - à chaque cours (d'environ 1 mois), vous avez un résultat avec un pourcentage de réussite global, ainsi qu'un numéro de licence
    - et cerise sur le gâteau, vous pouvez automatiquement enrichir votre profil Linkedin si vous le souhaitez, ce qui aide en cas de recherche d'un nouveau poste

    Voir aussi si vous pouvez avoir une aide de votre employeur, d'un organisme quelconque ou du CPF (Compte Personnel de Formation).



    4) étudier l'aspect matériel : il vous faut certes un ordinateur. Mais attention car si avec 4 Go de RAM, je pense que vous pouvez faire un peu de développement Python, dès que vous faites du Big Data, ou du Machine Learning sur Spark par exemple, ou autre, et que vous utilisez pour cela une VM Hadoop toute faite, là il vous faut plutôt un ordinateur avec 16 Go de RAM.

    Pour mon cas, j'avais téléchargé la VM de Cloudera sous Virtualbox pour disposer d'un cluster Hadoop mono-noeud, et les 16 Go de mon PC n'était pas de trop pour faire tous les exercices sur MapReduce, Hive, Pig, Spark & Co...



    5) autre aspect matériel : les livres.

    Parfois on a besoin de s'acheter un livre. Et à environ 50 euros le livre, l'addition monte vite.

    Dans ce cas, envisagez peut-être de prendre un abonnement annuel, ou mensuel si cela est proposé, sur une plateforme de livres en ligne, comme :

    https://www.safaribooksonline.com/
    http://www.informit.com/
    https://www.editions-eni.fr/
    https://www.apress.com/us


    Certes, cela peut paraître cher, mais vous avez accès à l'intégralité de leurs livres en ligne !

    Une astuce : surveillez les promotions à 50 %
    Par exemple, sur Safari Books Online, l'abonnement annuel de 400 $ est parfois proposé à 200 $.

    Autre astuce : qq (trop) rares entreprises disposent d'un accès à ce genre de plateforme.



    6) le niveau d'anglais pour les formations en ligne, car toutes les vidéos sont en anglais et parfois, on tombe sur des formateurs difficiles à comprendre à cause de leur accent.

    A noter qu'il est parfois possible d'activer le sous-titrage en anglais, et que parfois, les cours ont été traduits, de manière plus ou moins approximatives, en d'autres langues.


    7) ne vous contentez pas de suivre les vidéos pour les MOOC.

    On croit à tort qu'il suffit de regarder les vidéos. Sauf que, pour ceux qui veulent être certifiés, il y a après des quizz ainsi que des exercices de programmation.

    Et là, si l'on n'a pas pris de notes ni de copie d'écran, comme il est difficile de mémoriser le contenu d'une dizaine de vidéos allant chacune de 3 à 15 minutes, on passe un temps fou à rechercher les infos pour répondre aux quizz.

    Concrètement, une vidéo de 15 minutes me demandait en fait entre 45 minutes à une heure pour la traiter, le temps de la regarder une première fois, puis de la repasser en prenant des notes de l'essentiel et en faisant des copies d'écran dans un document Word.

    Sinon on ne s'en sort pas.

    C'est pour cela qu'un MOOC peut demander autant d'heures de travail par semaine.

    Voilà mon retour d'expérience, en espérant que cela vous aide.

  3. #3
    Candidat au Club
    Femme Profil pro
    Conseil en assistance à maîtrise d'ouvrage
    Inscrit en
    Avril 2017
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Conseil en assistance à maîtrise d'ouvrage
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2017
    Messages : 4
    Points : 4
    Points
    4
    Par défaut un grand merci pour ce retour
    j'ai oublié de préciser que je n'ai aucune compétence en programmation ,pensez vous cette reconversion est possible ou pas .
    j'aimerais bien avoir un bon conseil afin d'entamer ou pas ce chemin

  4. #4
    Expert Oracle confirmé

    Homme Profil pro
    Consultant Big Data
    Inscrit en
    Mars 2003
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Consultant Big Data
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2003
    Messages : 448
    Points : 926
    Points
    926
    Par défaut
    Aïe, désolé mais c'est incontournable.

    A l'heure actuelle, je n'ai pas rencontré un seul Data Scientist qui ne connaisse pas le langage Python.

    Non seulement ils connaissent Python, mais en plus la plupart connaissent le langage R qui est un langage plutôt orienté pour les statisticiens.

    Pour moi, mais je peux me tromper, vous devriez essayez de vous autoformer sur Python, soit par un livre ou en suivant un MOOC gratuit sur Internet.

    Si vous n'accrochez pas, je pense que ce n'est pas la peine de poursuivre.

  5. #5
    Candidat au Club
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Mars 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Chef de projet en SSII

    Informations forums :
    Inscription : Mars 2019
    Messages : 2
    Points : 2
    Points
    2
    Par défaut Rex
    Bonjour rouardg,
    Pouvez vous me dire quel mooc vs avez suivi et sur quoi cette formation vous à fait rebondir ?
    Merci.
    Cdt.

  6. #6
    Expert Oracle confirmé

    Homme Profil pro
    Consultant Big Data
    Inscrit en
    Mars 2003
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Consultant Big Data
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2003
    Messages : 448
    Points : 926
    Points
    926
    Par défaut
    Bonsoir,

    Je m'étais inscrit début 2016 sur le site de Coursera et j'avais suivi la spécialisation Big Data.

    A l'époque, cette spécialisation comportait 5 cours d'un mois chacun, suivi d'un projet sur un mois et demi. J'avais payé 360 Euros de ma poche pour le tout, pour obtenir les certifications.

    Sachez que c'est un véritable engagement, et que cela me demandait 15 à 20 heures de travail personnel par semaine, et ceci pendant les 6 mois et demi. Autrement dit, vous n'avez plus de vie, surtout si vous avez un boulot à côté !

    L'avantage, c'est qu'au final j'avais une bonne vision de l'écosystème Hadoop, puisque l'on a pratiqué MapReduce, Pig, Hive, Spark, du Machine Learning, Neo4j, du Knime et du Splunk.

    Cette formation m'a aidé pour changer de SSII et trouver un poste dans le Big Data. Mais cela ne suffit pas, car ce que l'on vous demande avant tout, C'EST DE L'EXPERIENCE, chose que vous n'avez pas.

    Du coup, ce qui aide aussi, c'est :
    - se faire coopter
    - montrer que l'on a une tête bien faite et que l'on saura s'adapter
    - avoir d'autres compétences en main

    Au final, je suis depuis un an en mission dans une banque, à administrer 2 clusters Hortonworks, et à gérer le logiciel DSS (Data Science Studio) de l'éditeur Dataiku.

    Travailler sur du Big Data, c'est travailler en équipe. Il est impossible de tout connaître, et chacun vient donc avec son domaine de compétence.

    Moi j'ai des collègues Datascientists, des gens qui ne vous parlent que d'algorithmes (Clustering, Réseaux bayésiens, arbres de décision, NLP....), qui ne jurent que par les environnements virtuels Python et R, grands adeptes des Notebooks Jupyter, des IDE comme PyCharm ou RStudio, et adorateurs de Bokeh ou de RShiny, et des Markdown. Bien entendu, ils vous installeront des packages dans tous les sens, comme spaCy, NLTK, et maintenant Keras.

    Avec ces gens là, vous allez considérablement enrichir votre vocabulaire.

    Sinon vous avez les développeurs, qui eux ne jurent que par les IDE IntelliJ IDEA ou autre, adepte du Maven et de la POM, où Git est ton ami et Jenkins ton quotidien. Tout ce joli petit monde est embarqué dans le DevOps et le CI/CD autant que faire se peut. Bien entendu, ils ont leurs langages de développement favoris (moi je vois surtout du Java car ce sont d'anciens Javaistes venus du monde J2EE. Je n'ai pas vu de Python ou de Scala pour le moment).

    A un moment, vous rencontrerez les gens de la prod. Bien sur, cette rencontre se fera trop tardivement et ils botteront en touche vos livrables qui ne correspondront pas à ce qu'ils attendent. Sauf qu'ils n'auront jamais pris la peine de vous expliquer auparavant ce qu'ils attendent !

    Et moi dans tout cela qui vient plutôt de la couche basse, c'est-à-dire de l'administration Linux et du scripting. Au niveau administration Hadoop, vous apprendrez pas mal de choses, et essaierait de comprendre comment une telle usine à gaz (je parle du cluster Hadoop) fonctionne.

    Vous aborderez des sujets :
    - de sécurité : authentification Kerberos, authentification LDAP, autorisations sous Apache Ranger, Gateway Knox
    - d'installations logicielles comme je l'ai fait avec DSS ou Anaconda
    - des problématiques de performance comme on en retrouve sur Hive ou sur Spark

    Et puis il y a des sujets annexes. Pour ma part, je viens de découvrir Docker et Kubernetes pour le coupler à DSS.

    Pour finir, mais cela dépend du projet dans lequel vous tomberez, vous pouvez travailler sur autres choses, comme des bases NoSQL (Redis, Cassandra, MongoDB ou Couchbase), du Streaming avec Kafka ou de l'indexation et recherche avec Elastic.

    Bref c'est un monde trés (trop) riche où l'on a vite fait de se perdre. Ah j'oubliais, si vous avez envie de découvrir tout ce monde, c'est plutôt en mode "débrouille toi, personne ne t'aidera" et auto-formation à gogo !

    En espérant vous avoir éclairé.

  7. #7
    Candidat au Club
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Mars 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Chef de projet en SSII

    Informations forums :
    Inscription : Mars 2019
    Messages : 2
    Points : 2
    Points
    2
    Par défaut
    Merci pour ce retour,
    Du coup tu te considère comme data analyste, data scientist ou data ingénieur?
    Cdt.

  8. #8
    Expert Oracle confirmé

    Homme Profil pro
    Consultant Big Data
    Inscrit en
    Mars 2003
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Consultant Big Data
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2003
    Messages : 448
    Points : 926
    Points
    926
    Par défaut
    Aucun des 3.

    Je n'ai aucune appétence pour la Data Science avec ses algorithmes de ML et autres, et aucune appétence pour les maths, probas et autres statistiques.

    Pour le moment, je m'occupe de la partie IT et infrastructure, et comme pour une voiture, je soulève la capot du moteur pour comprendre comment le moteur et toute cette mécanique fonctionnent.

    Je ne suis expert en rien, mais je touche à un maximum de choses possibles. J'essaye aussi de prendre du recul pour voir ce qu'apportent réellement toutes ces nouvelles technos, et déterminer leurs cas d'usage. En clair essayer de voir quel logiciel ou composant répond le mieux à une problématique métier.

  9. #9
    Membre éprouvé

    Homme Profil pro
    Développeur décisionnel
    Inscrit en
    Novembre 2012
    Messages
    28
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur décisionnel
    Secteur : Industrie

    Informations forums :
    Inscription : Novembre 2012
    Messages : 28
    Points : 999
    Points
    999
    Par défaut Travailler dans le Big Data : les formations à suivre
    Bonjour lafleur de coco,

    pour t'orienter dans la Data Science en Big Data c'est important de comprendre déjà les compétences que tu dois développer.
    Tu as deux catégories de compétences à développer en tant que Data Scientist :
    les compétences en Big Data et les compétences en Data Science.

    Une fois que tu auras identifié les compétences nécessaires pour être data scientist, tu pourras choisir entre 3 moyens pour les développer :
    soit les certifications
    soit les masters spécialisés
    soit alors les kaggles, meetup, auto-formations, autodidacte par des bouquins.

    Bon courage,

    Juvénal
    Mes cours et tutoriels bases de données et Hadoop : https://juvenal-chokogoue.developpez.com

Discussions similaires

  1. Recherche formation Prolog
    Par gicquairea dans le forum Prolog
    Réponses: 7
    Dernier message: 12/08/2007, 22h54
  2. Réponses: 4
    Dernier message: 19/04/2007, 01h33
  3. load data infile et format date
    Par Mathieu72 dans le forum SQL Procédural
    Réponses: 1
    Dernier message: 27/01/2007, 12h59
  4. [format] recherche format dbf
    Par cibouseb dans le forum Autres SGBD
    Réponses: 8
    Dernier message: 03/05/2006, 11h19
  5. recherche formation
    Par pascal.cargouet dans le forum Etudes
    Réponses: 1
    Dernier message: 10/02/2006, 13h15

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo