IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

Importer des données issues des réseaux sociaux


Sujet :

Big Data

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juillet 2013
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Juillet 2013
    Messages : 55
    Points : 65
    Points
    65
    Par défaut Importer des données issues des réseaux sociaux
    Bonjour tout le monde,

    Je voudrais importer des commentaires, des tweets (en format json) pour les intéger dans une base mongoDB. Je ne sais pas du tout comment m'y prendre ni quels outils utiliser. Quelqu'un aurait une idée ???

    Merci par avance,

  2. #2
    Membre chevronné
    Avatar de PixelJuice
    Homme Profil pro
    Ingénieur .NET & Game Designer
    Inscrit en
    Janvier 2014
    Messages
    639
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Ingénieur .NET & Game Designer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2014
    Messages : 639
    Points : 2 148
    Points
    2 148
    Par défaut
    Importer des tweets ou des commentaires d'un compte particulier ? C'est facile avec les APIs de Facebook / Twitter.

    Après si c'est des tweets sur un Hashtag particulier je pense que c'est aussi possible , vu que je vois des bots le faire.

    Si c'est pas le cas, il nous faudrait plus de détails.

  3. #3
    Membre actif
    Homme Profil pro
    Consultant BigData
    Inscrit en
    Juillet 2009
    Messages
    129
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Consultant BigData

    Informations forums :
    Inscription : Juillet 2009
    Messages : 129
    Points : 280
    Points
    280
    Par défaut
    Tu peux utiliser une solution d'ETL pour importer ce genre de données.

    Par exemple avec Talend :
    • Tu utilises un connecteur Twitter (basé sur Twitter4j) qui te servirait de source
    • Tu as à disposition composant
    • Tu utiliserais mongo en cible.


    PS : désolé de remonter un post qui date de plus d'un mois, mais puisqu'il n'est pas résolu

  4. #4
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juillet 2013
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Juillet 2013
    Messages : 55
    Points : 65
    Points
    65
    Par défaut
    Merci de le remonter ...
    c'est à ce genre de truc que je pensais sauf que je ne savais pas du tout comment faire.
    J'ai téléchargé talend data integration. là j'essaie de voir comment ça se passe (je ne l'ai jamais utilisé).
    Vous pourriez me donnez des indications plus détaillées ?

  5. #5
    Membre actif
    Homme Profil pro
    Consultant BigData
    Inscrit en
    Juillet 2009
    Messages
    129
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Consultant BigData

    Informations forums :
    Inscription : Juillet 2009
    Messages : 129
    Points : 280
    Points
    280
    Par défaut
    Pour vulgariser l'utilisation que tu aurais de l'outil ici, tu utilises l'outil pour construire un flux d'intégration de tes données. Le flux est composé de composant reliés les uns aux autres. un composant peut avoir N entrées et M sorties (potentiellement 0).

    Tu as par exemple le composant ttwitterinput qui ne prendra pas d'entrée, mais plutôt de la configuration pour se connecter à twitter, et crachera en sortie des lignes correspondant à des nouveaux twitt.
    Tu enchaînerais ensuite avec une série de composant pour traiter tes données (dans un premier temps, tu peux utiliser le tlogrow pour afficher la sortie de ton composant twitter sur la console).
    Enfin, tu terminerais le flux par un composant tMongoDBOutput qui alimenterais ta base de données.

  6. #6
    Membre du Club
    Homme Profil pro
    Consultant en technologies
    Inscrit en
    Février 2015
    Messages
    26
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : Roumanie

    Informations professionnelles :
    Activité : Consultant en technologies
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Février 2015
    Messages : 26
    Points : 42
    Points
    42
    Par défaut
    Bonjour,

    Si tu vas sur https://twitter.com/settings/account tu pourras exporter tes donnees Twitter, qui incluent un fichier .csv avec tous tes tweets. Sinon, comme le disaient les autres, tu peux toujours utiliser leur API.

  7. #7
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Salut,

    Avec Flume tu récupères les tweets au format JSON (ils serotn stockés sur HDFS), et ensuite avec Talend tu traites les données récupérées pour les insérer dans MongoDB.

Discussions similaires

  1. Réponses: 2
    Dernier message: 21/08/2014, 09h25
  2. Typage des données/manipulation des données
    Par Moravski dans le forum GTK+ avec C & C++
    Réponses: 25
    Dernier message: 28/01/2011, 19h00
  3. [MySQL] Remplir un array() avec des données issues d'une bdd
    Par fichtre! dans le forum PHP & Base de données
    Réponses: 2
    Dernier message: 18/12/2006, 17h03
  4. Réponses: 6
    Dernier message: 11/07/2006, 10h56
  5. [DTS] Import de données avec des doublons
    Par Hotchotte dans le forum MS SQL Server
    Réponses: 5
    Dernier message: 24/03/2005, 14h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo