IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

[BigData / DataScience] DataBurn


Sujet :

Big Data

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2014
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Seine Maritime (Haute Normandie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2014
    Messages : 1
    Points : 1
    Points
    1
    Par défaut [BigData / DataScience] DataBurn
    Bonjour,

    Je m'appelle Théo, je suis en 3ème année d'école ingénieur informatique. J'ai découvert l'univers du BigData il y à peu et j'ai tout de suite accroché.

    J'aimerais vous présenter une solution que je suis entrain de développer, DataBurn.
    L'objectif, personnel, principal de DataBurn est d'élargir mes compétences en BigData mais aussi en programmation.

    DataBurn, qu'est ce que c'est ?

    C'est un outil permettant à un utilisateur d'importer des datasets et de créer ses propres algorithmes. Les algorithmes créés sont inclus dans DataBurn via un fichier de configuration et peuvent être exécuter sur un ou N dataset(s) via une commande.

    DataBurn - DataBurnSet

    Lorsqu'un dataset est importé dans DataBurn, il devient un DataBurnSet (très original, n'est-ce pas ?).
    Composition d'un DataBurnSet :

    DataBurnSet -> contient N (!= 0) à N +1 colonnes
    Colonnes -> contient N à N +1 items

    DataBurn - Algorithmes

    Classe héritant de Algorithm avec override des methodes "Do" et "Done".
    Do : corps de l'algorithmes
    Done : affichage résultat, enregistrement (fichier, BDD, WS, ...)

    Le fichier classe de l'algorithmes est placé dans un dossier "Algorithmes" à la racine de l'executable DataBurnConsole.exe . Le fichier .cs est référencer dans un settings.json et est compilé JIT.

    DataBurn - Commandes

    - load : charge un dataset
    - exec resultat "algo1" "datasetName": execute un algorithme sur un dataset spécifié
    - save -option "datasetName" : sauvegarde le dataset via l'option spéficié (-f file -db database)
    - cut n "datasetName" : découpe le dataset en n part égales (créé dans datasetNameN")

    DataBurn - Source de données
    - Fichiers (csv, txt, xml, json)
    - Base de données : NoSQL, MongoDB, MySQL, MSSQL
    - APIs

    A vrai dire je ne sais pas si j'ai été clair sur ce "qu'est" vraiment DataBurn, j'ai un peu des difficulté a synthétiser mais bon

    Résumé :

    Je suis un utilisateur, j'ai un ou plusieurs datasets et j'aimerais travailler avec. J'utilise DataBurn, je les charges, je créé mes algorithmes sur mes datasets et j'execute. Je peux enregistrer les résultat, ou non.

    (Résumé vraiment vraiment simpliste).

    Du coup j'aimerais avoir vos avis sur ce type d'outil et sur DataBurn en particulier, est-ce vraiment bien que j'y passe du temps ou je fonce droit dans le mur ?
    A l'heure actuelle toutes les fonctionnalités citées ci-dessus ne sont pas fonctionnelles mais j'avance vraiment bien.
    De plus j'aimerai créé un nouveau composant qui permettrait d'avoir une représentation graphique d'un ou de plusieurs datasets.

    Merci d'avoir pris le temps de me lire.

    Q+


    PS : si vous êtes intéressez par le projet, commentez, et si vous voulez aller plus loin, n'hésitez pas a me MP

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Je ne suis pas sûre d'avoir compris complètement tous les tenants et aboutissants de votre projet, mais je trouve que c'est toujours bien d'essayer de faire un projet "concret" pour tester et améliorer ses compétences.

    Petite question par curiosité : en quoi votre solution est-elle programmée ?

    Bon courage pour la suite en tout cas !


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

Discussions similaires

  1. [BIGDATA] Failed to close file
    Par progscoubi dans le forum Développement de jobs
    Réponses: 4
    Dernier message: 19/11/2013, 20h05
  2. noSQL et BigData
    Par HoudaElm dans le forum NoSQL
    Réponses: 0
    Dernier message: 10/01/2013, 14h06
  3. BigData et Hadoop au secours de téraoctets de logs inexploitables
    Par Mickael Baron dans le forum Autres SGBD
    Réponses: 0
    Dernier message: 04/05/2012, 14h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo