IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

informations sur DATA MINING


Sujet :

Statistiques, Data Mining et Data Science

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Rédacteur
    Avatar de JauB
    Homme Profil pro
    Freelancer
    Inscrit en
    Octobre 2005
    Messages
    1 792
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Maroc

    Informations professionnelles :
    Activité : Freelancer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 792
    Par défaut informations sur DATA MINING
    Bonsoir tout le monde,
    je suis à la recherche d'un document sur le data mining ciblant la définition du data mining avec des exemples, les pré-requis techniques et les pré-requis en terme de base de données, autrement dit une personne ayant à faire du data mining qu'est ce qu'il doit avoir comme architecture technique pour aborder le sujet DATA MINING?
    j'ai fait des recherches sur le web mais les informations sont tellement éparpiées que je ne suis pas arriver à m'y retrouver.
    merci d'avance
    Mes articles, Mon Blog

    Rubrique Jasper/iReport :
    ------- Forum Jasper --------
    ----- FAQ Jasper/iReport -----


  2. #2
    Membre confirmé
    Inscrit en
    Février 2006
    Messages
    158
    Détails du profil
    Informations forums :
    Inscription : Février 2006
    Messages : 158
    Par défaut
    Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart.
    Certains considèrent cette technique comme "l'art" voire même la "science" de l'extraction d'informations significatives de grandes quantités de données.
    En peu de mots, le Data Mining présente l'avantage de trouver des corrélations informelles entre les données.
    Il permet de mieux comprendre les liens entre des phénomènes en apparence distincts et d'anticiper des tendances encore peu discernables.
    Bonne journée
    voir mon blog et liens qui regroupent les infos

    http://noel-bi.blogspot.com/

  3. #3
    Rédacteur
    Avatar de JauB
    Homme Profil pro
    Freelancer
    Inscrit en
    Octobre 2005
    Messages
    1 792
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Maroc

    Informations professionnelles :
    Activité : Freelancer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 792
    Par défaut
    j'ai jetté un oeuil sur ton blog mais apparemment il n'y a pas d'infos sur le data mining, non?
    sinon pour mettre en oeuvre un tel projet faut il avoir une ou des machines spéciales ou un simple serveur?
    dois-je obligatoirement passer par un datawarehouse ou peux-je utiliser ma base de production directement?
    enfin j'ai plusieurs questions sur le sujet, je les poserai a fure et à mesure.
    le lien http://www.piloter.org/business-inte...datamining.htm n'est pas très explicatif...
    m'ci
    Mes articles, Mon Blog

    Rubrique Jasper/iReport :
    ------- Forum Jasper --------
    ----- FAQ Jasper/iReport -----


  4. #4
    Membre émérite
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    500
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Juillet 2007
    Messages : 500
    Par défaut
    Attention, ceci est une définition perso :

    Le Datamining est un anglicisme pompeux de plus qui désigne les outils de requêtage graphique (souvent foireux) et le fait de les utiliser en ayant l'impression (fausse évidemment) de maîtriser la bête alors qu'on ne connaît pas le SQL.

    En ce sens, un utilisateur comme pnoel-bi semble s'inscrire complètement dans le moule : en 5 lignes, il a casé "Data Mining", "Data Warehouse", "Data Mart", "décisionnelle", "corrélations informelles", ... mais même en lisant 3 fois, le novice n'est pas plus avancé (voire encore plus perdu) car ces belles phrases sont creuses.
    pnoel-bi, je n'en fais pas une attaque perso, mais j'ai horreur des gens qui font du vent et qui arrivent à le vendre grâce à l'incompétence de nombreux responsables informatiques côté client. Un simple coup d'oeil sur ton blog, à lire à chaque ligne l'autosatisfaction puante quand tu te présentes et on a compris (commercial avant d'être bon technicien...)

    Apprenez le SQL, et vous ferez du Data Mining dans un Data Warehouse ou un Data Mart sans même vous en apercevoir !

  5. #5
    Membre confirmé
    Inscrit en
    Février 2006
    Messages
    158
    Détails du profil
    Informations forums :
    Inscription : Février 2006
    Messages : 158
    Par défaut
    Jaub si tu-as des questions pas de problème mais mieux vaut passer par une autre voie
    Désolé tu as posé une question trop générale.

  6. #6
    Membre Expert Avatar de nuke_y
    Profil pro
    Indépendant en analyse de données
    Inscrit en
    Mai 2004
    Messages
    2 076
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Indépendant en analyse de données

    Informations forums :
    Inscription : Mai 2004
    Messages : 2 076
    Par défaut
    >dgi77 : attention aux termes que tu utilises dans tes réponses, particulièrement quand tu t'en prends de manière personnelle aux membres, et encore plus à des membres débutants sur le forum, qui ne sont peut-être pas des débutants dans leur vie professionnelle.

    Sinon je trouve la réponse de pnoel-bi plutôt satisfaisante. Il répond, en donnant SON avis, à :

    qu'est-ce que le DATA MINING ?
    l'avantage de trouver des corrélations informelles entre les données.
    Il permet de mieux comprendre les liens entre des phénomènes en apparence distincts et d'anticiper des tendances encore peu discernables.
    une personne ayant à faire du data mining qu'est ce qu'il doit avoir comme architecture technique pour aborder le sujet DATA MINING?
    une base décisionnelle
    Et donne aussi plusieurs mots techniques (Datawarehouse, datamart) qui permettront à JauB de retrouver sur Internet plus d'informations sur le sujet.


    Pour aller plus loin JauB, je dirais que le data mining c'est juste la recherche d'informations cachées dans des données. On "creuse" pour trouver des informations qui sont dans les données mais qui ne sont pas évidentes. Du genre "ah le client a acheté des tampons et du rouge à lèvres donc c'est probablement une femme (à 95% de fiabilité). Et comme on a son numéro de carte fidélité, on peut dire à 95% que ce client est une femme et donc on peut lui adresser des offres promotionnelles pour femmes". Evidemment ce genre de "déductions" est inutile si à la souscription de sa carte fidélité le client a précisé son sexe.

    Ce qui est important à comprendre, et c'est sûrement la raison pour laquelle dgi77 s'est énervé inutilement, c'est que le data mining on en fait tous les jours, parfois même sans ordinateur. Le moindre film policier c'est du data mining, on analyse, on imagine, on fait des corrélations. Pas besoin de bases décisionnelles, de gros serveurs, de Business Objects, etc. Un simple fichier Excel dans lequel on colle le résultat d'une requête SQL sur le serveur de production et on peut démarrer l'analyse.

    Après les besoins en terme de volume et de performance peuvent être tels que
    1) le responsable des bases de production t'interdit de requêter sur la base de production
    2) tu as trop de lignes pour tenir sur Excel / Acces
    3) tu as trop de temps de calcul pour Excel / Access
    et dans ce cas tu mets en place une architecture décisionnelle. Cette architecture sera soit une simple copie de la base de production (rafraichie régulièrement) soit une base spécialement designée pour faciliter l'analyse et donc sera différente de celle de production. Ce qui énerve les DBA dans le decisionnel (et c'est sûrement le cas de dgi77) c'est que
    1) les bases décisionnelles ne ressemblent pas aux bases de production et souvent ne respectent pas les formes normales (on appelle ça "dénormaliser")
    2) un utilisateur basique qui ne connaît RIEN au SQL est capable d'obtenir de bons résultats en requêtage grâce à des outils tels que Business Objets qui construisent des requêtes juste avec des clics de souris, shuntant le DBA qui avant était le seul à savoir faire les extractions
    3) ces fameuses requêtes d'extractions sont souvent moins optimisées que celles écrites par les DBA, ce qui peut augmenter la charge sur le serveur, et c'est pour ça qu'on évite de faire du data mining sur un serveur de production
    4) c'est "de la bidouille"

    Donc pour ta demande initiale, je dirais que ton cerveau est l'outil minimal pour faire du data mining. Tout outil supplémentaire doit être justifié par des contraintes de :
    - temps d'analyse
    - volume de données à analyser
    - présentation des résultats

Discussions similaires

  1. recherche information sur BIG DATA 'SAFE'
    Par pcouas dans le forum Big Data
    Réponses: 3
    Dernier message: 27/04/2014, 18h41
  2. Réponses: 0
    Dernier message: 21/01/2013, 11h32
  3. Question sur data mining
    Par essadiki_ista dans le forum Statistiques, Data Mining et Data Science
    Réponses: 3
    Dernier message: 06/07/2012, 10h29
  4. Réponses: 10
    Dernier message: 05/06/2012, 21h50
  5. Réponses: 0
    Dernier message: 03/03/2010, 11h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo