Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > Conception/Modélisation Décisionnelle
Conception/Modélisation Décisionnelle Forum d'entraide sur la conception de datawarehouse, datamarts et la modélisation décisionnelle : Tables de faits et de dimension, Modèles en étoile ou en flocons, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 02/01/2011, 10h29   #1
Invité régulier
 
Inscription : mai 2009
Messages : 36
Détails du profil
Informations forums :
Inscription : mai 2009
Messages : 36
Points : 9
Points : 9
Par défaut datamining, par où commencer ?

bonjour,
Je dois commancer un sujet dataminig sur l'analyse du comportement du consomateur dans les grandes surfaces, et a vrai dire je ne sais pas pa ou commancer?

il me faut la base de donnée ou au moin son shéma??? et je ne sais pas d'ou la procurer, s'il vous plais est ce que vous avez des liens d'ou je vais telechargerles donnée?

Aussi, je ne sais pas quoi traiter pour se sujet est ce que vous pouvez m'expliquer, Merci de votre aide
cendrine15 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2011, 22h21   #2
Membre Expert
 
Avatar de nuke_y
 
Inscription : mai 2004
Messages : 1 812
Détails du profil
Informations forums :
Inscription : mai 2004
Messages : 1 812
Points : 1 609
Points : 1 609
Bonjour.

Ca n'a rien à voir mais attention à l'orthographe.

Bon, sinon, sur votre problématique: le datamining consiste à "fouiller" des données pour trouver des choses qui ne s'y trouvaient pas à priori. Cad qu'on va utiliser les données présentes, qui servent à quelque chose de précis, pour découvrir de nouvelles informations.

Dans votre cas, la grande distribution, vous avez comme données 2 grands groupes :
- les clients, identifiés d'une certaine façon. Le plus simple est de ne considérer que ceux qui ont une carte de fidélité, avec leur nom, prénom, âge, etc. mais on pourrait aussi considérer que 2 achats faits avec la même carte de crédit correspondent à un même client.
- les achats, sous forme d'une liste d'articles avec la quantité, le prix, et la date d'achat, et évidemment l'identifiant du client qui a fait ces achats.

Donc vous avez 3 tables (ou plus, ou moins, c'est selon):
Code :
1
2
3
CLIENT (CLI_ID, CLI_NOM, CLI_PRENOM, CLI_AGE) la clé primaire est CLI_ID
VENTE (VNT_ID, VNT_DATE, CLI_ID) la clé primaire est VNT_ID mais il doit exister une clé fonctionnelle définie par VNT_DATE, CLI_ID
VENTE_ARTICLE (VAT_ID, VNT_ID, VNT_ARTICLE, VNT_QUANTITE) la clé primaire est VAT_ID mais il doit exister une clé fonctionnelle définie par VNT_ID, VNT_ARTICLE
Vous remplissez ces 2 tables avec des données que vous fabriquez vous-mêmes (cf le script que j'ai donné ici) et ensuite vous appliquez les règles de datamining qu'on a du vous apprendre dans votre formation, vu que je ne pense pas qu'il s'agisse d'un projet professionnel.
__________________
Il vaut mieux monopoliser son intelligence sur des bêtises que sa bêtise sur des choses intelligentes.

Mon combat pour les droits des consommateurs face aux abus des grandes marques.
nuke_y est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/01/2011, 21h42   #3
Membre chevronné
 
Avatar de Jester
 
Inscription : septembre 2003
Messages : 623
Détails du profil
Informations forums :
Inscription : septembre 2003
Messages : 623
Points : 632
Points : 632
1 - Ce n'est pas très ciblée comme question. Le data mining c'est large.

2 - difficile d'avoir ce genre de données. Il me semble que l'installation de Mondrian fourni un tel jeu de données.

3 - j'avais un toy exemple slide 18 à 20 de https://docs.google.com/present/view...dq_108cn8zz7gx

4 - le jeu de données Netflix s'il est encore en ligne, mais trop gros pour débuter.
Jester est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 14h37.


 
 
 
 
Partenaires

Hébergement Web