Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > Autres
Autres Autres logiciels d'informatique décisionnelle, de statistiques, générateurs d’états ou outils infocentre : EpiInfo, FreeReport, FastReport, Hyperion, JPivot, QuickReport, Mondrian, ReportBuilder, Stata, Spad, Spss, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 22/03/2008, 21h15   #1
Membre éprouvé
 
Avatar de rvfranck
 
Étudiant
Inscription : novembre 2004
Messages : 739
Détails du profil
Informations personnelles :
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : novembre 2004
Messages : 739
Points : 494
Points : 494
Par défaut préparation des données avec weka

Salut,

J'ai un fichier cvs qui contient des informations que je devrais utiliser pour une etude de data mining. les informations en question ont une structure "bizarre" et j'aimerai savoir si weka peut m'aider à faire le pré-traitement. voici un exemple:
Citation:
ligne 1: P01, nom, age, sexe
ligne 2: P01, taille, poids
ligne 3: P01, nationalité
ligne 4: P02, nom, age, sexe
ligne 5: P02, taille, poids
Je me demandais si weka pouvait traiter un fichier structuré ainsi (ce qui m'étonnerait). Sinon est ce que je pourrai utiliser weka pour ramener par exemple les informations sur une ligne:
Citation:
P01, nom, age, sexe, taille, poids, nationalité
Merci
__________________
"Celui qui reconnaît consciemment ses limites est le plus proche de la perfection." Johann Wolfgang
rvfranck est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/03/2008, 23h03   #2
Rédacteur/Modérateur
 
Avatar de JauB
 
Homme Faisel
Ingénieur COBOL/AS400
Inscription : octobre 2005
Messages : 1 713
Détails du profil
Informations personnelles :
Nom : Homme Faisel
Âge : 31
Localisation : Maroc

Informations professionnelles :
Activité : Ingénieur COBOL/AS400
Secteur : Finance

Informations forums :
Inscription : octobre 2005
Messages : 1 713
Points : 2 712
Points : 2 712
Envoyer un message via AIM à JauB Envoyer un message via MSN à JauB Envoyer un message via Yahoo à JauB
à ma connaissance WEKA ne peut traiter un fichier CSV que s'il est du format suivant :

ligne1: AGE,SEXE,...
ligne2: 23,M,........
ligne3: 25,F,......

Pourquoi t'as besoin d'une autre structure que celle que je viens de citer!?
comme ça c'est lisible et comprhénsible non?
__________________
*** Ingénieur COBOL/AS400 ***

-------------------------------------------------------------------

Mes articles, Mon Blog

Rubrique Jasper/iReport :
------- Forum Jasper --------
----- FAQ Jasper/iReport -----

JauB est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 00h05   #3
Membre éprouvé
 
Avatar de rvfranck
 
Étudiant
Inscription : novembre 2004
Messages : 739
Détails du profil
Informations personnelles :
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : novembre 2004
Messages : 739
Points : 494
Points : 494
mon fichier cvs a cette structure:
Citation:
identifiant, attribut1, attribut2
le problème c'est que les attributs d'un identifiant peuvent être sur plusieurs lignes:
Citation:
P01, nom, age, sexe
P01, taille, poids
P01, nationalité
Dans l'exemple ci dessus, les attributs (nom, age, sexe, taille, poids et nationalité) de P01 ne sont pas tous sur une même ligne. Ma question est est ce que weka pourrait les mettres sur une même ligne si je lui soumettais le fichier tel quel?

Merci
__________________
"Celui qui reconnaît consciemment ses limites est le plus proche de la perfection." Johann Wolfgang
rvfranck est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 02h52   #4
Membre chevronné
 
Avatar de Jester
 
Inscription : septembre 2003
Messages : 625
Détails du profil
Informations forums :
Inscription : septembre 2003
Messages : 625
Points : 634
Points : 634
Non weka n'arrivera même pas à lire un tel fichier CVS, le format interne de représentation ne le permet pas. Mais c'est l'histoire d'un petit script à faire pour modifier le format du fichier.
Jester est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 05h26   #5
Membre éprouvé
 
Avatar de rvfranck
 
Étudiant
Inscription : novembre 2004
Messages : 739
Détails du profil
Informations personnelles :
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : novembre 2004
Messages : 739
Points : 494
Points : 494
Merci,
C'était juste pour eviter de faire quelque chose que weka me permettrait de faire.
__________________
"Celui qui reconnaît consciemment ses limites est le plus proche de la perfection." Johann Wolfgang
rvfranck est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 12h33   #6
Rédacteur/Modérateur
 
Avatar de JauB
 
Homme Faisel
Ingénieur COBOL/AS400
Inscription : octobre 2005
Messages : 1 713
Détails du profil
Informations personnelles :
Nom : Homme Faisel
Âge : 31
Localisation : Maroc

Informations professionnelles :
Activité : Ingénieur COBOL/AS400
Secteur : Finance

Informations forums :
Inscription : octobre 2005
Messages : 1 713
Points : 2 712
Points : 2 712
Envoyer un message via AIM à JauB Envoyer un message via MSN à JauB Envoyer un message via Yahoo à JauB
beh tu vois ?
sinon dis nous comment t'as eu ce fichier?tu l'as extrait à partir d'une base de données toi même ou qu'on te l'a donné tel que tu nous le montres?
sinon jette un oeuil sur mon article que je suis entrain de rédiger:
article sur weka.

il n'est pas encore finalisé, mais j'y travaille en ces moments. il te donnera une idée sur le comment des choses
Bon courage
__________________
*** Ingénieur COBOL/AS400 ***

-------------------------------------------------------------------

Mes articles, Mon Blog

Rubrique Jasper/iReport :
------- Forum Jasper --------
----- FAQ Jasper/iReport -----

JauB est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 13h41   #7
Membre éprouvé
 
Avatar de rvfranck
 
Étudiant
Inscription : novembre 2004
Messages : 739
Détails du profil
Informations personnelles :
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : novembre 2004
Messages : 739
Points : 494
Points : 494
Merci,

je viens d'imprimer ton article pour le lire. Au sujet des données, on me les a donné comme ça et je dois appliquer un algo de clustering dessus.

Je viens de faire un script en pl/sql et le problème est règlé. Maintenant je vais m'attaquer à weka.

a+++++++++
__________________
"Celui qui reconnaît consciemment ses limites est le plus proche de la perfection." Johann Wolfgang
rvfranck est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 16h12   #8
Rédacteur/Modérateur
 
Avatar de JauB
 
Homme Faisel
Ingénieur COBOL/AS400
Inscription : octobre 2005
Messages : 1 713
Détails du profil
Informations personnelles :
Nom : Homme Faisel
Âge : 31
Localisation : Maroc

Informations professionnelles :
Activité : Ingénieur COBOL/AS400
Secteur : Finance

Informations forums :
Inscription : octobre 2005
Messages : 1 713
Points : 2 712
Points : 2 712
Envoyer un message via AIM à JauB Envoyer un message via MSN à JauB Envoyer un message via Yahoo à JauB
si c'est bon alors n'oublie pas le
__________________
*** Ingénieur COBOL/AS400 ***

-------------------------------------------------------------------

Mes articles, Mon Blog

Rubrique Jasper/iReport :
------- Forum Jasper --------
----- FAQ Jasper/iReport -----

JauB est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2008, 17h06   #9
Membre éprouvé
 
Avatar de rvfranck
 
Étudiant
Inscription : novembre 2004
Messages : 739
Détails du profil
Informations personnelles :
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : novembre 2004
Messages : 739
Points : 494
Points : 494
Salut JauB,
J'ai activé le depuis la reponse de Jester.
a+++++++
__________________
"Celui qui reconnaît consciemment ses limites est le plus proche de la perfection." Johann Wolfgang
rvfranck est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 22h58.


 
 
 
 
Partenaires

Hébergement Web