Bonjour,
J'ai un petit probleme. Je recois des document dans lesquelle je dois parser et extraire des données puis renger dans une table article.
Le texte sera du genre:
prix : 22990 €
marque VOLVO
modèle C30
version D2 115ch r-design
année 2011
mois septembre
Le probleme c'est que l'article peut etre n'importe quoi d'autre, donc des fois pas de prix ou pas d'annee. Avec le nombre de ligne qui varient. Un document ne contient qu'un seul article.
J'ai une donc table document et une table attribut en gros :
clé primaire en gras
[doc]
doc_id
doc_text
...
[attribut]
attribut_id
attribut_libelle
attribut_valeur
attribut_doc_id
Donc j'aurais par exemple
[doc]
1:vouture.txt
2:multimedia.txt
[attribut]
1:prix:22990:1
2:marque:volvo:1
3:model:c30:1
---
1:couleur:bleue:2
2:capacite:32Go:2
3:prix:22:2
Voila, le probleme c'est pour le format des donées. En effet je sais pas a l'avance ce qu'il y aura dans le fichier. Et mettre tout en charactere varying c'est pas terrible, et moins efficace en cas de recherche.
une idée ?
Partager