Précédent   Forum du club des développeurs et IT Pro > Bases de données > PostgreSQL
PostgreSQL Forum PostgreSQL. Avant de poster -> F.A.Q PostGreSQL Tutoriels PostGreSQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 15/02/2013, 17h03   #1
archer
Membre habitué
 
Avatar de archer
 
kim archer
Ingénieur développement logiciels
Inscription : mai 2007
Messages : 336
Détails du profil
Informations personnelles :
Nom : kim archer

Informations professionnelles :
Activité : Ingénieur développement logiciels
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : mai 2007
Messages : 336
Points : 141
Points : 141
Par défaut Dimensionnement d'une base de données de très grande taille

Bonjour,

Je trouve des difficulté pour monter une configuration en terme de matériel et logiciel pour une base de données dans laquelle on va stocker des fichiers à raison de 100 Go par jour sur une durée de 5 ans, ce qui fait un peu près 180 To.
A vrai dire j'ai aucune idée sur la configuration nécessaire pour Postegresql afin de stocker toute cette capacité. Donc je vous demande si vous avez une idée de la partager avec moi.
J'ai entendu dire que Wikipédia utilise aussi Postgresql, mais j'ai pas trouvé comment ils font.

Merci d'avance
__________________
rien pour l'instant
archer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/02/2013, 16h54   #2
Waldar
Modérateur
 
Homme Fabien
Ingénieur d'études en décisionnel
Inscription : septembre 2008
Messages : 6 276
Détails du profil
Informations personnelles :
Nom : Homme Fabien
Âge : 35
Localisation : France, Essonne (Île de France)

Informations professionnelles :
Activité : Ingénieur d'études en décisionnel
Secteur : High Tech - Multimédia et Internet

Informations forums :
Inscription : septembre 2008
Messages : 6 276
Points : 13 568
Points : 13 568
Envoyer un message via ICQ à Waldar Envoyer un message via Skype™ à Waldar
http://www.greenplum.com/products/greenplum-dca

En compressant vos données avec deux DCA full rack vous allez vous en sortir.

Bon, vous en aurez pour un à deux millions d'euros par contre.
__________________
Email : http://scr.im/waldar
Waldar est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/02/2013, 14h16   #3
archer
Membre habitué
 
Avatar de archer
 
kim archer
Ingénieur développement logiciels
Inscription : mai 2007
Messages : 336
Détails du profil
Informations personnelles :
Nom : kim archer

Informations professionnelles :
Activité : Ingénieur développement logiciels
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : mai 2007
Messages : 336
Points : 141
Points : 141
ça tombe très chère une solution pareille.
Je me demande s'il vaut mieux utiliser des système de fichiers distribués comme Hadoop?
__________________
rien pour l'instant
archer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/02/2013, 15h54   #4
estofilo
Modérateur
 
Inscription : octobre 2008
Messages : 1 702
Détails du profil
Informations personnelles :
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : octobre 2008
Messages : 1 702
Points : 2 347
Points : 2 347
Wikipedia n'utilise pas PostgreSQL.
Il y a une déclinaison du programme Wikimedia qui peut tourner avec une base postgres en remplacement de mysql, mais ça n'a rien à voir avec un usage de masse.

Un exemple de gros service qui utilise postgres est Instagram. Ils donnent quelques infos sur leur plateforme dans un blog: http://instagram-engineering.tumblr.com/

Mais s'il s'agit juste de stocker des fichiers, il faut un système de fichiers distribués et non une base de données.
estofilo est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/02/2013, 12h17   #5
archer
Membre habitué
 
Avatar de archer
 
kim archer
Ingénieur développement logiciels
Inscription : mai 2007
Messages : 336
Détails du profil
Informations personnelles :
Nom : kim archer

Informations professionnelles :
Activité : Ingénieur développement logiciels
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : mai 2007
Messages : 336
Points : 141
Points : 141
Oui, en effet, j'ai trouvé un système de fichier open source Hadoop. Mais le matériel coûte très cher.
Je crois qu'il vaut mieux coupler un système de fichier avec une solution d'archivage par bande magnétique pour les données qui dépassent un an d’ancienneté.
__________________
rien pour l'instant
archer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/02/2013, 21h14   #6
el_muchacho
Nouveau Membre du Club
 
Homme
Inscription : février 2013
Messages : 23
Détails du profil
Informations personnelles :
Sexe : Homme

Informations forums :
Inscription : février 2013
Messages : 23
Points : 29
Points : 29
Citation:
Envoyé par archer Voir le message
Oui, en effet, j'ai trouvé un système de fichier open source Hadoop. Mais le matériel coûte très cher.
Je crois qu'il vaut mieux coupler un système de fichier avec une solution d'archivage par bande magnétique pour les données qui dépassent un an d’ancienneté.
Pour de telles masses de données, il n'y a en effet que les systèmes distribués comme Hadoop/HBase et Cassandra. Sinon ce sont des systèmes commerciaux extrêmement coûteux. Maintenant, si vous pouvez archiver les données, c'est en effet la meilleure solution.
el_muchacho est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 06h53.


 
 
 
 
Partenaires

Hébergement Web