IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

 SGBD Discussion :

Choix de la BDD pour un service RESTFul ?


Sujet :

SGBD

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    624
    Détails du profil
    Informations personnelles :
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Mars 2005
    Messages : 624
    Points : 199
    Points
    199
    Par défaut Choix de la BDD pour un service RESTFul ?
    Bonjour à tous,

    Je dois débuter un projet dans lequel on me fournit des données XML afin de pouvoir les interroger via le Web avec un Service RESTFul avec des requêtes booléennes du genre TI=((airplane and waepon) or car).

    Je dois reproduire le service http://ops.epo.org/rest-services qui héberge des données brevets. En fait nous comptons acquérir les données DocDB14.7 pour éviter de se connecter continuellement sur leur service et être ainsi indépendant.

    Un jeu de données test est fourni sur le lien dans la section download: http://www.epo.org/searching/subscri...duct-14-7.html

    Je sais qu'ils utilisent Linux+Apache+JBossWeb

    J'ai donc pour mes tests un serveur Linux Ubuntu+Apache + le jeu de données mais voilà à ce niveau là je sèche car totalement novice dans le domaine des Bdd et Java.

    Ma première question est donc: Quelle BDD ?

    Il y aura env. 40Go de données + 50 Mo chaque année suivante
    Pour environ 1000 utilisateurs sur un an. Je ne connais pas la fréquence d'interrogation.

    Est-ce que quelqu'un peut me conseiller, m'aider à arriver à interroger mes données via le WEB?

    D'avance merci pour vos conseils,
    Amicalement,
    Bruno

  2. #2
    Expert éminent
    Avatar de StringBuilder
    Homme Profil pro
    Chef de projets
    Inscrit en
    Février 2010
    Messages
    4 148
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Chef de projets
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2010
    Messages : 4 148
    Points : 7 392
    Points
    7 392
    Billets dans le blog
    1
    Par défaut
    Vu la volumétrie, n'importe quelle base fera l'affaire, dans la mesure où tu as très peu d'accès concurrentiels (1000 connexions par an, c'est très léger).

    Il faut donc te concentrer sur les fonctionnalités du moteur.

    Donc exemple n'est pas très clair "IT=((airplane and weapon) or car)"
    => Ca veut dire que le champ "it" doit être égal à airplane et weapon ou car ?

    En effet, si tu as besoin par exemple de faire des recherches fulltext, tu devras t'orienter vers un moteur qui les gère.

    En tout cas, sans trop prendre de risque, tu dois pouvoir prendre PostGreSQL ou MySQL. Oracle XE peut être intéressant si vous avez déjà du Oracle dans votre parc. En tout cas, la même règle d'or s'applique que d'habitude : quel SGBD utilisez-vous actuellement pour les autres outils ? S'il convient, alors il est tout désigné : cela permettra de mutualiser les compétences, et éventuellement les licences/serveurs
    On ne jouit bien que de ce qu’on partage.

  3. #3
    Membre habitué
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    624
    Détails du profil
    Informations personnelles :
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Mars 2005
    Messages : 624
    Points : 199
    Points
    199
    Par défaut
    Bonjour et merci pour ta réponse,

    Vu la volumétrie, n'importe quelle base fera l'affaire, dans la mesure où tu as très peu d'accès concurrentiels (1000 connexions par an, c'est très léger).
    petite information supplémentaire, je dirai 30 à 50 consultations par jour pour les jours de "grande affluence"

    Il faut donc te concentrer sur les fonctionnalités du moteur.

    Donc exemple n'est pas très clair "IT=((airplane and weapon) or car)"
    => Ca veut dire que le champ "it" doit être égal à airplane et weapon ou car ?
    Oui c'est exactement ça IT étant le champ "Internal Title". Il y a dans les fichiers XML bien sûr beaucoup d'autres "champs", comme par exemple PD pour "publication date", ou CC pour "Country Code", etc...

    En effet, si tu as besoin par exemple de faire des recherches fulltext, tu devras t'orienter vers un moteur qui les gère.
    Ce n'est pas le taf de JBoss Web et des "truc" en Java que l'on doit développer?

    En tout cas, sans trop prendre de risque, tu dois pouvoir prendre PostGreSQL ou MySQL.
    MySQL sait gérer des volumes de 50Go ? et du fichier XML ?

    Oracle XE peut être intéressant si vous avez déjà du Oracle dans votre parc.
    Non, pas d'Oracle, et en plus ça coute un bras non Oracle ?

    En tout cas, la même règle d'or s'applique que d'habitude : quel SGBD utilisez-vous actuellement pour les autres outils ? S'il convient, alors il est tout désigné : cela permettra de mutualiser les compétences, et éventuellement les licences/serveurs
    Aucun SGBD chez nous, première fois qu'on en a l'utilité d'où mon incompétence et personne chez nous qui sait faire...

  4. #4
    Expert éminent
    Avatar de StringBuilder
    Homme Profil pro
    Chef de projets
    Inscrit en
    Février 2010
    Messages
    4 148
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Chef de projets
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2010
    Messages : 4 148
    Points : 7 392
    Points
    7 392
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Bruno13 Voir le message
    Bonjour et merci pour ta réponse,
    De rien, on est là pour ça

    Citation Envoyé par Bruno13 Voir le message
    petite information supplémentaire, je dirai 30 à 50 consultations par jour pour les jours de "grande affluence"
    C'est bien ce que je dis. Avec 30 à 50 consultations par seconde, là tu pourrais commencer à te poser la question du moteur de base de données et de la montée en charge. Mais là, même avec un bête fichier plat que tu parserais comme un porc dans un script shell, ça poserait pas de problème de performances.

    Citation Envoyé par Bruno13 Voir le message
    Oui c'est exactement ça IT étant le champ "Internal Title". Il y a dans les fichiers XML bien sûr beaucoup d'autres "champs", comme par exemple PD pour "publication date", ou CC pour "Country Code", etc...
    Ca semble donc pouvoir se traduire facilement en langage SQL.
    Eventuellement, si un SGBD supporte le language que tu cites, ça t'éviteras de traduire le message. Mais bon, autant rester standard et convertir la requête en SQL. Donc je confirme, n'importe quel SGBD fera l'affaire.

    Citation Envoyé par Bruno13 Voir le message
    Ce n'est pas le taf de JBoss Web et des "truc" en Java que l'on doit développer?
    Non, ton webservice devra traduire la requête passée en paramètre pour interroger la base de données. Les recherches fulltext se font directement par le moteur de la base de données. Mais dans ton cas précis, je ne suis pas certain que ça te soit utile. Pour rappel, fulltext permet de faire des recherches dans du contenu kilométrique avec une méthode "à la google" : recherche des occurences dans le champ lexical, etc.

    Citation Envoyé par Bruno13 Voir le message
    MySQL sait gérer des volumes de 50Go ? et du fichier XML ?
    Normalement, oui. Cependant, MySQL n'est pas forcément le meilleur choix. PostGreSQL me semble plus judicieux, car plus standard, et réellement GNU.

    Citation Envoyé par Bruno13 Voir le message
    Non, pas d'Oracle, et en plus ça coute un bras non Oracle ?
    Pas Oracle XE, qui est gratuit. En revanche, je crois que c'est limité en taille, et c'est moins de 50 Go (t'es sûr des 50 Go ?)

    Citation Envoyé par Bruno13 Voir le message
    Aucun SGBD chez nous, première fois qu'on en a l'utilité d'où mon incompétence et personne chez nous qui sait faire...
    Donc vous êtes libres. PostGreSQL me semble judicieux. Sous Windows, je t'aurais conseillé SQL Server (mais à nouveau, les versions Express ne supportent pas 50 Go).
    PS : J'insiste quand même... C'est bien 50 Go ?
    A raison d'une croisssance de 50 Mo par an, ça veut dire que pour arriver à 50 Go, on a historisé des brevets pendant 1000 ans ? (??????)
    On ne jouit bien que de ce qu’on partage.

  5. #5
    Membre habitué
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    624
    Détails du profil
    Informations personnelles :
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Mars 2005
    Messages : 624
    Points : 199
    Points
    199
    Par défaut
    Salut et merci encore pour tes réponses,

    C'est bien 50Go mais depuis mon dernier mail les infos ont changé sur leur site internet:

    Frontfile: approx. 1 GByte
    Backfile: approx. 53 GBytes
    Voici le lien où il y a un exemple de XML:
    http://www.epo.org/searching/subscri...duct-14-7.html

    Un responsable technique de chez eux vient de m'appeler, c'est cool car je vais pouvoir avoir des infos plus précise sur ce qu'ils ont...ou peut être pas...

    Je vous tiendrais informé.

  6. #6
    Membre habitué
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    624
    Détails du profil
    Informations personnelles :
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Mars 2005
    Messages : 624
    Points : 199
    Points
    199
    Par défaut
    Pour clôturer ce post voici la solution que j'ai choisi et qui est vraiment très performante: Solr.

    Amicalement,
    Bruno

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Débat pour l'utilisation d'un service ReST
    Par wonderyan dans le forum Services Web
    Réponses: 1
    Dernier message: 29/03/2011, 09h46
  2. Mock services pour simuler WS REST
    Par yanis97 dans le forum Langage
    Réponses: 0
    Dernier message: 11/01/2011, 09h20
  3. Choix d'un CRM pour un prestataire de services
    Par stanley dans le forum CRM
    Réponses: 8
    Dernier message: 09/09/2010, 18h06
  4. Réponses: 2
    Dernier message: 04/10/2009, 13h02
  5. Choix d'un langage pour application avec bdd mysql
    Par tonio-lille dans le forum Windows
    Réponses: 5
    Dernier message: 09/11/2006, 17h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo