|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Bonjour,
J'ai besoin d'évaluer les expressions régulières avec sparql en utilisant les property paths mais je n'arrive pas à trouver un triple store qui me permet de le faire, est ce qu'il y a la possibilité d'utiliser un triple store qui me permet de lui implémenter les property paths en utilisant Java. Merci d'avance pour votre aide. |
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
Bonjour
Jena et Sesame dans leurs dernières versions sont tous les deux compatibles avec SPARQL 1.1 et permettent d'utiliser les property paths, ainsi que les FILTER avec une regex. Est-ce ce que tu veux ? |
|
00
|
|
|
#3 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Bonjour,
merci pour votre réponse, est ce que je peux les utiliser avec dbpedia benchmark?? |
|
|
00
|
|
|
#4 |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
Bonjour
Tu veux parler du dataset ici : http://www4.wiwiss.fu-berlin.de/benc...00801/#dataset ? Il n'y a théoriquement pas de problème, mais potentiellement un blocage du fait du trop gros volume de données (15 millions de triples); tu risques de passer du temps à les charger, ou bien les requêtes peuvent mettre du temps à s'exécuter. Je ne sais pas si ca peut t'aider, mais tu peux regarder ce délivrable du projet de recherche Europeana qui compare les triplestores : http://eprints.cs.univie.ac.at/2833/..._ts_report.pdf (mais je ne crois pas que la compatibilité SPARQL 1.1 soit listée comme un critère). |
|
00
|
|
|
#5 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Bonjour,
je vous remercie encore pour votre aide, pour les données que je voulais chargé c'est ici http://aksw.org/Projects/DBPSB, je sais que ça prend des heures pour les charger mais j'ai besoin de tester mes requêtes sparql sur les données réelles de dbpedia. je vais installer sesame et voir ce que ça donne. |
|
|
00
|
|
|
#6 |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
OK, tu as vu les temps de chargement : "For loading dataset of size 100% into virtuoso it takes approx 10 Hrs, 8 Hrs for Jena TDB, 14 Hrs for Sesame, and 8 Hrs for Big OWLIM".
SI tu veux pas y passer des jours, il faut mieux choisir judicieusement dès le départ :-) et ne pas faire d'erreurs dans la config des triplestore; d'ailleurs bizarrement sur la page du benchmark rien ne précise la config hardware utilisée, ni la façon dont les triplestores sont configurés... curieux. Jena-TDB a l'air globalement meilleur que Sesame quand on regarde les temps sur le dataset 100%, pourquoi ne pas commencer par celui-là, avec le dataset 10% pour valider tes requêtes, et ensuite passer au dataset 100% ? |
|
00
|
|
|
#7 |
|
Membre confirmé
![]() Information InexacteFou d'avril Inscription : février 2012 Messages : 97 ![]() |
À noter qu'à la conférence WWW2012, il y a eu une présentation très intéressante d'un article au sujet des property paths de SPARQL 1.1. L'article a obtenu le Best Paper Award et disait en gros que la spécification des property paths est foireuse et que toute implémentation de la spéc est condamnée à être inefficace. Des discussions sont en cours pour réviser la définition, ce qui aura un impact sur toutes les implémentations. En attendant, on peut quand même tester la chose, c'est sensé fonctionner sur des cas simples.
|
|
00
|
|
|
#8 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
effectivement, j'ai lu ce papier il y a aussi un autre papier dans le même contexte:http://www.theoinf.uni-bayreuth.de/d...submission.pdf
je vais essayer avec jena comme vous avez dit avec 10% de données, mais le problème d'après ce que j'ai lu est que dbpedia benchmark ne supporte pas les property paths, donc ce que j'essaye de faire c'est de développer un programme en java qui le fait ensuite l'implémenter dans un triple store, je ne sais pas est ce que jena est bien pour ça car je ne connais pas comment il stocke les triplets. |
|
|
00
|
|
|
#9 |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
Le benchmark est un ensemble de données et un ensemble de requêtes executées sur ces données. Quand tu dis "le benchmark ne supporte pas les property path", cela veut surement dire "les requêtes du benchmark n'utilisent pas les property path" ? il faut donc que tu construises un autre jeu de requêtes qui utilise les property path.
|
|
10
|
|
|
#10 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
en réalité j'ai testé juste le dbpedia benchmark avec virtuoso et j'ai trouvé que les property paths ne marchent pas donc je vais réessayer avec jena.
|
|
|
00
|
|
|
#11 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Existe-il un guide d'installation bien expliqué pour installer jena car je ne comprend pas ce que veut il dire dans le readme file "To use Jena in your application, ensure all the .jar files in the lib/directory are on the classpath or available to your web application." dois-je créer un projet java et ajouter ces jar au libraries?
|
|
|
00
|
|
|
#12 | |
|
Membre du Club
![]() Étudiant Inscription : janvier 2012 Messages : 61 ![]() |
Citation:
si tu utilises Eclipse, je te conseille de voir ce lien http://www.iandickinson.me.uk/articl...se-helloworld/ bon chance et bon travail |
|
|
|
00
|
|
|
#13 |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
Contrairement à Virtuoso, Jena n'est qu'une bibliothèque d'API, avec laquelle tu vas devoir écrire un programme approprié. Ceci dit regarde du côté de Jena TDB qui possède un certains nombre d'utilitaires en ligne de commande : http://incubator.apache.org/jena/doc.../commands.html
Sesame par contre possède une interface web d'administration et permet de configurer un triplestore et de le charger à partir de l'interface. |
|
00
|
|
|
#14 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Bonjour,
Je vous remercie pour votre aide, j'ai finalement installé sesame mais je veux maintenant charger le dbpedia benchmark c'est un fichier .nt dans le triple store sesame mais je ne trouve pas comment le faire. |
|
|
00
|
|
|
#15 | |
|
Membre chevronné
![]() ![]() Thomas FrancartConsultant sémantique & data à sparna.fr Inscription : avril 2005 Messages : 191 ![]() |
Citation:
|
|
|
00
|
|
|
#16 |
|
Invité de passage
![]() Chercheur en informatique Inscription : mars 2012 Messages : 20 ![]() |
Bonjour,
merci pour votre aide, c'est vrai j'ai essayé de le faire directement via l'interface web mais ça ne marche pas ensuite j'ai essayé par console,il me fait loading data, j'ai attendu plus que 12h pour un fichier de 1géga de données mais ya rien, le problème c'est qu'il ne m'écrit pas que le loading est terminé et il me fait pas une erreur non plus. |
|
|
00
|
Copyright © 2000-2013 - www.developpez.com