-
Mise à jour de triplets
Bonjour,
Je me pose une question concernant la mise à jour de jeux de données RDF dans un triplestore. Je vais prendre un exemple concret :
J'ai chargé dans mon triplestore la liste de 2011 des villes de l'INSEE .
Je souhaites mettre à jour mon jeu de données avec les villes de l'INSEE 2012.
A noter qu'entre 2 années, l'INSEE est susceptible de supprimer/fusionner des villes, de renommer des villes et d'ajouter des nouvelles villes.
Il y a 2 façons de faire :
* Je supprime l'ancien graphe avec les données 2011, et je le remplace par le nouveau jeu avec les villes de 2012. Problème : je perds les villes qui ont été supprimées en 2012.
* Je garde l'ancien graphe, et j'ajoute les données 2012 dans le même graphe. Je garde ainsi les villes supprimées car je ne fait que de l'ajout. Le problème est que dans ce cas, je crée des doublons de labels (rdfs:label) pour les villes qui ont changé de nom entre 2011 et 2012.
Est-il possible de faire un facilement un mix de ces 2 méthodes de mises à jour pour ne pas perdre les villes de 2011 et ne pas avoir de doublons de labels pour les villes qui ont changé de nom entre les 2 années ? (je voudrais seulement avoir la dernière version du label pour les prédicats rdfs:label).
Auriez-vous une idée ?
Merci d'avance !
-
Bonjour
En utilisant des object property cela doit être faisable.
Du style "estDevenu" (et sont inverse bien sur, pour au cas ou) tu auras un truc comme villeX estDevenu villeY, tu récupères villeY et tu vérifies le résultat de la propriété "estDevenu" de la villeY si elle est inconnue alors tu renvoies le label sinon tu continues jusqu'à ce que le résultat soit inconnue.
-
-
Merci pour vos réponses !
kululu, je vois l'idée, mais il faudrait dans ce cas que je stocke l'ensemble de l'historique des modifications apportées aux villes dans le temps, ce qui risque de devenir vite complexe.
Sapience, je vais regarder de plus près les outils pour faire un DIFF en RDF, la piste est intéressante.