Bonjour,
Je me pose une question concernant la mise à jour de jeux de données RDF dans un triplestore. Je vais prendre un exemple concret :
J'ai chargé dans mon triplestore la liste de 2011 des villes de l'INSEE .
Je souhaites mettre à jour mon jeu de données avec les villes de l'INSEE 2012.
A noter qu'entre 2 années, l'INSEE est susceptible de supprimer/fusionner des villes, de renommer des villes et d'ajouter des nouvelles villes.
Il y a 2 façons de faire :
* Je supprime l'ancien graphe avec les données 2011, et je le remplace par le nouveau jeu avec les villes de 2012. Problème : je perds les villes qui ont été supprimées en 2012.
* Je garde l'ancien graphe, et j'ajoute les données 2012 dans le même graphe. Je garde ainsi les villes supprimées car je ne fait que de l'ajout. Le problème est que dans ce cas, je crée des doublons de labels (rdfs:label) pour les villes qui ont changé de nom entre 2011 et 2012.
Est-il possible de faire un facilement un mix de ces 2 méthodes de mises à jour pour ne pas perdre les villes de 2011 et ne pas avoir de doublons de labels pour les villes qui ont changé de nom entre les 2 années ? (je voudrais seulement avoir la dernière version du label pour les prédicats rdfs:label).
Auriez-vous une idée ?
Merci d'avance !
Partager