Bonjour,
Je traite pour mon mémoire un corpus de termes qui contient des doublons:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25 <teiCorpus> <teiCorpus type="Revue-RH"> <TEI> <text> <front> <docTitle> <titlePart>Le <term type="simpleterm" lang="en">sourcing</term> </titlePart> </docTitle> </front> <body> <div> <term type="complexterm" subtype="variant" lang="en">applicant tracking system</term> <term type="acronym">ATS</term> <term type="complexterm" lang="en">big data</term> <term type="complexterm" lang="en">big data</term> <term type="simpleterm">candidat</term> <term type="simpleterm">candidat</term> <term type="simpleterm">candidat</term> <term type="simpleterm">candidat</term> <term type="simpleterm">candidat</term> <term type="complexterm">candidat potentiel</term> <term type="complexterm">candidat potentiel</term> ....
Je souhaiterais pouvoir garder qu'un seul terme à chaque fois et n'avoir aucun doublon du coup :
J'ai essayé avec ce code, mais en vain :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 <xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:xs="http://www.w3.org/2001/XMLSchema" version="2.0" xpath-default-namespace="http://www.tei-c.org/ns/1.0"> <xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/> <xsl:key name="id" match="term" use="."/> <xsl:template match="body"> <xsl:for-each select="../div/term[generate-id()=generate-id(key('id',.)[1])]"> <xsl:apply-templates/> </xsl:for-each> </xsl:template> </xsl:stylesheet>
Merci d'avance pour votre aide.
Partager