Publicité
+ Répondre à la discussion Actualité déjà publiée
Page 1 sur 3 123 DernièreDernière
Affichage des résultats 1 à 20 sur 43
  1. #1
    Expert Confirmé Sénior

    Inscrit en
    juillet 2009
    Messages
    3 425
    Détails du profil
    Informations forums :
    Inscription : juillet 2009
    Messages : 3 425
    Points : 148 384
    Points
    148 384

    Par défaut Google se dirige vers la recherche sémantique

    Google se dirige vers la recherche sémantique
    Avec « Knowledge Graph », une des nouveautés les plus importantes du moteur depuis plusieurs années


    Google se dirige un peu plus vers les requêtes en « langage courant ».

    Comment ? En introduisant une nouvelle méthode pour « comprendre » les demandes des internautes.

    Baptisé « Knowledge Graph », cette méthode structure les données de plusieurs sources pour constituer une base de savoirs qui complète la méthode de référencement actuelle.

    Concrètement, Google s’appuie sur Wikipedia, sur le World Factbook de la CIA et sur Freebase pour constituer un ensemble de fiches qui sont proposées aux utilisateurs en plus des liens organiques (qui eux sont toujours sélectionnés en fonction des mots clefs, du nombre de liens pointant vers le site, etc.).

    Mieux, avec ce graph, Google fait des liens entre les fiches elles-mêmes et propose des « connaissances » connexes.

    Résultat, c’est une mini-fiche encyclopédique qui accompagne chaque requête.



    Autre nouveauté que l’on voyait venir (merci Mickael) et qui accompagne ce Graph, Google va séparer les résultats homonymes dans des onglets le faisait son défunt concurrent Cuil.



    « Nous avons développé cette technologie pour comprendre le monde au travers de choses réelles et pas simplement avec les textes présents sur le Web », explique au San Fracisco Chronicle Johanna Wright, la responsable du Search chez Google. « Ce que nous essayons de faire c’est de donner des réponses qui correspondent à ce que vous voulez dire, quel que soit la manière dont vous l’avez dit ».


    Johanna Wright, responsable du Search chez Google

    La prochaine étape est évidemment la compréhension poussée du langage humain qui permettra de répondre à des questions – données en exemple par Johanna Wright elle-même – comme « Où puis-je assister à un concert en plein air quand il fait beau ? Où puis-je trouver un parc d'attractions avec un restaurant végétarien à proximité ? Combien de gouverneurs sont nés dans un état différent de celui qu'ils gouvernent ? ».



    La nouveauté devrait être déployée « progressivement dans les jours qui viennent ». Une nouveauté qui pour beaucoup d’observateurs est une des plus importantes - si ce n’est la plus importante - depuis de nombreuses années pour le moteur de Google


    Source : Google, San Francisco Chronicle

    Et vous ?

    Que pensez-vous de ce « Knowledge Graph » : prometteur ou redondant avec Wikipedia ?

  2. #2
    Malikemal
    Invité(e)

    Par défaut

    Nous serons tous d'accord pour dire que c'est une nouveauté majeure, qui peut faire beaucoup pour le "Web Sémantique". Néanmoins, le fait que ça soit Google qui l'introduise, va inciter de plus en plus de gens à ne plus se fier qu'à Google pour tout. Alors, non seulement c'est mauvais pour le cerveau (de nombreuses études le montre, cf Google [vous voyez ? c'est devenu un réflexe]) mais ça assied encore plus la suprématie de Google sur le web.
    Ça ne m'étonnerai pas qu'un jour on soit tous obliger d'avoir une adresse GMail, ou alors qu'un compte Facebook soit obligatoire (pour faire le lien avec sa récente entrée en bourse) ...
    Certain diront surement que je suis paranoïaque, mais il suffit de voir la place qu'à Google dans nos vies pour s'en rendre compte !

  3. #3
    Membre habitué
    Homme Profil pro Michel Plomteux
    formateur web, linux
    Inscrit en
    mars 2002
    Messages
    105
    Détails du profil
    Informations personnelles :
    Nom : Homme Michel Plomteux
    Âge : 65
    Localisation : Belgique

    Informations professionnelles :
    Activité : formateur web, linux
    Secteur : Enseignement

    Informations forums :
    Inscription : mars 2002
    Messages : 105
    Points : 141
    Points
    141

    Par défaut

    A quand une google university ?
    Comme le dit si bien Malikemal, le risque est grand d'un appauvrissement du savoir à coup de copier-coller.
    De plus que faut-il penser de la récupération du travail des bénévoles de Wikipédia afin d'augmenter la visibilité d'une entreprise commerciale ?
    Le web sémantique est une belle utopie mais présenté de cette façon, cela risque de devenir un cauchemar.

  4. #4
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    Citation Envoyé par Michel Voir le message
    A quand une google university ?
    Comme le dit si bien Malikemal, le risque est grand d'un appauvrissement du savoir à coup de copier-coller.
    La même question se posait déjà au début d'Internet. La question fondamentale est de savoir ce que nous faisons de tout ce temps gagné et de toutes ces recherches facilitées. Encore plus de technologie ? ou plus de temps à d'autres activités socialement utiles ?

    Citation Envoyé par Michel Voir le message
    De plus que faut-il penser de la récupération du travail des bénévoles de Wikipédia afin d'augmenter la visibilité d'une entreprise commerciale ?
    Le web sémantique est une belle utopie mais présenté de cette façon, cela risque de devenir un cauchemar.
    Le web de données n'est pas une utopie. C'est là, maintenant. Mettre en ligne des données structurées n'est pas _que_ donner à manger aux index de G., c'est aussi permettre à d'autres applications, services, entreprises, citoyens, de s'en re-servir. De la même façon que publier un billet de blog n'est pas _que_ fait pour ranker le plus haut possible dans l'index de G., c'est aussi permettre à d'autres gens de le lire, le méditer, le commenter, le copier-coller, etc.

  5. #5
    Membre habitué
    Homme Profil pro Michel Plomteux
    formateur web, linux
    Inscrit en
    mars 2002
    Messages
    105
    Détails du profil
    Informations personnelles :
    Nom : Homme Michel Plomteux
    Âge : 65
    Localisation : Belgique

    Informations professionnelles :
    Activité : formateur web, linux
    Secteur : Enseignement

    Informations forums :
    Inscription : mars 2002
    Messages : 105
    Points : 141
    Points
    141

    Par défaut

    Structurer des données ne signifie pas nécessairement leurs donner un sens tout au plus, met-on en évidence une organisation en faisant une analyse syntaxique.
    La sémantique prétend donner du sens et là c'est un autre niveau !
    Si je prend le mot "pince", il n'évoque pas la même chose selon qu'on est coiffeur électricien ou chirurgien !
    Donc un moteur de recherche qui utiliserait la sémantique devrait vous demander de préciser votre domaine de recherche avant même de proposer des solutions.
    On est loin d'une compilation d'extraits d'articles plus ou moins liés.

  6. #6
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    Citation Envoyé par Michel Voir le message
    Structurer des données ne signifie pas nécessairement leurs donner un sens tout au plus, met-on en évidence une organisation en faisant une analyse syntaxique.
    Implicitement dans mon commentaire la notion de données structurées faisait référence au RDF où les entités sont désambiguisées par des URIs. Et bien souvent cela ne passe pas par une analyse du language naturel car dans bien des cas les données structurées existent déjà.

    Citation Envoyé par Michel Voir le message
    La sémantique prétend donner du sens et là c'est un autre niveau !
    Je crois qu'il faut arrêter avec cet adjectif de "sémantique" qui ne fait paradoxalement qu'ajouter de la confusion à ce domaine. Je préfère en rester à la notion de publication de données structurées (sous-entendu, en RDF), plus claire, et sans fausse promesse. Il n'y a pas de question de "sens", ou de "sémantique" là-dedans. Le sens n'est que dans le cerveau d'un humain qui lit un texte.

    Citation Envoyé par Michel Voir le message
    Donc un moteur de recherche qui utiliserait la sémantique devrait vous demander de préciser votre domaine de recherche avant même de proposer des solutions.
    Oui, ou au moins de désambiguïser la recherche; et ce n'est pas ce que Google Knowledge Graph fait : la recherche "Hilton Paris" ramène des infos sur Paris Hilton, et ce n'était peut-être pas mon intention de recherche.

  7. #7
    Expert Confirmé
    Homme Profil pro
    Développeur informatique
    Inscrit en
    décembre 2008
    Messages
    805
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : décembre 2008
    Messages : 805
    Points : 2 650
    Points
    2 650

    Par défaut

    Citation Envoyé par Malikemal Voir le message
    Nous serons tous d'accord pour dire que c'est une nouveauté majeure, qui peut faire beaucoup pour le "Web Sémantique". Néanmoins, le fait que ça soit Google qui l'introduise, va inciter de plus en plus de gens à ne plus se fier qu'à Google pour tout. Alors, non seulement c'est mauvais pour le cerveau (de nombreuses études le montre, cf Google [vous voyez ? c'est devenu un réflexe]) mais ça assied encore plus la suprématie de Google sur le web.
    Ça ne m'étonnerai pas qu'un jour on soit tous obliger d'avoir une adresse GMail, ou alors qu'un compte Facebook soit obligatoire (pour faire le lien avec sa récente entrée en bourse) ...
    Certain diront surement que je suis paranoïaque, mais il suffit de voir la place qu'à Google dans nos vies pour s'en rendre compte !
    Navré... je ne suis pas d'accord avec toi sur un fait : qu'il s'agisse d'une nouveauté.
    En tout cas, ce que l'on vois sur les screen shot n'a rien de nouveau, en fait, c'est même la raison qui fait que je n'utilise plus google depuis... pas mal de temps (2 années, peut-être plus).
    Il suffit de regarder ceci pour comprendre:
    http://duckduckgo.com/?q=marie+curie&kp=1&kl=fr-fr

    La "mini-fiche encyclopédique" est présente. L'utilisation des données de wikipedia n'est PAS UNE NOUVEAUTE!
    C'est une technique courante parmi les méta-moteurs de recherche quand même, de chercher sur plusieurs sites et de compiler le tout. Hors, les méta moteurs existent depuis longtemps.

    La seule nouveauté que, personnellement, je vois, c'est que google deviens un peu plus un méta moteur en plus de sa fonction de moteur classique.
    Et en plus, il le fait mal.
    Regardez, faites la recherche sur 7zip, et cherchez le site officiel, pour voir. Déjà, il n'est pas 1er, et en plus, il n'est pas mis en évidence.
    Maintenant, suivez ce lien:
    http://duckduckgo.com/?q=7zip&kp=1&kl=fr-fr
    Ici, il est mis en évidence, ce qui prouve que la sémantique de DDG est plus poussée je suppose.
    D'ailleurs, c'est même une question de sécurité d'une certaine façon. Il est moins probable d'avoir une version vérolée sur le site officiel que sur les autres. Sans compter que la version stable y sera fatalement la plus récente, ce qui n'est pas le cas des non officiels, sauf dans le cas ou ces non-officiels suivent de près le dev et, pourquoi pas, y contribuent.

    Les onglets, je ne les vois pas sur le screen. Si c'est un index thématique, alors, idem, DDG le possède depuis que je le connais.

    Quand au "web sémantique", j'y croirais quand je le verrai. Les américains sont forts pour breveter des trucs qu'ils se savent pas faire après tout...

    Bien sûr, je n'ai parlé que de DDG. Navré, je n'ai pas assez essayé les autres alternatives pour en parler.
    Tout ce que je vois, c'est un google qui tente de rattraper son retard, en tout cas. Alors quand leur rattrapage de retard est présenté comme de l'invention, ça me fait bondir.

    Au sujet du problème de la suppression du besoin de réfléchir induite par ces fonctionnalités, je trouve qu'au contraire, il est plus simple d'éveiller la curiosité quand on a des explications au sujet de ce que sont les différentes options.
    Bien sûr, ça empêche de voir certains trucs qui ne sont pas sur wikipedia (il ne faut pas se leurrer non plus) mais ça permet tout de même de filer un bon coup de main. J'ai été à plusieurs reprises intrigué ou amusé de voir les significations alternatives d'un truc sur lequel j'effectuai des recherches.

  8. #8
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    Citation Envoyé par Freem Voir le message
    Il suffit de regarder ceci pour comprendre:
    http://duckduckgo.com/?q=marie+curie&kp=1&kl=fr-fr

    La "mini-fiche encyclopédique" est présente. L'utilisation des données de wikipedia n'est PAS UNE NOUVEAUTE!
    Je ne défends pas Google et j'aime bien DuckDuckGo, mais crois-moi, la mini-fiche qu'affiche DDG n'a rien à voir avec ce que fait Google. DDG n'affiche qu'un texte non-structuré, G. affiche des données structurées. La différence est importante, et cela veut dire que tu vas pouvoir _filtrer_ ta recherche avec ces critères : par exemple chercher une recette de cuisine et filtrer tes résultats par ingrédient, temps de cuisson, ou nombre de calories, ce qui est aujourd'hui possible sur le site Google en anglais.

    Citation Envoyé par Freem Voir le message
    Regardez, faites la recherche sur 7zip, et cherchez le site officiel, pour voir. Déjà, il n'est pas 1er, et en plus, il n'est pas mis en évidence.
    C'est une question de ranking des résultats, ce qui est une question différente.

    Citation Envoyé par Freem Voir le message
    Les onglets, je ne les vois pas sur le screen. Si c'est un index thématique, alors, idem, DDG le possède depuis que je le connais.
    Oui, je pense que ca correspond à la même chose.

    Citation Envoyé par Freem Voir le message
    Quand au "web sémantique", j'y croirais quand je le verrai.
    Le web sémantique est la mise à disposition de données structurées, interreliées sur le web, où chaque concept est identifiée avec une URI. C'est le web comme une grosse base de données. C'est ce qui permet à Google ou à n'importe qui d'utiliser ces données structurées et de proposer ces fiches d'entité ou ces filtres de recherche par critère. Ce que tu vois sur Google, c'est une application du web de données.

  9. #9
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    Citation Envoyé par Malikemal Voir le message
    Néanmoins, le fait que ça soit Google qui l'introduise
    Absolument, mais alors absolument pas, Google est au contraire l'un des derniers moteurs de recherche à l'implémenter.

    Citation Envoyé par Michel Voir le message
    A quand une google university ?
    Ça fait déjà un petit moment qu'elle existe

    Citation Envoyé par Sapience Voir le message
    Je crois qu'il faut arrêter avec cet adjectif de "sémantique" qui ne fait paradoxalement qu'ajouter de la confusion à ce domaine. Je préfère en rester à la notion de publication de données structurées (sous-entendu, en RDF), plus claire, et sans fausse promesse. Il n'y a pas de question de "sens", ou de "sémantique" là-dedans. Le sens n'est que dans le cerveau d'un humain qui lit un texte.
    Justement non, le mot sémantique est extrêmement important dans ce domaine, les données structurées c'est excellent (c'est pas moi qui dirait le contraire) mais si tu retires la possibilité de faire du raisonnement (donc le terme sémantique) tu te prive des 3/4 des possibilités que tu peux faire avec ces données structurées C'est la différence entre Web de données et Web sémantique

    Citation Envoyé par Freem Voir le message
    Il suffit de regarder ceci pour comprendre:
    http://duckduckgo.com/?q=marie+curie&kp=1&kl=fr-fr
    Qu'y-a-t-il de plus que sur Google ou les autres ?

    Citation Envoyé par Freem Voir le message
    Regardez, faites la recherche sur 7zip, et cherchez le site officiel, pour voir. Déjà, il n'est pas 1er, et en plus, il n'est pas mis en évidence.
    Comme l'a si bien dit Sapience, ceci est un problème de ranking, aucun rapport, Google doit lutter contre du "sur-référencement" ou du "Google bombing" ce que les autres moteurs de recherche n'ont pas à s'occuper (ou beaucoup moins) donc forcément que les résultats changent d'un moteur de recherche à l'autre, Google (et certainement Bing je pense) a beaucoup plus de choses à gérer que les plus petit moteurs comme DDG, Exalead ou celui d'Orange.

    Citation Envoyé par Freem Voir le message
    Ici, il est mis en évidence, ce qui prouve que la sémantique de DDG est plus poussée je suppose.
    Rien à voir avec de la sémantique.

    Citation Envoyé par Freem Voir le message
    Quand au "web sémantique", j'y croirais quand je le verrai. Les américains sont forts pour breveter des trucs qu'ils se savent pas faire après tout...
    Pourquoi les américains ? C'est européens... Et ça fait 18 ans qu'on en parle.

    Citation Envoyé par Freem Voir le message
    Tout ce que je vois, c'est un google qui tente de rattraper son retard, en tout cas. Alors quand leur rattrapage de retard est présenté comme de l'invention, ça me fait bondir.
    Google a du retard là-dessus c'est vrai, mais as-tu une idée du nombre de données qu'ils doivent gérer ? Faire de la sémantique sur une telle quantité de données est absolument gigantesque alors le fait qu'ils aient du retard se comprend. Par exemple le moteur d'Orange fait de la sémantique depuis déjà un peu plus de deux ans et le fait vraiment très bien, il te permet en plus de poser des questions (sur certains domaines seulements) en langue naturelle.

    Citation Envoyé par Freem Voir le message
    Au sujet du problème de la suppression du besoin de réfléchir induite par ces fonctionnalités, je trouve qu'au contraire, il est plus simple d'éveiller la curiosité quand on a des explications au sujet de ce que sont les différentes options.
    Bien sûr, ça empêche de voir certains trucs qui ne sont pas sur wikipedia (il ne faut pas se leurrer non plus) mais ça permet tout de même de filer un bon coup de main. J'ai été à plusieurs reprises intrigué ou amusé de voir les significations alternatives d'un truc sur lequel j'effectuai des recherches.
    Là dessus je suis d'accord avec toi.
    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

  10. #10
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    Citation Envoyé par snake264 Voir le message
    Justement non, le mot sémantique est extrêmement important dans ce domaine, les données structurées c'est excellent (c'est pas moi qui dirait le contraire) mais si tu retires la possibilité de faire du raisonnement (donc le terme sémantique) tu te prive des 3/4 des possibilités que tu peux faire avec ces données structurées C'est la différence entre Web de données et Web sémantique
    Hmmm, c'est intéressant, même si on s'éloigne un peu du sujet de départ. Pour moi :

    • le fait d'employer le terme de "données structurées" ou de "web de données" n'exclut pas l'inférence; on peut au contraire facilement expliquer que des données structurées _permettent_ de faire de l'inférence. Je crois que des moteurs d'inférence existent dans des SGBD classiques depuis un moment (mais je ne suis pas 100% sûr, si qq peut confirmer ou infirmer), sans avoir pour autant l'adjectif "sémantique".
    • l'adjectif "sémantique" dans "web sémantique" n'implique pas automatiquement l'inférence;
    • l'adjectif "sémantique" est une mauvaise appellation de cette ensemble de technologies, est trompeur, et donne lieu à de nombreuses fausses compréhensions et fausses promesses ("les machines vont comprendre ce qui est écrit"); la "Semantic Web FAQ" donne d'ailleur une définition de "Semantic Web" qui repose entièrement sur la notion de données ("The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries");
    • les machines n'échangent entre elles que des "données", au mieux des "informations", jamais de "connaissances" ni de "sémantique";

    Voilà, donc c'est un point de vue personnel, qui vaut ce qui vaut, mais je préfère et je promeut le terme de "web de données".

  11. #11
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    Pour éclairé ta lanterne je te renvoi à cette très bonne vidéo de Fabien Gandon qui résume très bien les différentes étapes du domaine :

    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

  12. #12
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    C'est une très bonne explication synthétique... qui ne m'a pas du tout convaincu (en ce qui concerne l'utilisation du terme "sémantique").
    Mais j'arrête là la pédanterie et je réserve d'autres arguments pour plus tard peut-être...

  13. #13
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    C'est pourtant de cette manière que les professionnels (les gens qui définissent les standards) du domaine l'ont conçu Tu pourra le lire dans tous les bouquins
    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

  14. #14
    Membre confirmé Avatar de April Fool
    Homme Profil pro Information Inexacte
    Fou d'avril
    Inscrit en
    février 2012
    Messages
    99
    Détails du profil
    Informations personnelles :
    Nom : Homme Information Inexacte
    Localisation : France

    Informations professionnelles :
    Activité : Fou d'avril

    Informations forums :
    Inscription : février 2012
    Messages : 99
    Points : 215
    Points
    215

    Par défaut

    Citation Envoyé par Sapience Voir le message
    • le fait d'employer le terme de "données structurées" ou de "web de données" n'exclut pas l'inférence; on peut au contraire facilement expliquer que des données structurées _permettent_ de faire de l'inférence. Je crois que des moteurs d'inférence existent dans des SGBD classiques depuis un moment (mais je ne suis pas 100% sûr, si qq peut confirmer ou infirmer), sans avoir pour autant l'adjectif "sémantique".
    • l'adjectif "sémantique" dans "web sémantique" n'implique pas automatiquement l'inférence;
    • l'adjectif "sémantique" est une mauvaise appellation de cette ensemble de technologies, est trompeur, et donne lieu à de nombreuses fausses compréhensions et fausses promesses ("les machines vont comprendre ce qui est écrit"); la "Semantic Web FAQ" donne d'ailleur une définition de "Semantic Web" qui repose entièrement sur la notion de données ("The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries");
    • les machines n'échangent entre elles que des "données", au mieux des "informations", jamais de "connaissances" ni de "sémantique";

    Voilà, donc c'est un point de vue personnel, qui vaut ce qui vaut, mais je préfère et je promeut le terme de "web de données".
    Complètement d'accord avec l'essentiel de ce que tu dis mais je fais tout de même un différence entre Web de données et Web sémantique. Le Web de données, c'est pour moi juste l'ensemble de données qu'on peut trouver via le Web, en utilisant HTTP, et qui sont interconnectées. Le Web sémantique, c'est l'ensemble des technologies qui permettent de les exploiter. En revanche, les technologies Web sémantique n'ont pas grand chose à voir avec la "sémantique", dans le sens originel du terme, c'est à dire en tant que qualification du "sens" des choses. Une ontologie OWL ne donne pas le sens des choses, si ce n'est par le biais d'annotations textuelles que les personnes comprennent. Mais il n'y a pas moyen pour une machine de comprendre que le sens de "foaf:Person" c'est bien l'ensemble des personnes. La seule chose qu'on sait et que les machines comprennent, c'est que toute instance de foaf:Person est une instance de foaf:Agent, ce qui ne permet en aucun cas d'en savoir plus sur la nature réelle de ces instances.

    Pour ceux qui veulent lire de l'anglais, il est intéressant de regarder cette question et ses réponses sur un site de question/réponse sur le Web sémantique. Ou bien encore cet article de Lee Feigenbaum.
    7susd bl'ham owsql wuul pô!

  15. #15
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    Citation Envoyé par April Fool Voir le message
    Le Web de données, c'est pour moi juste l'ensemble de données qu'on peut trouver via le Web, en utilisant HTTP
    Intéressant, qu'entends-tu par "l'ensemble des données" ?

    Citation Envoyé par April Fool Voir le message
    Le Web sémantique, c'est l'ensemble des technologies qui permettent de les exploiter
    Ca c'est la définition que l'on donne à ceux qui découvre totalement le domaine pour ne pas les embrouiller dès le départ. Ensuite on affine un peu plus les choses pour dire que ce n'est pas vraiment ça.

    Citation Envoyé par April Fool Voir le message
    Mais il n'y a pas moyen pour une machine de comprendre que le sens de "foaf:Person" c'est bien l'ensemble des personnes.
    foaf:Person représente une seule et unique personne et pas un ensemble.

    Citation Envoyé par April Fool Voir le message
    La seule chose qu'on sait et que les machines comprennent, c'est que toute instance de foaf:Person est une instance de foaf:Agent
    Alors si je suis ton raisonnement ça voudrait dire qu'un "ordinateur" n'arriverait pas à voir la différence entre "foaf:Organization" et foaf:Person puisque tout deux sont des sous-classes de "foaf:Agent" ? Si c'est ça c'est absolument faux

    Citation Envoyé par April Fool Voir le message
    Une ontologie OWL ne donne pas le sens des choses
    Tu sais que les ontologies on été développés pour faire du raisonnement sur les données, et donc donner un sens à ces données ? D'ailleurs les ontologies sont même employées en NLP pour le côté sémantique (désambiguiser pour être plus précis) des phrases. Donc encore une fois c'est faux Mais à mon avis c'est plutôt parce que tu dois confondre vocabulaire et ontologie Car en effet avec un vocabulaire il est presque impossible (on a seulement des hiérarchie entre les classes ou les propriétés, donc difficilement) de faire du raisonnement.
    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

  16. #16
    Membre confirmé Avatar de April Fool
    Homme Profil pro Information Inexacte
    Fou d'avril
    Inscrit en
    février 2012
    Messages
    99
    Détails du profil
    Informations personnelles :
    Nom : Homme Information Inexacte
    Localisation : France

    Informations professionnelles :
    Activité : Fou d'avril

    Informations forums :
    Inscription : février 2012
    Messages : 99
    Points : 215
    Points
    215

    Par défaut

    Intéressant, qu'entends-tu par "l'ensemble des données" ?
    N'importe quelles données accessible par HTTP, que ce soit du RDF ou non. Je n'irai pas donner une définition formelle de ce que j'entends par là, c'est juste grosso modo la manière dont je vois les choses. Il n'y a pas de définition normative de "web de données", dont je suppose que je peux très bien prendre cette définition, en attendant un consensus sur ce qu'on entend généralement par ce terme.

    Ca c'est la définition que l'on donne à ceux qui découvre totalement le domaine pour ne pas les embrouiller dès le départ. Ensuite on affine un peu plus les choses pour dire que ce n'est pas vraiment ça.
    Je ne crois pas. Je crois plutôt qu'on donne d'abord aux néophytes des définitions qui disent "le web sémantique permet de donner du sens aux données sur le web". Et finalement, avec l'expérience et en creusant vraiment le sujet, on se rend compte que ce n'est qu'un ensemble de techno et que le sens, la "vraie" sémantique, au sens originel du terme, n'a pas grand chose à faire là dedans.

    foaf:Person représente une seule et unique personne et pas un ensemble.
    As-tu regardé l'ontologie FOAF récemment ? Il y est écrit (traduit en Turtle) :
    Code :
    foaf:Person  rdf:type  owl:Class .
    Si tu es un raisonneur OWL DL, alors foaf:Person représente (ou dénote si tu préfères) un ensemble d'objets du monde (et le raisonneur n'a aucun moyen de savoir ce que sont ces objets exactement). Si tu es un raisonneur OWL Full, alors foaf:Person représente ou dénote une ressource (et encore, pas moyen pour un programme de savoir ce qu'est cette ressource exactement) qui est elle-même associée à un ensemble de ressources (dont le raisonneur ne connait absolument rien, si ce n'est que ce sont des instances de cette classe et aussi des classes foaf:Agent, owl:Thing et rdfs:Resource). Bref, en résumant approximativement, foaf:Person c'est l'ensemble de toutes les personnes, dixit la documentation (en langue naturelle) de l'ontologie FOAF.

    Alors si je suis ton raisonnement ça voudrait dire qu'un "ordinateur" n'arriverait pas à voir la différence entre "foaf:Organization" et foaf:Person puisque tout deux sont des sous-classes de "foaf:Agent" ? Si c'est ça c'est absolument faux
    Dans l'ontologie FOAF, foaf:Organization et foaf:Person sont disjoints. Donc le raisonneur ne peut que conclure qu'ils sont distincts (encore que, il lui faudrait des instances pour ça, on peut très bien penser que ce sont deux classes vides). En revanche, cela ne permet pas au raisonneur de savoir que foaf:Person ce sont des personnes, et que foaf:Organization ce sont des organisations. Pour autant que le raisonneur puisse en juger, ça pourrait aussi bien être le contraire.

    Tu sais que les ontologies on été développés pour faire du raisonnement sur les données, et donc donner un sens à ces données ? D'ailleurs les ontologies sont même employées en NLP pour le côté sémantique (désambiguiser pour être plus précis) des phrases. Donc encore une fois c'est faux Mais à mon avis c'est plutôt parce que tu dois confondre vocabulaire et ontologie Car en effet avec un vocabulaire il est presque impossible (on a seulement des hiérarchie entre les classes ou les propriétés, donc difficilement) de faire du raisonnement.
    Faire du raisonnement sur les données ne signifie pas donner du sens. Si j'ai la règle suivante dans mon programme :
    je ne vois vraiment pas en quoi je donne du sens. Ca me permet jusque de déduire plus de données à partir de mes données initiales. Tout ce que je produis, c'est des symboles en plus. Très utile, mais quant au sens de head et de body... Cela reste au final l'humain qui interprète les termes.

    Ceci étant dit, le mot sémantique en lui-même ne me dérange pas plus que ça tant qu'on est bien conscient qu'il se réfère à la sémantique formelle en logique (c'est-à-dire à ce qui régit les déductions, inférences, etc) et non à la sémantique au sens philosophique ou linguistique qui traite du sens des choses (le signifiant).

    On ne pourra parler de sémantique (au sens du signifiant) dans un ordinateur qu'à partir du moment où il pourra percevoir les choses et associer des symboles à ces perceptions. Je ne parle pas de perception visuelle ou auditive, ce peut être simplement capter des paquets IP et "apprendre" à les associer à des symboles en mémoire, pour ensuite les recombiner en fonction de leur "sens perçu". Là on pourra dire que le système comprend le signifiant, dans une certaine mesure.
    7susd bl'ham owsql wuul pô!

  17. #17
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    Citation Envoyé par April Fool Voir le message
    N'importe quelles données accessible par HTTP, que ce soit du RDF ou non. Je n'irai pas donner une définition formelle de ce que j'entends par là, c'est juste grosso modo la manière dont je vois les choses. Il n'y a pas de définition normative de "web de données", dont je suppose que je peux très bien prendre cette définition, en attendant un consensus sur ce qu'on entend généralement par ce terme.
    J'aime beaucoup ta façon de voir, c'est pas vraiment la façon de penser des experts mais elle est très intéressante. Il existe une définition de Web de données, Web sémantique, GGG, etc... Fabien, dans sa vidéo l'explique d'une excellente façon et c'est la façon de voir des personnes qui régissent le domaine. C'est courant en France de voir que, la plupart du temps, ce domaine (du côté du privé donc entreprise et tout ça) est mal définis et pas très clair car ce n'est absolument pas répandu pour le moment. J'espère sincèrement que ça changera

    Citation Envoyé par April Fool Voir le message
    Je ne crois pas. Je crois plutôt qu'on donne d'abord aux néophytes des définitions qui disent "le web sémantique permet de donner du sens aux données sur le web". Et finalement, avec l'expérience et en creusant vraiment le sujet, on se rend compte que ce n'est qu'un ensemble de techno et que le sens, la "vraie" sémantique, au sens originel du terme, n'a pas grand chose à faire là dedans.
    Malheureusement non, pour avoir vue beaucoup de tuto (même le miens) ou livre ou même cours en amphi parlant du domaine commençant par "c'est un ensemble de techno blabla" et puis à la fin "le côté sémantique permet de faire du raisonnement blabla".

    Citation Envoyé par April Fool Voir le message
    As-tu regardé l'ontologie FOAF récemment ? Il y est écrit (traduit en Turtle) :
    Code :
    foaf:Person  rdf:type  owl:Class .
    FOAF est un vocabulaire, non une ontologie, il y a une grosse différence entre les deux termes.

    Citation Envoyé par April Fool Voir le message
    Si tu es un raisonneur OWL DL, alors foaf:Person représente (ou dénote si tu préfères) un ensemble d'objets du monde (et le raisonneur n'a aucun moyen de savoir ce que sont ces objets exactement). Si tu es un raisonneur OWL Full, alors foaf:Person représente ou dénote une ressource (et encore, pas moyen pour un programme de savoir ce qu'est cette ressource exactement) qui est elle-même associée à un ensemble de ressources (dont le raisonneur ne connait absolument rien, si ce n'est que ce sont des instances de cette classe et aussi des classes foaf:Agent, owl:Thing et rdfs:Resource).
    C'est exact car ce n'est pas une ontologie, il n'y a pas assez de contraintes ou d'informations dans un vocabulaire pour avoir un raisonnement aussi poussé.

    Citation Envoyé par April Fool Voir le message
    Bref, en résumant approximativement, foaf:Person c'est l'ensemble de toutes les personnes, dixit la documentation (en langue naturelle) de l'ontologie FOAF.
    Oui du point de vue du vocabulaire c'est une classe qui représente des personnes. Mais si tu en fait une instance pour décrire quelqu'un ça représente une seule et unique personne, c'est ça que je voulais dire.

    Citation Envoyé par April Fool Voir le message
    Dans l'ontologie FOAF, foaf:Organization et foaf:Person sont disjoints. Donc le raisonneur ne peut que conclure qu'ils sont distincts (encore que, il lui faudrait des instances pour ça, on peut très bien penser que ce sont deux classes vides). En revanche, cela ne permet pas au raisonneur de savoir que foaf:Person ce sont des personnes, et que foaf:Organization ce sont des organisations. Pour autant que le raisonneur puisse en juger, ça pourrait aussi bien être le contraire.
    Avec ton exemple j'ai juste cru que tu disais qu'il n'était pas possible de faire la différence entre foaf:Organization et foaf:Person car ils sont tout deux sous-classe de foaf:Agent. Au temps pour moi j'avais mal compris

    Néanmoins en analysant les propriétés et faire des correspondances il est possible de faire comprendre à un ordinateur quoi est quoi. Chose que j'ai déjà faite en utilisant Pellet et en créant quelques règles perso en plus. Mais c'est vrai qu'un raisonneur seul ne trouvera pas sur un vocabulaire tel que FOAF là-dessus je suis d'accord avec toi.

    Citation Envoyé par April Fool Voir le message
    Faire du raisonnement sur les données ne signifie pas donner du sens. Si j'ai la règle suivante dans mon programme :
    je ne vois vraiment pas en quoi je donne du sens. Ca me permet jusque de déduire plus de données à partir de mes données initiales. Tout ce que je produis, c'est des symboles en plus. Très utile, mais quant au sens de head et de body... Cela reste au final l'humain qui interprète les termes.
    Tu ne donnes aucun sens je suis totalement d'accord avec, néanmoins essais de mettre en RDF en tenant compte d'une ontologie ou d'un vocabulaire cette phrase :

    Le juge mange un avocat
    Comment fais-tu sans connaître le sens de la phrase ? Le fait d'utiliser le raisonnement pour désambiguiser cette phrase (ou ce type de phrase) est ce que font tous les moteurs de recherches pour transformer une phrase courante en RDF avec une ontologie ou vocabulaire.

    Autre petite chose, tu as deux jeux de données différents qui décrivent les mêmes choses et qui utilisent deux vocabulaires (ou ontologies) différents, comment fais-tu pour faire des associations sans faire de raisonnement sur les deux jeux de données ? Le problème d'alignement d'ontologies utilise le raisonnement.
    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

  18. #18
    Nouveau Membre du Club
    Homme Profil pro Noah Félix
    Webmarketer
    Inscrit en
    mai 2012
    Messages
    27
    Détails du profil
    Informations personnelles :
    Nom : Homme Noah Félix
    Localisation : France

    Informations professionnelles :
    Activité : Webmarketer
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : mai 2012
    Messages : 27
    Points : 38
    Points
    38

    Par défaut

    Bonjour,

    Très belle initiative de la part de Google. L’un de ses pas vers le web sémantique était Google Wave, mais ce dernier n’a pas réellement perduré. Espérons que cette nouvelle démarche tiendra bon et s’améliorera !

  19. #19
    Membre chevronné
    Avatar de Sapience
    Homme Profil pro Thomas Francart
    Consultant sémantique & data à sparna.fr
    Inscrit en
    avril 2005
    Messages
    248
    Détails du profil
    Informations personnelles :
    Nom : Homme Thomas Francart
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : avril 2005
    Messages : 248
    Points : 773
    Points
    773

    Par défaut

    Citation Envoyé par snake264 Voir le message
    C'est pourtant de cette manière que les professionnels (les gens qui définissent les standards) du domaine l'ont conçu Tu pourra le lire dans tous les bouquins
    2 remarques :


    Citation Envoyé par snake264
    C'est courant en France de voir que, la plupart du temps, ce domaine (du côté du privé donc entreprise et tout ça) est mal définis et pas très clair

    L'adjectif "sémantique" a contribué et contribue toujours - je crois - à cette mauvaise définition.



    le mot sémantique en lui-même ne me dérange pas plus que ça tant qu'on est bien conscient qu'il se réfère à la sémantique formelle en logique (c'est-à-dire à ce qui régit les déductions, inférences, etc) et non à la sémantique au sens philosophique ou linguistique qui traite du sens des choses (le signifiant).
    Merci Fool pour cette précision que je n'avais pas vu ! ca me réconcilie un peu avec le terme.



    FOAF est un vocabulaire, non une ontologie, il y a une grosse différence entre les deux termes.

    Heeuuu... FOAF est techniquement une ontologie OWL (ici), aucune ambiguïté là-dessus. Le terme de vocabulaire est une acceptation plus générique, plus floue, au-delà des aspects et des représentations techniques; FOAF est _aussi_ un vocabulaire.

  20. #20
    Responsable Web sémantique

    Avatar de snake264
    Homme Profil pro Julien Plu
    Doctorant chez Eurecom
    Inscrit en
    novembre 2006
    Messages
    2 782
    Détails du profil
    Informations personnelles :
    Nom : Homme Julien Plu
    Âge : 27
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Doctorant chez Eurecom
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : novembre 2006
    Messages : 2 782
    Points : 12 520
    Points
    12 520

    Par défaut

    Citation Envoyé par Sapience Voir le message
    je ne suis pas persuadé que cette vision ait été préconçue. Dieu-Le-Père's Lee en 2001, pour parler du semantic web, décrivait des agents logiciels qui font des réservations de restaurant tout seul. 11 ans plus tard, ce n'est pas vraiment ce qu'on voit. Quand il dit aujourd'hui "Linked Open Data is the semantic web done right", c'est quand même que la notion de ce qu'il y a derrière ce terme a évolué. La rationalisation de tout ce qui passe pour arriver à l'expliquer comme le fait Fabien arrive _après coup_.
    Exact, c'est vrai qu'au départ c'était beaucoup plus une idée, une conceptualisation du terme que définissait TBL, là-dessus je suis d'accord, mais comme tu le dis les définitions ont évolués jusqu'à arrivé à celle de Fabien qui est la dernière en date, Fabien étant membre du W3C et définit ces standards donc je pense pense que si il dit tout ça c'est qu'il sait de quoi il parle

    Après il est tout à fait possible que cela change encore dans peu de temps, là je suis d'accord aussi, on ne sait jamais dans ce domaine ça évolue tellement vite

    Citation Envoyé par Sapience Voir le message
    et il s'agit de penser par nous-même, que diable !
    Exact, mais pas trop sinon on se perd et on est totalement à côté de la plaque Mais je suis entièrement d'accord c'est comme cela que la recherche avance

    Citation Envoyé par Sapience Voir le message
    L'adjectif "sémantique" a contribué et contribue toujours - je crois - à cette mauvaise définition.
    +1

    Citation Envoyé par Sapience Voir le message
    Heeuuu... FOAF est techniquement une ontologie OWL (ici), aucune ambiguïté là-dessus. Le terme de vocabulaire est une acceptation plus générique, plus floue, au-delà des aspects et des représentations techniques; FOAF est _aussi_ un vocabulaire.
    Attention, ce n'est pas parce que on utilise deux-trois axiomes de OWL qui n'ajoutent pas grand chose que c'est une ontologie. On peut dire que c'est une ontologie si et seulement si on utilise les axiomes de contraintes sur les propriétés ou les opérations d'ensembles etc... Le fait par exemple de dire que 2 classes sont disjointes n'en font pas une ontologie (dixit ce livre et celui ). En général personne n'intervient quand quelqu'un fait ce genre d'erreur car on admet que c'est la même chose, mais le fait que l'un de mes profs de représentation des connaissances nous ai torturé avec ces définitions et l'importance de faire la différence à du déteindre sur moi
    Vous pouvez aller voir mes tutos et mes critiques: ici
    Ainsi que mon: blog

    Vous souhaitez participer à la rubrique Web sémantique ? Contactez-moi par MP.

    Je ne répondrai à aucune question technique par MP les forums sont présents pour ça

    c'est très intelligent un ordinateur: "Keyboard ERROR. No keyboard Connected. Press any key to continue..."

Liens sociaux

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •