IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web sémantique Discussion :

Web sémantique : Microsoft, Google et Yahoo! collaborent sur Schema.org


Sujet :

Web sémantique

  1. #1
    Expert éminent sénior
    Avatar de Idelways
    Homme Profil pro
    Développeur Ruby on Rails / iOS
    Inscrit en
    juin 2010
    Messages
    1 374
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : Développeur Ruby on Rails / iOS

    Informations forums :
    Inscription : juin 2010
    Messages : 1 374
    Points : 68 504
    Points
    68 504
    Par défaut Web sémantique : Microsoft, Google et Yahoo! collaborent sur Schema.org
    Web sémantique : Microsoft, Google et Yahoo! collaborent sur Schema.org
    Un microformat pour structurer le code HTML aux moteurs de recherche


    Microsoft, Google et Yahoo! annoncent conjointement une nouvelle initiative de Web sémantique qui propose aux webmasters un vocabulaire nouveau à utiliser dans leurs balises HTML afin de mieux structurer les données qu'ils présentent aux moteurs de recherche.

    Ces microdonnées seront utilisées par les moteurs pour identifier les informations utiles et améliorer la pertinence et l'affichage des sites qui les utilisent sur les résultats de recherche.

    Le site de ce microformat (Schema.org) propose plus d'une centaine de concepts à représenter. Des concepts qui vont de l'abstraite entité « chose » aux notions les plus spécialisées comme le casting d'une série TV et les horaires d'ouverture du zoo.

    L'ajout de ces données se fait sur les balises habituelles du HTML ou en rajoutant si nécessaire des balises sémantiquement neutres (<div> et <span>) imbriquées selon le besoin. Les microdonnées sont concrètement insérées dans des attributs de HTML5 : itemprop, itemscope, itemtype...

    Google reconnait dans son annonce que l'ajout de ces microdonnées nécessitera beaucoup de temps et d'effort de la part des développeurs Web, mais estime que cette manipulation nécessaire « serait beaucoup plus difficile si chaque moteur de recherche demandait ces données à sa manière ».

    Et c'est d'ailleurs jusque-là le cas pour Yahoo! et Google qui proposent depuis 2009 d'ajouter des microdonnées différentes : Search Monkey pour Yahoo! et Rich snippets pour Google. Cette nouvelle spécification dérive justement en partie de ces recommandations-là.

    Le catalogue de Schema.org sera étoffé en fonction des retours d'expériences des Webmasters, affirme Google, les développeurs ayant déjà mis au point les microformats RDFa continueront à les voir s'afficher sur les Rich snippets de ses résultats.

    Cette annonce de collaboration couronne des décennies de recherches sur les bases de données de représentation, par des communautés diverses telles que les projets SDSS Skyserver, Cyc, dbpedia.org et Linked Data.

    Si les annonces de cette initiative ne parlent que des intérêts pour les moteurs de recherche, les usages qui peuvent découler de sa large utilisation sont incalculables.

    Pour mémoire, ce n'est pas là première fois que ces trois rivales (ou plutôt deux depuis l’annonce du partenariat de Yahoo! et Bing) collaborent pour améliorer l'indexation des sites.
    En 2006, les trois géants des services en ligne avaient allié leurs efforts pour établir une norme pour les Sitemap, ces fichiers texte ou XML qui orientent les crawlers (ou sniffeurs) des moteurs de recherche lors de l'indexation des pages.


    Site officiel de l'initiative Schema.org
    Toute la hiérarchie des types représentés

    Source : annonce de Google, de Bing, de Yahoo

    Merci à Claude Leloup pour la relecture orthographique !

    Et vous ?

    Que pensez-vous de cette nouvelle initiative ?
    Allez-vous commencer à insérer ces microdonnées dans vos pages Web ?

  2. #2
    Membre averti

    Homme Profil pro
    Serial Entrepreneur
    Inscrit en
    mai 2006
    Messages
    68
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Belgique

    Informations professionnelles :
    Activité : Serial Entrepreneur

    Informations forums :
    Inscription : mai 2006
    Messages : 68
    Points : 310
    Points
    310
    Par défaut
    C'est quoi la différence avec la balise META, que les moteurs de recherche n'utilisent plus parce trop de sites en abusent ?

  3. #3
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    26 067
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 26 067
    Points : 185 755
    Points
    185 755
    Par défaut
    Citation Envoyé par xurei Voir le message
    C'est quoi la différence avec la balise META, que les moteurs de recherche n'utilisent plus parce trop de sites en abusent ?
    Elle est énorme : la balise META concerne toute la page, les microdonnées ne concernent que des éléments bien précis. Pour plus d'infos, http://tcuvelier.developpez.com/tuto.../introduction/.
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  4. #4
    Membre actif
    Homme Profil pro
    Gérant
    Inscrit en
    février 2006
    Messages
    256
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : Dom-Tom

    Informations professionnelles :
    Activité : Gérant

    Informations forums :
    Inscription : février 2006
    Messages : 256
    Points : 298
    Points
    298
    Par défaut
    En effet, ça va être long à apprendre tout ça !
    C'est peut-être plus simple pour les moteurs mais beaucoup moins pour les webmasters, il va falloir travailler en binôme avec une personne dédiée à cette partie parce qu'à moins d'utiliser un IDE qui fera des suggestions il va falloir taper énormément de code !!! (sans compter les vérifications)

  5. #5
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    février 2006
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : février 2006
    Messages : 1
    Points : 1
    Points
    1
    Par défaut
    Question : c'est réservé aux documents en HTML5 ou aussi à d'autres, comme XHTML ?

  6. #6
    Membre éclairé

    Profil pro
    Inscrit en
    février 2010
    Messages
    119
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : février 2010
    Messages : 119
    Points : 777
    Points
    777
    Par défaut
    Citation Envoyé par nazoreen Voir le message
    En effet, ça va être long à apprendre tout ça !
    Ça n'est jamais complètement gratuit de se conformer à une norme, mais en l'occurrence inutile d'apprendre par coeur les dizaines de formats, il suffit de repérer les quelques uns qui concernent ton site et d'adapter tes templates HTML en fonction.

    Après comme tous les essais de Web sémantique jusqu'ici (RDFa, microdata et des dizaines d'initiatives), ce qui va compter, c'est l'adoption par la communauté. Si cette annonce trouve un gros écho, ça vaut la peine de s'y mettre non seulement pour les moteurs de recherche mais en plus pour tout ce qui est capable de lire du HTML (navigateurs et plugins, moteurs de recherche spécialisés comme les comparateurs de prix...).

    Citation Envoyé par jl54 Voir le message
    Question: c'est réservé aux documents en HTML5 ou aussi à d'autres ex XHTML ?
    C'est du HTML normal auquel on ajoute trois propriétés, donc ça passe partout y compris en XML.

  7. #7
    Nouveau membre du Club
    Homme Profil pro
    Enseignant Chercheur
    Inscrit en
    mai 2004
    Messages
    46
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Enseignant Chercheur

    Informations forums :
    Inscription : mai 2004
    Messages : 46
    Points : 28
    Points
    28
    Par défaut
    Ils sont juste en train de réinventer RDFa. C'est d'autant plus incompréhensible que Google supporte déjà les annotations décrites sur schema.org avec RDFa (cf. http://www.google.com/support/webmas...&answer=146898).

  8. #8
    Expert confirmé Avatar de psychadelic
    Profil pro
    Inscrit en
    mai 2010
    Messages
    2 529
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : mai 2010
    Messages : 2 529
    Points : 4 556
    Points
    4 556
    Par défaut
    Qu'importe si certains estiment qu'ils ne font que réinventer la roue;

    Si utiliser leurs microformats fait monter le pageRank d'un site, ce sera incontournable.

    Du reste, améliorer le PageRank d'un site est un tel parcours du combattant, si on peut enfin avoir quelque chose de cohérent et d'impartial pour classer les sites, moi, je suis pour .
    «La pluralité des voix n'est pas une preuve, pour les vérités malaisées à découvrir, tant il est bien plus vraisemblable qu'un homme seul les ait rencontrées que tout un peuple.» [ René Descartes ] - Discours de la méthode

  9. #9
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : février 2004
    Messages : 19 875
    Points : 39 737
    Points
    39 737
    Par défaut
    Citation Envoyé par jpvincent Voir le message
    C'est du HTML normal auquel on ajoute trois propriétés, donc ça passe partout y compris en XML.
    Pas tout à fait quand même... par exemple ceci :

    Code HTML : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    <div itemscope itemtype="http://schema.org/Movie">
        ...
    </div>

    n'est pas du XML valide (un attribut doit avoir une valeur).

    Mais bon, de toute façon ça ne change pas grand-chose, vu qu'un document HTML n'était déjà pas un document XML valide avant ça (sauf XHTML)

  10. #10
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    26 067
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 26 067
    Points : 185 755
    Points
    185 755
    Par défaut
    Citation Envoyé par Ouaibou Voir le message
    Ils sont juste en train de réinventer RDFa. C'est d'autant plus incompréhensible que Google supporte déjà les annotations décrites sur schema.org avec RDFa (cf. http://www.google.com/support/webmas...&answer=146898).
    Ils ne réinventent rien du tout. Juste comme ça, ils se basent sur HTML5 et les microdonnées qu'il introduit (http://tcuvelier.developpez.com/tuto.../introduction/). Rien de réinventé ou autre, c'est juste que le W3C aime faire les choses en plusieurs exemplaires, ça n'a strictement rien à voir avec schema.org. (En fait, RDFa est plus pour les documents XML, les microdonnées pour du HTML).

    Citation Envoyé par jpvincent Voir le message
    C'est du HTML normal auquel on ajoute trois propriétés, donc ça passe partout y compris en XML.
    Ce n'est autorisé par le schéma que pour HTML5 ; avant, point de salut en dehors des microformats. Si tu veux du compatible XML, tu n'as qu'un seul choix : RDFa. Le HTML est un lointain cousin du XML, il n'en est pas enfant...
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  11. #11
    Membre actif
    Homme Profil pro
    PDG
    Inscrit en
    septembre 2005
    Messages
    102
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : PDG
    Secteur : Arts - Culture

    Informations forums :
    Inscription : septembre 2005
    Messages : 102
    Points : 224
    Points
    224
    Par défaut
    schema.org est une bonne initiative, mais...
    1. C'est contradictoire avec le fait de réclamer des pages plus légères étant donné qu'il faut ajouter des éléments (assez importants) dans les tags.
    2. Il est impossible (à ma connaissance) de les utiliser avec les CSS.

    A côté de ça nous avons les microformats hxxxx qui, eux, sont des classes, prennent moins de place et sont utilisable avec les CSS.
    Donc, même si j'aime bien le concept de schema.org, les microformats sous forme de classes sont bien plus pratique, tant du point de vue du développeur que du point de vue du visiteur (page moins lourde à charger).

    Pour conclure, je dirai que c'est un constat d'échec de la part des robots/moteurs de recherche à analyser le contenu des pages qu'ils indexent/proposent en résultat, d'autant plus que c'est, là encore, en contradiction avec leur recommandation :
    faites vos pages pour les humains, pas pour les robots
    qui devient donc :
    faites vos pages pour les humains et les robots.

  12. #12
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    26 067
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 26 067
    Points : 185 755
    Points
    185 755
    Par défaut
    Citation Envoyé par dasdeb Voir le message
    [*]C'est contradictoire avec le fait de réclamer des pages plus légères étant donné qu'il faut ajouter des éléments (assez importants) dans les tags.
    De même, XHTML n'est pas à utiliser, il faut fermer ses balises, c'est beaucoup trop de place perdue.
    De même, mettre autre chose que du texte, c'est une perte de place, retournons donc aux pages avec exclusivement du texte.
    De même, il est inutile de mettre des <head> et des <body>, des <thead>, <tfoot> et <tbody> et bien d'autres, ça prend de la place inutilement et les pages sont toujours lisibles.

    Citation Envoyé par dasdeb Voir le message
    [*]Il est impossible (à ma connaissance) de les utiliser avec les CSS.
    Ah ? Depuis quand ? Rien ne vient interférer avec ce qui concerne CSS... sauf les microformats, que tu plébiscites justement.

    Aussi, les microformats ne sont pas vraiment standardisés, alors que Schema.org veut se baser sur le standard HTML5. Les microformats réutilisent quelque chose qui existait et qui semblait libre. Une pratique exemplaire du développement, il me semble. Sans oublier que, si tu dois ajouter des microformats à un site existant, il faut presque prier pour ne rien casser, surtout en cas de templates personnalisables (auquel cas tu n'as aucun contrôle sur les classes définies par l'utilisateur, qui peut très bien venir piétiner sur ce que tu espérais utiliser).

    Citation Envoyé par dasdeb Voir le message
    qui devient donc :
    faites vos pages pour les humains et les robots.
    L'objectif n'a pas changé : tu ne viens que marquer de nouvelles choses pour les robots, qui étaient déjà disponibles à l'humain - à prix de la lecture du texte, ce qui peut être dur pour certains (notamment, fatigue oculaire, due à la vieillesse).
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  13. #13
    Membre actif
    Homme Profil pro
    PDG
    Inscrit en
    septembre 2005
    Messages
    102
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : PDG
    Secteur : Arts - Culture

    Informations forums :
    Inscription : septembre 2005
    Messages : 102
    Points : 224
    Points
    224
    Par défaut
    Citation Envoyé par dourouc05 Voir le message
    De même, XHTML n'est pas à utiliser, il faut fermer ses balises, c'est beaucoup trop de place perdue.
    De même, mettre autre chose que du texte, c'est une perte de place, retournons donc aux pages avec exclusivement du texte.
    De même, il est inutile de mettre des <head> et des <body>, des <thead>, <tfoot> et <tbody> et bien d'autres, ça prend de la place inutilement et les pages sont toujours lisibles.
    Gné ? Je parle du fait que, d'un côté Google et compagnie veulent des pages rapides à charger et que de l'autre ils préconisent de les alourdir...


    Citation Envoyé par dourouc05 Voir le message
    Ah ? Depuis quand ? Rien ne vient interférer avec ce qui concerne CSS... sauf les microformats, que tu plébiscites justement.
    Les microformats type vcard utilisent les classes, c'est donc facile de les styler directement.
    Peut-on faire de même avec les microformats de type schema.org ?

    Citation Envoyé par dourouc05 Voir le message
    Aussi, les microformats ne sont pas vraiment standardisés, alors que Schema.org veut se baser sur le standard HTML5. Les microformats réutilisent quelque chose qui existait et qui semblait libre. Une pratique exemplaire du développement, il me semble. Sans oublier que, si tu dois ajouter des microformats à un site existant, il faut presque prier pour ne rien casser, surtout en cas de templates personnalisables (auquel cas tu n'as aucun contrôle sur les classes définies par l'utilisateur, qui peut très bien venir piétiner sur ce que tu espérais utiliser).
    Je suis bien d'accord avec toi. Ce que je dis c'est que réclamer des pages rapides à charger tout en préconisant leur alourdissement par des tonnes d'éléments purement destinés à l'usage des robots est contradictoire.


    Citation Envoyé par dourouc05 Voir le message
    L'objectif n'a pas changé : tu ne viens que marquer de nouvelles choses pour les robots, qui étaient déjà disponibles à l'humain - à prix de la lecture du texte, ce qui peut être dur pour certains (notamment, fatigue oculaire, due à la vieillesse).
    Et tu ne fais que confirmer ce que j'ai dit, Google (pour ne citer que lui) se contredit et avoue qu'il n'est pas à même d'analyser correctement les pages qu'il parcoure.

    Le problème de tout ça, c'est que les webmaster qui ont pris le parti d'utiliser d'autres formes de microformats vont se retrouver dans la panade (même s'il est précisé par Google qu'ils continuent à interpréter ces autres microformats... ce qui n'engage pas les autres moteurs) car ce sont quand même Google, Bing et yahoo! qui participent à schema.org. Manquerait plus que Baidu et Yandex se joignent à eux et c'est terminé...

  14. #14
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    août 2008
    Messages
    26 067
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : août 2008
    Messages : 26 067
    Points : 185 755
    Points
    185 755
    Par défaut
    Citation Envoyé par dasdeb Voir le message
    Gné ? Je parle du fait que, d'un côté Google et compagnie veulent des pages rapides à charger et que de l'autre ils préconisent de les alourdir...
    Et que, de toute façon, respecter les standards, c'est déjà alourdir les pages, encore plus si on est en XML.

    Citation Envoyé par dasdeb Voir le message
    Les microformats type vcard utilisent les classes, c'est donc facile de les styler directement.
    Peut-on faire de même avec les microformats de type schema.org ?
    Les microformats sont propres et ne mélangent pas les genres. Qu'ils soient Schema.org ou autre, ça ne change rien (juste le vocabulaire employé).

    Citation Envoyé par dasdeb Voir le message
    Le problème de tout ça, c'est que les webmaster qui ont pris le parti d'utiliser d'autres formes de microformats vont se retrouver dans la panade (même s'il est précisé par Google qu'ils continuent à interpréter ces autres microformats... ce qui n'engage pas les autres moteurs) car ce sont quand même Google, Bing et yahoo! qui participent à schema.org. Manquerait plus que Baidu et Yandex se joignent à eux et c'est terminé...
    Et les webmasters qui ont pris le parti d'utiliser autre chose (RDFa, eRDF) ?
    Et les nouveaux venus ?

    Au contraire, c'est mieux de tout uniformiser : on ne devra plus se poser la question de savoir quelle technologie utiliser, quels vocabulaires, tout sera directement compris par les moteurs de recherche, navigateurs et autres. On a eu beaucoup de divergences de JS, par exemple, qui ont finies (à peu près) résorbées (par les navigateurs récents, du moins, IE6 ne compte pas), sans que ce soit un grand mal : c'est la même chose.
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  15. #15
    Rédacteur
    Avatar de Macmillenium
    Homme Profil pro
    Développeur front-end
    Inscrit en
    mars 2008
    Messages
    2 333
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur front-end
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : mars 2008
    Messages : 2 333
    Points : 3 747
    Points
    3 747
    Par défaut
    Citation Envoyé par dasdeb Voir le message
    [*]Il est impossible (à ma connaissance) de les utiliser avec les CSS.
    Si, exemple:
    Code css : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    span[itemprop="name"] { color:red }

    fonctionne sur tous les navigateurs qui implémentent les sélecteurs d'attributs. Tu peux même utiliser les microformats ET les microdata comme sélecteurs CSS:
    Code css : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    .fn[itemprop="name"] { color:red }
    Je ne réponds pas aux questions techniques par MP.

Discussions similaires

  1. Réponses: 0
    Dernier message: 03/06/2011, 11h42
  2. Réponses: 0
    Dernier message: 13/03/2008, 10h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo