IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web sémantique Discussion :

Participation à la FAQ Web sémantique [FAQ]


Sujet :

Web sémantique

  1. #1
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut Participation à la FAQ Web sémantique
    Bonjour,

    Ce post est fait pour toutes les personnes qui souhaitent apporter leur contribution à la FAQ de la rubrique Web sémantique.

    Si vous avez une idée de Q/R, postez en enfilade .

    Merci d'éviter les images pour ce qui devrait être du texte, tout sera intégré dans la FAQ à la main par copier-coller.


  2. #2
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    • Qu'est-ce qu'une URI ?
    • Qu'est-ce que la négociation de contenu ?
    • Qu'est-ce qu'un triplestore ?
    • Qu'est-ce que l'inférence ?
    • Je veux construire une ontologie. Comment trouver les ontologies existantes déjà publiées ?
    • Qu'est-ce que RDFa ?
    • Comment insérer des informations RDFa dans une page web ?


    ---

    Commentaire sur la réponse à la question "qu'est-ce que l'interconnexion ?" (qui d'ailleurs n'est pas très claire elle-même...) :

    Au lieu d'aller sur Wikipédia les récupérer vous-même ou bien de développer un parseur qui parcourt les pages HTML de Wikipédia, il vous suffit d'interroger DBPedia sur son SPARQL endpoint et ainsi de récupérer dans un fichier RDF toutes les données de vos auteurs qui sont contenues sur Wikipédia. Ensuite, vous stockez ces données dans votre base et vous avez pu ajouter les données qui vous manquaient au début.
    En l'occurence, non, en rapatriant les données dans notre base on n'a rien "interconnecté" du tout. Dans ce cas l' "interconnection" serait de faire une référence depuis ma base à l'entité de DBPedia; ou de déclarer une équivalence avec cette entité. Mais sûrement pas de rapatrier la donnée (même si cela se fait souvent en pratique, mais ce n'est pas de l'interconnection).

  3. #3
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Citation Envoyé par Sapience Voir le message
    • Qu'est-ce qu'une URI ?
    • Qu'est-ce que la négociation de contenu ?
    • Qu'est-ce qu'un triplestore ?
    • Qu'est-ce que l'inférence ?
    • Je veux construire une ontologie. Comment trouver les ontologies existantes déjà publiées ?
    • Qu'est-ce que RDFa ?
    • Comment insérer des informations RDFa dans une page web ?
    Si tu te sens d'en écrire quelques unes n'hésite pas Sinon ça donne déjà des idées

    Citation Envoyé par Sapience Voir le message
    En l'occurence, non, en rapatriant les données dans notre base on n'a rien "interconnecté" du tout.
    Si, car les données de DBPedia sont déjà interconnectées. Donc par transition les notres aussi, puisque qu'en les rapatriant, si on a bien fait les choses on créé un lien sameAs en même temps.

    Citation Envoyé par Sapience Voir le message
    Dans ce cas l' "interconnection" serait de faire une référence depuis ma base à l'entité de DBPedia; ou de déclarer une équivalence avec cette entité.
    Pour utiliser DBPedia ce n'est absolument pas la bonne pratique. Une grosse partie des données contenues dans DBPedia sont en double ou fausses. Si tu fais comme tu dis tu prends le risque de d'utiliser des données fausses ou des doublons, dans une application et surtout en entreprises ce n'est pas admissible.

  4. #4
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    Citation Envoyé par snake264 Voir le message
    Si tu te sens d'en écrire quelques unes n'hésite pas Sinon ça donne déjà des idées
    Je rajouterais celle-là :
    • Mais alors RDF, c'est un fichier XML ? quelle est la différence avec XML ?


    Je pourrai peut-être vous proposer quelques entrées (et quelques proposition d'amélioration de questions existantes).

    Si, car les données de DBPedia sont déjà interconnectées. Donc par transition les notres aussi, puisque qu'en les rapatriant, si on a bien fait les choses on créé un lien sameAs en même temps.
    Je trouve que ca mélange 2 questions : l'action de relier les données et l'action de récupérer les données; récupérer les données n'implique pas d'avoir mis un lien sameAs. La question de la FAQ qui est "Qu'est-ce que l'interconnection ?" porte sur le fait de relier les données, pas sur le fait de les rapatrier. Il faudrait peut-etre séparer cette question en 2 : 1. Comment relier mes données avec d'autres ? (réponse : en mettant un lien sameAs) et 2. Comment enrichir mes données avec des données existantes ? (réponse : en interrogeant un endpoint ou en récupérant un dump).

    Pour utiliser DBPedia ce n'est absolument pas la bonne pratique. Une grosse partie des données contenues dans DBPedia sont en double ou fausses. Si tu fais comme tu dis tu prends le risque de d'utiliser des données fausses ou des doublons, dans une application et surtout en entreprises ce n'est pas admissible.
    D'accord, mais 1. ce n'est pas parce qu'on rapatrie des données de DBPedia dans notre base que l'on résoud le problème des données fausses ou en doublon et 2. Si on le rapatrie, on duplique les données, donc on ne profite pas des updates que d'autres feront.

    Je ne dis pas qu'il ne faut pas rapatrier les données pour les traiter, je dis que cela ne répond pas à cette question de la FAQ.
    (et soit dit en passant si ce n'était pas la bonne pratique il n'y aurait pas autant de liens entrants vers DBPedia sur le Linked Data Cloud.)

  5. #5
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Citation Envoyé par Sapience Voir le message
    Je rajouterais celle-là :
    • Mais alors RDF, c'est un fichier XML ? quelle est la différence avec XML ?


    Je pourrai peut-être vous proposer quelques entrées (et quelques proposition d'amélioration de questions existantes).
    Super !!

    Citation Envoyé par Sapience Voir le message
    Je trouve que ca mélange 2 questions : l'action de relier les données et l'action de récupérer les données; récupérer les données n'implique pas d'avoir mis un lien sameAs. La question de la FAQ qui est "Qu'est-ce que l'interconnection ?" porte sur le fait de relier les données, pas sur le fait de les rapatrier. Il faudrait peut-etre séparer cette question en 2 : 1. Comment relier mes données avec d'autres ? (réponse : en mettant un lien sameAs) et 2. Comment enrichir mes données avec des données existantes ? (réponse : en interrogeant un endpoint ou en récupérant un dump).
    C'est vrai là dessus je suis d'accord. De ce point de vue c'est vrai que c'est pas très bien expliqué et qu'il faut la revoir.

    Citation Envoyé par Sapience Voir le message
    D'accord, mais 1. ce n'est pas parce qu'on rapatrie des données de DBPedia dans notre base que l'on résoud le problème des données fausses ou en doublon
    Si parce que là on peut les nettoyer. Pour un projet lors d'un stage, je me suis rendu compte de l'énormité des erreurs contenues dans DBPedia et j'ai du rapatrier toutes les données concernant un certain domaine et bien dans cette maigre partie de DBPedia (que j'ai rapatrié dans mon triple store) j'ai du modifier pas moins d'environ 3 millions de triplets qui étaient faux ou en double... Crois moi après ce genre d'expérience tu réfléchis à deux fois avant d'utiliser les données de DBPedia Freebase à 1000 fois plus fiable mais à moins de contenu.

    Citation Envoyé par Sapience Voir le message
    2. Si on le rapatrie, on duplique les données, donc on ne profite pas des updates que d'autres feront.
    Duplique non, parce qu'on n'utilise pas les données qui sont sur le store de DBPedia. Par contre oui on ne profite pas des updates mais bon pour le moment les updates sont pas terribles Quoi que depuis le début de l'années il y a eu pas mal de mappings qui ont été refait et certaines données sont beaucoup mieux structurées.

    Je parle de mapping car DBPedia à deux façon de rappatrier ses données, via mapping fait à la main, ce qui correspond à l'ontologie DBPedia et l'extraction automatique des infobox Wikipedia qui correspond à l'ontologie DBPedia-prop.

    Citation Envoyé par Sapience Voir le message
    (et soit dit en passant si ce n'était pas la bonne pratique il n'y aurait pas autant de liens entrants vers DBPedia sur le Linked Data Cloud.)
    Ce n'est pas parce que tu rapatrie les données dans ton triple store que tu ne dois pas garder un sameAs de chacune de tes URI vers l'URI de DBPedia même si tu ne l'utilise pas.

  6. #6
    Membre à l'essai
    Profil pro
    conseil en organisation et ingénierie documentaires
    Inscrit en
    Juin 2009
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : conseil en organisation et ingénierie documentaires

    Informations forums :
    Inscription : Juin 2009
    Messages : 4
    Points : 10
    Points
    10
    Par défaut question : Comment utiliser des ontologies déjà existantes ?"
    Bonjour,
    Merci pour cette faq.
    Concernant la question "Comment utiliser des ontologies déjà existantes ?",
    j'aurais bien proposé le répertoire d'ontologies rdf établi par B.Vatant et PY Vandenbussche de Mondeca du doux nom de "LOV" :
    http://labs.mondeca.com/dataset/lov/index.html
    Chacun des 240 vocabulaires listés possède une courte fiche de présentation (un exemple) ce qui nous facilite la tâche...
    (mis à jour régulièrement)
    Qu'en pensez vous ?
    SD

  7. #7
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Exact, excellente idée

    En plus je connais bien cette application, elle est élaboré dans le contexte du projet ANR Datalift dirigé par l'un de mes profs. Honte à moi de ne pas y avoir pensé


  8. #8
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    Salut

    Voilà 3 propositions de Q/R pour la FAQ. Tous les commentaires et améliorations dessus sont les bienvenus. Je pense aussi écrire une section sur Sesame.

    Qu'est-ce qu'une URI ?


    Une URI est l'identifiant d'une ressource (une « chose », qui peut être n'importe quoi) ; en particulier, en RDF, les nœuds du graphe sont identifiés par une URI.


    Vous êtes sans doute familier avec la notion d'URL (Uniform Ressource Locator) qui est ce qui s'affiche dans la barre d'adresse de votre navigateur quand vous naviguez sur Internet. Ces URL sont en fait un sous-ensemble des URI (Uniform Resource Identifier) ; toute URL est une URI, mais l'inverse n'est pas vrai. Une URI, comme son nom l'indique, identifie une ressource. Cette ressource peut être n'importe quoi, une personne, une ville, votre chat, etc.


    Lorsqu'on essaie d'accéder à une URI, en la mettant dans la barre d'adresse du navigateur, il est bien évident que la chose identifiée ne pourra pas elle-même être retournée en réponse : si vous décidez d'identifier votre chat par une URI, et que vous mettez cette URI dans votre navigateur, votre chat ne sera pas « aspiré » du canapé où il est endormi pour réapparaitre coincé dans la fenêtre du navigateur. Cependant, vous pourriez (mais ce n'est pas obligatoire) obtenir en réponse une représentation de la chose identifiée : par exemple une photo de votre chat. C'est la différence – subtile – entre une URI et une URL : l'URL localise un document, et permet d'accéder à ce document, l'URI identifie une chose, et permet (normalement, mais ce n'est pas obligatoire) d'accéder à une représentation de cette chose.



    Voir aussi : qu'est-ce que la négociation de contenu ?

    Qu'est-ce que la négociation de contenu ?


    La négociation de contenu est un mécanisme défini par la norme HTTP permettant à un serveur de retourner des réponses différentes pour une même URI. Ainsi, un internaute en france et un internaute aux états-unis pourraient voir 2 versions de la même URI, l'un en français, l'autre en anglais. La négociation de contenu s'appuie sur les en-têtes de la requêtes HTTP envoyée par le client pour déterminer quel contenu retourner.


    Dans le web sémantique où toutes les ressources sont identifiées à l'aide d'URI, la négociation de contenu est utilisée pour retourner une représentation « pour les humains » de la ressource (une page HTML) lorsque c'est un internaute qui accède à l'URI par son navigateur, ou bien une représentation « pour les machines » de la même ressource (un fichier RDF). Par exemple, DBPedia identifie la ville de Berlin par l'URI http://dbpedia.org/resource/Berlin. Si vous accédez à cette URI via votre navigateur en cliquant sur le lien, vous serez redirigés vers http://dbpedia.org/page/Berlin, qui est une page HTML. Mais si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF.

    Est-ce que RDF, c'est du XML ? Puis-je traiter des fichiers RDF avec des feuilles de style XSLT ?


    Non, RDF n'est pas du XML. RDF est un modèle de données dont l'une des sérialisations (= représentation) possibles est en XML. Cependant il n'existe pas de sérialisation canonique de RDF : c'est-à-dire que les mêmes données RDF peuvent être représentées par plusieurs fichiers différents. Par exemple, cet extrait de XML :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    <foaf:Person rdf:about="http://www.ex.com/annuaire#sf">
              <foaf:name>Sophie Fonfec</foaf:name>
    </foaf:Person>
    Et celui-là :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    <rdf:Description rdf:about="http://www.ex.com/annuaire#sf">
              <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person" />
              <foaf:name>Sophie Fonfec</foaf:name>
    </rdf:Description>
    Sont différents, et pourtant ils représentent les mêmes informations RDF (à savoir <http://www.ex.com/annuaire#sf> est une personne et a pour nom « Sophie Fonfec »).

    En théorie, il n'est donc pas conseillé de traiter des données RDF avec une feuille de style XSLT, car ces données RDF peuvent être dans d'autres sérialisations (comme N3), et la sérialisation des données peut varier.
    Dans la pratique, si on est sûr que le RDF à traiter est toujours en XML, et qu'on a des garanties sur sa sérialisation, ou qu'on prend en compte toutes les sérialisations possibles dans la feuille de style, il est possible de transformer du XML avec du XSLT.

    L'approche recommandée est d'utiliser des outils comme XSparql (http://xsparql.deri.org/) ou XSLT+SPARQL (http://berrueta.net/research/xsltsparql) permettant de combiner la flexibilité de SPARQL et la puissance du XSLT.

  9. #9
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Voir ci-après pour les commentaires :

    Citation Envoyé par Sapience Voir le message
    Qu'est-ce qu'une URI ?


    Une URI est l'identifiant d'une ressource (une « chose », qui peut être n'importe quoi) ; en particulier, en RDF, les nœuds du graphe sont identifiés par une URI. Pas toujours, cela peut être une chaîne de caractère, une date, ou autre chose, disons plutôt "la plupart du temps"


    Vous êtes sans doute familier avec la notion d'URL (Uniform Ressource Locator) qui est ce qui s'affiche dans la barre d'adresse de votre navigateur quand vous naviguez sur Internet. Ces URL sont en fait un sous-ensemble des URI (Uniform Resource Identifier) ; toute URL est une URI, mais l'inverse n'est pas vrai. Une URI, comme son nom l'indique, identifie une ressource. Cette ressource peut être n'importe quoi, une personne, une ville, votre chat, etc.


    Lorsqu'on essaie d'accéder à une URI, en la mettant dans la barre d'adresse du navigateur, il est bien évident que la chose identifiée ne pourra pas elle-même être retournée en réponse : si vous décidez d'identifier votre chat par une URI, et que vous mettez cette URI dans votre navigateur, votre chat ne sera pas « aspiré » du canapé où il est endormi pour réapparaitre réapparaître coincé dans la fenêtre du navigateur. Cependant, vous pourriez (mais ce n'est pas obligatoire) obtenir en réponse une représentation de la chose identifiée : par exemple une photo de votre chat. C'est la différence – subtile – entre une URI et une URL : l'URL localise un document, et permet d'accéder à ce document, l'URI identifie une chose, et permet (normalement, mais ce n'est pas obligatoire) d'accéder à une représentation de cette chose.



    Voir aussi : qu'est-ce que la négociation de contenu ?

    Qu'est-ce que la négociation de contenu ?


    La négociation de contenu est un mécanisme défini par la norme HTTP permettant à un serveur de retourner des réponses différentes pour une même URI. Ainsi, un internaute en france France et un internaute aux états-unis États-Unis pourraient voir 2 versions de la même URI, l'un en français, l'autre en anglais. La négociation de contenu s'appuie sur les en-têtes de la requêtes HTTP envoyée par le client pour déterminer quel contenu retourner.


    Dans le web Web sémantique où toutes les ressources sont identifiées à l'aide d'URI, la négociation de contenu est utilisée pour retourner une représentation « pour les humains » de la ressource (une page HTML) lorsque c'est un internaute qui accède à l'URI par son navigateur, ou bien une représentation « pour les machines » de la même ressource (un fichier RDF). Par exemple, DBPedia identifie la ville de Berlin par l'URI http://dbpedia.org/resource/Berlin. Si vous accédez à cette URI via votre navigateur en cliquant sur le lien, vous serez redirigés vers http://dbpedia.org/page/Berlin, qui est une page HTML. Mais si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF. Excepté si un humain demande l'adresse http://dbpedia.org/data/Berlin via son navigateur, il tombera sur la description RDF de l'URI et réciproquement avec l'adresse http://dbpedia.org/page/Berlin pour une machine qui tombera sur la description HTML. Il faut donc faire bien attention à utiliser le pattern de l'adresse correspondant à la négociation de contenu, soit avec DBPedia http://dbpedia.org/resource/XXX.

    Est-ce que RDF, c'est du XML ? Puis-je traiter des fichiers RDF avec des feuilles de style XSLT ?


    Non, RDF n'est pas du XML. RDF est un modèle de données dont l'une des sérialisations (= représentation) possibles est en XML. Cependant il n'existe pas de sérialisation canonique de RDF : c'est-à-dire que les mêmes données RDF peuvent être représentées par plusieurs fichiers différents. Par exemple, cet extrait de XML :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    <foaf:Person rdf:about="http://www.ex.com/annuaire#sf">
              <foaf:name>Sophie Fonfec</foaf:name>
    </foaf:Person>
    Et celui-là :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    <rdf:Description rdf:about="http://www.ex.com/annuaire#sf">
              <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person" />
              <foaf:name>Sophie Fonfec</foaf:name>
    </rdf:Description>
    Sont différents, et pourtant ils représentent les mêmes informations RDF (à savoir <http://www.ex.com/annuaire#sf> est une personne et qui a pour nom « Sophie Fonfec »).

    En théorie, il n'est donc pas conseillé de traiter des données RDF avec une feuille de style XSLT, car ces données RDF peuvent être dans d'autres sérialisations (comme N3), et la sérialisation des données peut varier.
    Dans la pratique, si on est sûr que le RDF à traiter est toujours en XML, et qu'on a des garanties sur sa sérialisation, ou qu'on prend en compte toutes les sérialisations possibles dans la feuille de style, il est possible de transformer du XML avec du XSLT.

    L'approche recommandée est d'utiliser des outils comme XSparql (http://xsparql.deri.org/) (c'est Nuno qui va être content, merci pour lui ) ou XSLT+SPARQL (http://berrueta.net/research/xsltsparql) permettant de combiner la flexibilité de SPARQL et la puissance du XSLT.

  10. #10
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    Merci pour tes retours

    en particulier, en RDF, les nœuds du graphe sont identifiés par une URI. Pas toujours, cela peut être une chaîne de caractère, une date, ou autre chose, disons plutôt "la plupart du temps"
    Oui en fait je ne pensais qu'aux ressources, pas aux litéraux; mais je ne voulais pas répéter ressource, donc bon...
    Autre proposition de formulation : "en particulier, dans les triplets RDF, qui sont des phrases <sujet> <verbe> <complément>, le <sujet> est identifié par une URI (sauf pour certains noeuds appelés "noeuds anonymes" ou "noeuds blancs")."

    Par exemple, DBPedia identifie la ville de Berlin par l'URI http://dbpedia.org/resource/Berlin. Si vous accédez à cette URI via votre navigateur en cliquant sur le lien, vous serez redirigés vers http://dbpedia.org/page/Berlin, qui est une page HTML. Mais si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF. Excepté si un humain demande l'adresse http://dbpedia.org/data/Berlin via son navigateur, il tombera sur la description RDF de l'URI et réciproquement avec l'adresse http://dbpedia.org/page/Berlin pour une machine qui tombera sur la description HTML. Il faut donc faire bien attention à utiliser le pattern de l'adresse correspondant à la négociation de contenu, soit avec DBPedia http://dbpedia.org/resource/XXX.
    Oui, cependant ni .../data/xxx ni .../page/xxx ne sont des identifiants de resources DBPedia, et il n'y a pas de mécanisme de négociation de contenu dans ce cas. Proposition d'ajout pour clarifier :

    (...) si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF (Note : il est toujours possible d'accéder directement à http://dbpedia.org/data/Berlin via son navigateur).

  11. #11
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Citation Envoyé par Sapience Voir le message
    Autre proposition de formulation : "en particulier, dans les triplets RDF, qui sont des phrases <sujet> <verbe> <complément>, le <sujet> est identifié par une URI (sauf pour certains noeuds appelés "noeuds anonymes" ou "noeuds blancs")."
    Les termes sujet, verbe et complément me dérangent, vaut mieux utiliser les "vrai" termes (sujet prédicat objet) en disant que les objets peuvent être, soit un litéral soit une URI.

    Citation Envoyé par Sapience Voir le message
    Oui, cependant ni .../data/xxx ni .../page/xxx ne sont des identifiants de resources DBPedia, et il n'y a pas de mécanisme de négociation de contenu dans ce cas
    Justement, il faut le préciser. Beaucoup trop de gens font cette erreurs.

    Citation Envoyé par Sapience Voir le message
    (...) si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF (Note : il est toujours possible d'accéder directement à http://dbpedia.org/data/Berlin via son navigateur).
    Trop vague pour moi.

  12. #12
    Membre éprouvé
    Avatar de Sapience
    Homme Profil pro
    Consultant sémantique & data à sparna.fr
    Inscrit en
    Avril 2005
    Messages
    305
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Consultant sémantique & data à sparna.fr
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2005
    Messages : 305
    Points : 915
    Points
    915
    Par défaut
    Citation Envoyé par snake264 Voir le message
    Les termes sujet, verbe et complément me dérangent, vaut mieux utiliser les "vrai" termes (sujet prédicat objet) en disant que les objets peuvent être, soit un litéral soit une URI.
    OK, cependant c'est plutôt pour un public novice, donc j'essaie de privilégier des termes compréhensibles même si ce ne sont pas rigoureusement les bons, dans un contexte où il ne s'agit pas d'expliquer RDF en détail, simplement de dire que les identifiants en RDF ce sont des URI. Donc proposition de reformulation un peu plus explicite :

    Une URI est l'identifiant d'une ressource (une « chose », qui peut être n'importe quoi) ; dans un triplet RDF, composé d'un sujet, d'un prédicat et d'un objet, le sujet est une URI (ou parfois un noeud anonyme, ou noeud blanc, qui n'a pas d'URI), le prédicat est une URI, et l'objet est soit une URI, soit un noeud blanc, soit un litéral.

    Trop vague pour moi.
    Proposition de reformulation :

    (...) si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF.
    Il est important de noter que ni .../page/Berlin, ni .../data/Berlin ne sont des identifiants de ressource dans DBPedia; seul .../resource/Berlin identifie une resource DBPedia, et .../page/Berlin et .../data/Berlin sont des représentations de cette ressource. Par ailleurs il est toujours possible d'accéder de façon directe (sans mécanisme de négociation de contenu) à http://dbpedia.org/page/Berlin et http://dbpedia.org/data/Berlin.

  13. #13
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Citation Envoyé par Sapience Voir le message
    Une URI est l'identifiant d'une ressource (une « chose », qui peut être n'importe quoi) ; dans un triplet RDF, composé d'un sujet, d'un prédicat et d'un objet, le sujet est une URI (ou parfois un noeud anonyme, ou noeud blanc, qui n'a pas d'URI), le prédicat est une URI, et l'objet est soit une URI, soit un noeud blanc, soit un litéral.
    Beaucoup mieux

    Citation Envoyé par Sapience Voir le message
    si un programme accède à la même URI en stipulant dans l'entête de la requête qu'il accepte du RDF, il obtiendra http://dbpedia.org/data/Berlin, qui est un document RDF.
    Il est important de noter que ni .../page/Berlin, ni .../data/Berlin ne sont des identifiants de ressource dans DBPedia; seul .../resource/Berlin identifie une resource DBPedia, et .../page/Berlin et .../data/Berlin sont des représentations de cette ressource. Par ailleurs il est toujours possible d'accéder de façon directe (sans mécanisme de négociation de contenu) à http://dbpedia.org/page/Berlin et http://dbpedia.org/data/Berlin.
    Beaucoup mieux aussi

  14. #14
    Membre actif
    Avatar de April Fool
    Homme Profil pro
    Fou d'avril
    Inscrit en
    Février 2012
    Messages
    99
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Fou d'avril

    Informations forums :
    Inscription : Février 2012
    Messages : 99
    Points : 215
    Points
    215
    Par défaut
    Voici quelques remarques sur la FAQ actuelle.

    Avec quels langages de programmation connus peut-on faire des applications pour le Web sémantique ?
    Il pourrait être fait mention de dotNetRDF, une librairie pour RDF écrite en C# et qui est apparemment pas mal utilisée.

    Quelles sont les principales technologies liées au Web sémantique ?
    À mon avis, pour cette question, il faudrait mentionner SPARQL. Je pense que SPARQL est aussi essentiel que OWL, si ce n'est plus, pour le Web sémantique.

    Par ailleurs, il faudrait plutôt mettre un lien faire la spec de OWL 2 plutôt qu'OWL 1. La première chose que l'on voit en cliquant sur le lien, c'est qu'il y a une nouvelle version disponible.

    Quels sont les différents formats de triplets RDF ?
    Il y a le format RDF/XML, qui prend sa syntaxe de XML, donc très lisible mais aussi très verbeux.
    Personnellement, je ne trouve pas RDF/XML très lisible, au contraire. Cela dit, l'avantage est que tout navigateur Web et éditeur de texte sait colorer la syntaxe, ce qui aide. Mais sinon, je trouve Turtle bien plus lisible.

    Sinon, on peut mentionner JSON-LD, qui devrait devenir un standard W3C, soit à la fin de l'année, soit l'année prochaine, si tout va bien. Il est donc a priori plus important de le mentionner que RDF/JSON.

    Ensuite, N3 (Notation 3), la plus simple : elle consiste à écrire un simple triplet avec ses composants séparés par un point, de la forme <sujet>.<prédicat>.<objet>.
    Je crois que tu confonds avec N-Triples. N3 est un sur-ensemble de Turtle, qui permet d'écrire des graphes RDF ainsi que d'autres choses plus expressives, telles que des règles par exemple. Par ailleurs, les composants ne sont pas séparés par un point. Seuls les triplets sont séparés par un point en N-Triples.

    À noter que Turtle sera standardiser par le W3C, de même que N-Triples.

    On peut encore ajouter à la liste : RDFa, pas exactement un langage de "sérialisation" de graphes RDF mais permet tout de même de définir des triplets.

    Enfin, on peut aussi mentionner HDT, un format de compression de graphes RDF, pour l'échange de gros ensembles de données.

    Comment transformer sa base de données relationnelle en triplets RDF ?
    Ce serait bien de parler de Direct Mapping et R2RML, qui sont tout de même déjà des Candidate Recommendations.

    Qu'est-ce que OWL ?
    OWL (ou Ontology Web Language)
    OWL est le Web Ontology Language.

    OWL comprend trois sous langages :

    OWL Lite, [...] ;
    OWL DL [...] ;
    OWL Full, [...].
    Je mettrais plutôt :

    OWL comprend, dans sa dernière version officielle (OWL 2), cinq sous langages :

    OWL 2 DL, [...] ;
    OWL 2 EL, sous-ensemble de OWL 2 DL permettant de classifier efficacement des ontologies ayant une large terminologie ;
    OWL 2 QL, sous-ensemble de OWL 2 DL permettant de faire des requêtes efficaces sur des larges ensemble de données, que l'on peut d'ailleurs stocker dans des bases de données relationnelles ;
    OWL 2 RL, sous-ensemble de OWL 2 DL permettant une implémentation sous forme de règles de déduction, ces règles étant également compatibles avec la sémantique de OWL 2 Full ;
    OWL 2 Full, [...].
    On peut garder le texte déjà en place pour OWL DL et OWL Full.
    OWL Lite est un peu un sous-langage de merde, à la fois pas assez expressif (des constructeurs très utiles et pas franchement couteux ne sont pas autorisés) et en même temps trop expressif, de complexité exponentielle (des constructeurs très peu utiles et couteux sont autorisés). À mon avis, mieux vaut ne garder que OWL 2 comme langage d'ontologie officiel et oublier OWL Lite à tout jamais.

  15. #15
    Rédacteur/Modérateur
    Avatar de Metafire18
    Homme Profil pro
    Ingénieur de recherche Orange Labs
    Inscrit en
    Décembre 2007
    Messages
    777
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Territoire de Belfort (Franche Comté)

    Informations professionnelles :
    Activité : Ingénieur de recherche Orange Labs

    Informations forums :
    Inscription : Décembre 2007
    Messages : 777
    Points : 1 894
    Points
    1 894
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par April Fool Voir le message

    OWL est le Web Ontology Language.
    Je ne comprends pas cette remarque

  16. #16
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Citation Envoyé par April Fool Voir le message
    Il pourrait être fait mention de dotNetRDF, une librairie pour RDF écrite en C# et qui est apparemment pas mal utilisée.
    Exact.

    Citation Envoyé par April Fool Voir le message
    À mon avis, pour cette question, il faudrait mentionner SPARQL. Je pense que SPARQL est aussi essentiel que OWL, si ce n'est plus, pour le Web sémantique.

    Par ailleurs, il faudrait plutôt mettre un lien faire la spec de OWL 2 plutôt qu'OWL 1. La première chose que l'on voit en cliquant sur le lien, c'est qu'il y a une nouvelle version disponible.
    Exact

    Citation Envoyé par April Fool Voir le message
    Personnellement, je ne trouve pas RDF/XML très lisible, au contraire. Cela dit, l'avantage est que tout navigateur Web et éditeur de texte sait colorer la syntaxe, ce qui aide. Mais sinon, je trouve Turtle bien plus lisible.
    Il est le plus facile à lire dans le sens que tout le monde connais le XML et sais le lire. Alors que Turtle il faut d'abord apprendre la syntaxe (même si en effet elle n'est pas très dure) car c'est un format absolument inconnu quand on sort de ce domaine. Mais je suis d'accord avec toi sur le fait que Turtle et bien plus lisible.

    Je préciserai donc tout cela.

    Citation Envoyé par April Fool Voir le message
    Sinon, on peut mentionner JSON-LD, qui devrait devenir un standard W3C, soit à la fin de l'année, soit l'année prochaine, si tout va bien. Il est donc a priori plus important de le mentionner que RDF/JSON.
    Exact, ils ne savent pas si ils vont le standardiser pour RDF 1.1 (idem pour Turtle et N-Triples) ou la prochaine version. Cela ne fait pas partie des "tâches" prioritaires de RDF 1.1.

    Personnellement j'ai un gros faible pour JSON-LD, même TBL à WWW a dit que JSON devrait remplacer XML et je suis bien d'accord. C'est le format que j'utilise dans mes app.

    Citation Envoyé par April Fool Voir le message
    Je crois que tu confonds avec N-Triples.
    Exact.

    Citation Envoyé par April Fool Voir le message
    On peut encore ajouter à la liste : RDFa, pas exactement un langage de "sérialisation" de graphes RDF mais permet tout de même de définir des triplets.
    Mmmm pas trop le sujet dans cette Q/A.

    Citation Envoyé par April Fool Voir le message
    Enfin, on peut aussi mentionner HDT, un format de compression de graphes RDF, pour l'échange de gros ensembles de données.
    Je préfère éviter, c'est qu'une submission, et encore beaucoup de questions sur certains bugs le concernant. Mais nul doute que ça deviendra un standard de toute façon On va attendre qu'il devienne une draft officielle.

    Citation Envoyé par April Fool Voir le message
    Ce serait bien de parler de Direct Mapping et R2RML, qui sont tout de même déjà des Candidate Recommendations.
    Exact.

    Citation Envoyé par April Fool Voir le message
    On peut garder le texte déjà en place pour OWL DL et OWL Full.
    Exact, on modifiera ça.

    Citation Envoyé par April Fool Voir le message
    OWL Lite est un peu un sous-langage de merde, à la fois pas assez expressif (des constructeurs très utiles et pas franchement couteux ne sont pas autorisés) et en même temps trop expressif, de complexité exponentielle (des constructeurs très peu utiles et couteux sont autorisés). À mon avis, mieux vaut ne garder que OWL 2 comme langage d'ontologie officiel et oublier OWL Lite à tout jamais.
    Je suis d'accord, je me pose la question si il ne faut pas faire 2 parties, une sur OWL 1 et une autre sur OWL 2. En indiquant les avantages à passer à OWL 2 et les différences principales.

    Il est prévu une mise à jour de la FAQ dans pas longtemps, tes remarques y seront intégrées.

  17. #17
    Membre actif
    Avatar de April Fool
    Homme Profil pro
    Fou d'avril
    Inscrit en
    Février 2012
    Messages
    99
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Fou d'avril

    Informations forums :
    Inscription : Février 2012
    Messages : 99
    Points : 215
    Points
    215
    Par défaut
    Citation Envoyé par Metafire18 Voir le message
    Je ne comprends pas cette remarque
    Comme il y a un smiley clin d'oeil, je peux supposer que c'est ironique ou que c'est une blague, mais comme je ne comprends pas la blague je vais quand même répondre sérieusement.

    OWL est le Web Ontology Language et non pas l'Ontology Web Language comme indiqué dans la FAQ.

  18. #18
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Voilà, toutes les remarques/ajouts/modifications discutées jusqu'ici seront répertoriées dans la prochaine version de la FAQ

  19. #19
    Membre actif
    Avatar de April Fool
    Homme Profil pro
    Fou d'avril
    Inscrit en
    Février 2012
    Messages
    99
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Fou d'avril

    Informations forums :
    Inscription : Février 2012
    Messages : 99
    Points : 215
    Points
    215
    Par défaut
    Qu'est-ce qu'une URI ?
    Ne faudrait-il pas maintenant demander "qu'est-ce qu'un(e) IRI ?".
    Les IRI sont un standard RFC depuis janvier 2005.
    SPARQL 1.0, standardisé en janvier 2008 (déjà plus de 4 ans et demi !) n'utilise que la notion d'IRI. OWL 2, standardisé en octobre 2009, n'utilise que les IRI. RDF 1.1, standardisé en 2042 parce que le WG n'arrive pas à se mettre d'accord, utilisera les IRI au lieu des URI. Les URI sont amenés à disparaitre.

    Au passage, pourquoi dire "une URI" alors qu'il s'agit d'un identifiant ?

  20. #20
    Expert éminent sénior

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Datascientist chez Leboncoin
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Points : 13 312
    Points
    13 312
    Par défaut
    Je suis d'accord, mais pour le moment le terme IRI n'est pas totalement rentrée dans les moeurs, tout le monde (ou quasiment) utilise encore le terme d'URI. Mais c'est une bonne idée pour une futur mise à jour. A mon avis le terme ne sera vraiment utilisé que lorsque RDF 1.1 sera sorti, mais comme tu dit il y a encore quelques discussions dessus.

    Ensuite "une URI" tout simplement parce que je n'ai jamais entendu prononcé autrement en français par qui que ce soit. Et pourtant j'en ai fait des conf et aussi discuté avec beaucoup de personnes travaillant dans ce domaine

    De toute façon l'usage hésite comme le dit si bien Wikitionaire : http://fr.wiktionary.org/wiki/URI

Discussions similaires

  1. Venez participer à la FAQ Delphi !
    Par Giovanny Temgoua dans le forum Contribuez
    Réponses: 45
    Dernier message: 06/02/2021, 12h23
  2. FAQ Web sémantique
    Par snake264 dans le forum Web sémantique
    Réponses: 0
    Dernier message: 12/09/2012, 02h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo