Je commence une série de posts techniques sur le web sémantiques, qui reprendra différentes pages que j'ai créées sur le wiki du RIPESS Europe
La notion de Web Sémantique se réfère aux technologies qui composent la prochaine évolution du World Wide Web, le web des données (web of data, Linked data) Il s'agit passer des données textes actuelles, destinées aux humains mais peu accessible aux machines - qui peinent à en décrypter le sens avec des algorithmes - à une classification en amont des informations, de manière à faciliter la mise en relation des données entre elles selon leur signification et non pas la manière dont elles sont écrites... Cette mise en relation "sémantique" est par exemple capable de distinguer Victor Hugo (l'auteur) du Boulevard Victor Hugo, ce qu'un algorithme ne peut pas faire actuellement autrement qu'en s'appuyant sur un contexte issu des données personnelles de l'utilisateur (problematique de la confidentialité).
Bien sûr, un travail supplémentaire va être exigé de tous pour pouvoir "marquer" l'information publiée systématiquement. Mais des outils nouveaux sont mis en oeuvre pour faciliter cela, si la demande est là. On peut citer par exemple le système OpenCalais, développé par Thomson/Reuters qui est capable d'analyser les dépêches d'actualités utilisées par tous les mass-medias européens afin d'identifier et de marquer sémantiquement les articles en reconnaissant les lieux, les dates, les personnalités ou encore les noms des grandes entreprises. Démo : collez un texte d'actualité dans cette page
Les standards du web sémantique, toutes reliées à l'utilisation du RDF, sont utilisées ces temps-ci par de plus en plus d'agences gouvernementales (via le mouvement "opendata") ou de librairies nationales, instituts de recherches, etc..
L'ensemble des technologies est composé des spécifications du W3C, et de centaines d'outils, logiciels, extensions...qui implémentent ces standards et permettent à différents systèmes d'interagir avec la même base technique.
Toutes ces technologies sont open-source, souvent bien documentée, discutée et améliorées chaque jour, que ce soit sur les mailing-listes du W3C ou sur des forums spécialisés. On ne peut pas parler de vérouillage technologique ou idéologique : tout un chacun peut créer son propre ensemble de données sémantiquement liées, en utilisant l'ensemble des outils disponibles tout en se coupant complétement du reste du web des données.
Principes du Web des données
- 1. Utiliser le(s) format(s) RDF
- 2. Utiliser des URI pour nommer (exemple : http://monsite.com/produits/Banane )
- 3. Lorsqu'on suit cette URI, on doit arriver sur des données sématiques (RDF ou HTML+RDF )
- 4. Dans ces informations, on peut trouver d'autres URI vers d'autres informations
Source : Slides François Scharffe
La compatibilité d'un site avec la méthode Linked Data pourrait être mesurée par cette échelle proposée par Tim Berner Lee (l'un des créateurs du web )














Nous serons
présent lors du forum des usages coopératifs qui se tiendra à Brest du 30 juin
au 2 juillet, afin de participer aux ateliers dédiés à la 
Grâce au service de