Maandag, Maart 17, 2008

Calais kan springplank voor semantic webapps vormen


Calais
is een door Reuters ontwikkelde webservice die teksten aanvult met metadata in RDF formaat.

Aan Calais kun je teksten in plain text formaat of HTML aanleveren. Calais probeert de aangeleverde tekst te analyseren met behulp van natural language processing, door van reeds aangeleverde teksten te leren, en andere technieken (waaronder vermoed ik ook het herkennen van
microformats) . Vervolgens stuurt het de tekst terug naar de verzender, geannoteerd met RDF tags voor dingen die Calais als object herkent: personen, bedrijven, landen etcetera.

Zie hieronder een voorbeeld van een nieuwsbericht van CNN dat ik naar Calais heb gestuurd en vervolgens door de Calais engine aangevuld is met meta-data.


 

Zoals je ziet herkent Calais personen, bedrijven, landen, organisaties en meer. Het begrijpt zelfs bijvoorbeeld dat Alexander Ivanko woordvoerder is van de VN, wat je ziet als je in de
Calais Viewer met je muis over de tekst gaat.



Omdat Calais de gesubmitte pagina opslaat in een database, kan het in theorie alle gerelateerde informatie die het over Alexander Ivanko kent uit andere pagina's, terug geven. Indien Alexander Ivanko ergens op het web een URI heeft met daaraan profielinformatie gekoppeld kan de informatie nog completer worden.

Het is erg fraai om het semantic web zo in actie te zien. Calais biedt een service die webbouwers per vandaag kunnen gebruiken om semantic applicaties te bouwen. Om met Tim Berners-Lee te spreken: "It's time to just go do it".

Stiekem slaat Calais ook een brug tussen de
top-down en de bottom-up benadering van het semantic web. Het maakt namelijk van beide technieken gebruik, de best of both worlds dus.
Posted by Peter at 20:59:26 | Permanent Link | Comments (1) |
Replies
1 - Dat ziet er idd erg gaaf uit! Ik ga er meteen induiken :) (Comment this)

Geschreven door Anoniem at 2008/03/26 - 18:11:06
Schrijf een reply