Język
XML zadomowił się już w Internecie. Kolejnym etapem jego ekspansji może
stać się upowszechnienie standardu RDF (Ressource Description
Framework), którego animatorem jest również konsorcjum W3C. Ten format
opisu internetowych zasobów stosuje wiele rozwiązań znanych z XML, lecz
ma bardziej rozbudowaną gramatykę i semantykę.
Główne zastosowania RDF |
- wyszukiwanie, katalogowanie i indeksowanie zasobów (np. internetowe biblioteki, intranetowe bazy wiedzy),
- ochrona praw autorskich twórców informacji,
- ścieżki informacji, mapy serwisów internetowych,
- kontrola zawartości, filtrowanie informacji,
- personalizacja (P3P),
- autoryzacja dostępu. |
Burzliwa historia Internetu pokazała, że konieczne
jest opracowanie takiego sposobu publikowania treści, aby były one
czytelne zarówno dla człowieka, jak i maszyny. W tej chwili stosuje się
już wiele aplikacji udostępniających bazy danych na stronach WWW, pora
więc na programy umiejące te informacje zbierać. Niestety, język HTML
ma tu niewielkie możliwości; dopiero XML znacznie ułatwia sprawę,
pozwalając publikować informacje w sposób czytelny dla maszyn. Trudno
jednak wyobrazić sobie program potrafiący całkowicie automatycznie
znaleźć potrzebną informację na podstawie samych tylko nazw i struktury
znaczników. Rozwiązanie wykorzystujące techniki sztucznej inteligencji
zakrawa dziś na utopię, jednak realną alternatywą jest uzupełnienie
publikowanych treści o odpowiednią semantykę.
Nieporządek inspiracją
|
Korelacje ważniejszych formatów związanych z Internetem i W3C |
Próby stosowania metainformacji w dokumentach XML
wykazały, że na pewnym poziomie uogólnienia dokumenty takie mogłyby być
do siebie dość podobne. Pojawiła się więc możliwość normalizacji,
której owocem jest zbiór specyfikacji RDF. Specyfikacje te są
uniwersalne, ponieważ nie narzucają sposobu opisania treści. Służą do
tego autonomicznie definiowane słowniki, składające się z określników,
takich jak np. copyright, title. Oczywiście takie indywidualne
podejście sprzyja sile wyrazu metainformacji. W założeniach standard
RDF ma przede wszystkim gwarantować:
- łatwość tworzenia słowników (ujętych w schematach RDF) przy
jednoczesnym zachowaniu ich czytelności dla aplikacji korzystających z
nich po raz pierwszy. RDF jest otwarty na nowe inicjatywy w zakresie
klasyfikowania metainformacji - można np. stworzyć specjalny słownik
służący do opisu czasopism internetowych. Ujednolicone specyfikacje
takich słowników muszą być ogólnie dostępne w Sieci, w celu uniknięcia
słownikowej wieży Babel.
- niezależność części składniowej od
słownikowej - analogicznie do oddzielenia formy od treści w standardzie
XML. RDF pozwala nawet wybiórczo łączyć wypróbowane już słowniki z
nowymi, potrzebnymi do konkretnych zastosowań.
- niezmienność
formatu - nie może się zdarzyć, że po kilku latach metainformacje staną
się nieczytelne bez użycia specjalizowanych konwerterów; gwarantuje to
wykorzystanie XML i wymóg powszechnej dostępności słowników.
- możliwość
określenia formatu danych (np. data, liczba) i sprawdzenia ich
poprawności, co jest warunkiem ich prawidłowego przetwarzania.
Nie tylko WWW
|
Najprostsze stwierdzenie RDF |
Z szeroko rozumianym pojęciem metainformacji wiąże
się wiele inicjatyw (często starszych niż XML), których dorobkiem są
m.in. specyfikacje Warwick Schema (z roku 1996!), PICS, RSS i Dublin
Core. Większość wcześniejszych prac można przekształcić do postaci
słowników, czego przykładem PICS 2.0. Niektóre starsze techniki
przenoszone są dziś na platformę RDF, przykładowo migracja standardu
P3P umożliwia włączanie etykiet PICS do informacji o personalizacji.
Podobnie jak XML stał się spoiwem danych, tak RDF staje się spoiwem
semantyki.
Możliwości RDF nie ograniczają się do opisu zasobów
internetowych. Specyfikacja stawia tylko jeden warunek - zasoby muszą
być możliwe do wskazania za pomocą identyfikatora URI (Uniform Resource
Identifier). URI stanowi nadzbiór URL i URN, można nim więc zaadresować
nie tylko witrynę, ale również książkę, np. urn:isbn: 83-204-2627-8.
|
IsaViz 1.0 |
Model danych w RDF jest bardzo prosty. Jego podstawą
jest tzw. stwierdzenie RDF, którego podmiotem jest opisywany zasób,
predykatem - opisująca go własność (zaczerpnięta ze słownika), obiektem
- wartość np. tekstowa lub wskazanie na inny zasób. Jeden dokument może
zawierać dowolnie wiele stwierdzeń, które mogą się wzajemnie do siebie
odwoływać jako do zasobów.
Standard doczekał się już narzędzia projektowania
IsaViz, które pozwala modyfikować model RDF przedstawiony w formie
graficznej. Program powstał pod egidą W3C, dostępny jest za darmo i
korzysta z opracowanego przez HP interfejsu API do obsługi opisów RDF w
języku Java (Jena).
* * *
Zwolennicy RDF często porównują go do hipertekstu.
Format ten swoimi możliwościami znacznie wyprzedza wszystkie
poprzednie, niezbyt udane inicjatywy semantyczne. Może więc powstać
wrażenie, że technika ta nie jest jeszcze potrzebna. Niezupełnie jest
to prawda - szczególnie dziś, po sukcesie XML, widoczne stają się
korzyści ze stosowania RDF.
Autor jest twórcą popularnego internetowego kursu języka XML i edytora XML Infox.
Stwierdzenie opisujące portal, używające słownika Dublin Core. Element Bag to jeden z rodzajów pojemników grupujących opisy.
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/metadata/dublin_core#">
<rdf:Description about="http://www.gazeta.pl/">
<dc:Title>Gazeta.pl</dc:Title>
<dc:Description>Bogaty w treść portal, którego głównym atutem
jest potencjał Wyborczej.</dc:Description>
<dc:Publisher>Wydawnictwo Agora S.A.</dc:Publisher>
<dc:Format>text/html</dc:Format>
<dc:Language>pl</dc:Language>
<dc:Subject>
<rdf:Bag>
<rdf:li>polityka</rdf:li>
<rdf:li>ekonomia i gospodarka</rdf:li>
<rdf:li>kultura</rdf:li>
<rdf:li>edukacja</rdf:li>
</rdf:Bag>
</dc:Subject>
</rdf:Description>
</rdf:RDF>
|
|