PCkurier - poradnik menedżera IT  
Szukaj:
    
Pomoc
 w Archiwum  w Wiadomościach
 
  Akademia   IT Track   Koszty IT
 
Strona główna
PCkurier PLUS
Wiadomości
Nowy numer
Archiwum
Kurs HTML
Zasoby WWW
Oferujemy
Ostatnie wydanie PCkurier PLUS warto mieć nie tylko ze względów kolekcjonerskich, ale przede wszystkim dlatego, że przedstawia ono sposoby bezpiecznego korzystania z najnowszej wersji Windows Server 2003. Ekstra dodatkiem jest już pełna, 180-dniowa wersja próbna systemu w wersji angielskiej, która pozwala zapoznać się z możliwościami produktu.
PCkurier PLUS jest już do nabycia na naszej stronie !
Wydajemy
CRN
Enter
PCkurier 14/2002 >> DLA PRAKTYKÓW >> ALGORYTMY

Standard do opisu zasobów internetowych

Krótsza droga do informacji

Autor: Paweł Stroiński
Język XML zadomowił się już w Internecie. Kolejnym etapem jego ekspansji może stać się upowszechnienie standardu RDF (Ressource Description Framework), którego animatorem jest również konsorcjum W3C. Ten format opisu internetowych zasobów stosuje wiele rozwiązań znanych z XML, lecz ma bardziej rozbudowaną gramatykę i semantykę.
Główne zastosowania RDF
- wyszukiwanie, katalogowanie i indeksowanie zasobów (np. internetowe biblioteki, intranetowe bazy wiedzy),
- ochrona praw autorskich twórców informacji,
- ścieżki informacji, mapy serwisów internetowych,
- kontrola zawartości, filtrowanie informacji,
- personalizacja (P3P),
- autoryzacja dostępu.

Burzliwa historia Internetu pokazała, że konieczne jest opracowanie takiego sposobu publikowania treści, aby były one czytelne zarówno dla człowieka, jak i maszyny. W tej chwili stosuje się już wiele aplikacji udostępniających bazy danych na stronach WWW, pora więc na programy umiejące te informacje zbierać. Niestety, język HTML ma tu niewielkie możliwości; dopiero XML znacznie ułatwia sprawę, pozwalając publikować informacje w sposób czytelny dla maszyn. Trudno jednak wyobrazić sobie program potrafiący całkowicie automatycznie znaleźć potrzebną informację na podstawie samych tylko nazw i struktury znaczników. Rozwiązanie wykorzystujące techniki sztucznej inteligencji zakrawa dziś na utopię, jednak realną alternatywą jest uzupełnienie publikowanych treści o odpowiednią semantykę.

Nieporządek inspiracją

Korelacje ważniejszych formatów związanych z Internetem i W3C

Próby stosowania metainformacji w dokumentach XML wykazały, że na pewnym poziomie uogólnienia dokumenty takie mogłyby być do siebie dość podobne. Pojawiła się więc możliwość normalizacji, której owocem jest zbiór specyfikacji RDF. Specyfikacje te są uniwersalne, ponieważ nie narzucają sposobu opisania treści. Służą do tego autonomicznie definiowane słowniki, składające się z określników, takich jak np. copyright, title. Oczywiście takie indywidualne podejście sprzyja sile wyrazu metainformacji. W założeniach standard RDF ma przede wszystkim gwarantować:

  • łatwość tworzenia słowników (ujętych w schematach RDF) przy jednoczesnym zachowaniu ich czytelności dla aplikacji korzystających z nich po raz pierwszy. RDF jest otwarty na nowe inicjatywy w zakresie klasyfikowania metainformacji - można np. stworzyć specjalny słownik służący do opisu czasopism internetowych. Ujednolicone specyfikacje takich słowników muszą być ogólnie dostępne w Sieci, w celu uniknięcia słownikowej wieży Babel.
  • niezależność części składniowej od słownikowej - analogicznie do oddzielenia formy od treści w standardzie XML. RDF pozwala nawet wybiórczo łączyć wypróbowane już słowniki z nowymi, potrzebnymi do konkretnych zastosowań.
  • niezmienność formatu - nie może się zdarzyć, że po kilku latach metainformacje staną się nieczytelne bez użycia specjalizowanych konwerterów; gwarantuje to wykorzystanie XML i wymóg powszechnej dostępności słowników.
  • możliwość określenia formatu danych (np. data, liczba) i sprawdzenia ich poprawności, co jest warunkiem ich prawidłowego przetwarzania.

Nie tylko WWW

Najprostsze stwierdzenie RDF

Z szeroko rozumianym pojęciem metainformacji wiąże się wiele inicjatyw (często starszych niż XML), których dorobkiem są m.in. specyfikacje Warwick Schema (z roku 1996!), PICS, RSS i Dublin Core. Większość wcześniejszych prac można przekształcić do postaci słowników, czego przykładem PICS 2.0. Niektóre starsze techniki przenoszone są dziś na platformę RDF, przykładowo migracja standardu P3P umożliwia włączanie etykiet PICS do informacji o personalizacji. Podobnie jak XML stał się spoiwem danych, tak RDF staje się spoiwem semantyki.

Możliwości RDF nie ograniczają się do opisu zasobów internetowych. Specyfikacja stawia tylko jeden warunek - zasoby muszą być możliwe do wskazania za pomocą identyfikatora URI (Uniform Resource Identifier). URI stanowi nadzbiór URL i URN, można nim więc zaadresować nie tylko witrynę, ale również książkę, np. urn:isbn: 83-204-2627-8.

IsaViz 1.0

Model danych w RDF jest bardzo prosty. Jego podstawą jest tzw. stwierdzenie RDF, którego podmiotem jest opisywany zasób, predykatem - opisująca go własność (zaczerpnięta ze słownika), obiektem - wartość np. tekstowa lub wskazanie na inny zasób. Jeden dokument może zawierać dowolnie wiele stwierdzeń, które mogą się wzajemnie do siebie odwoływać jako do zasobów.

Standard doczekał się już narzędzia projektowania IsaViz, które pozwala modyfikować model RDF przedstawiony w formie graficznej. Program powstał pod egidą W3C, dostępny jest za darmo i korzysta z opracowanego przez HP interfejsu API do obsługi opisów RDF w języku Java (Jena).

* * *

Zwolennicy RDF często porównują go do hipertekstu. Format ten swoimi możliwościami znacznie wyprzedza wszystkie poprzednie, niezbyt udane inicjatywy semantyczne. Może więc powstać wrażenie, że technika ta nie jest jeszcze potrzebna. Niezupełnie jest to prawda - szczególnie dziś, po sukcesie XML, widoczne stają się korzyści ze stosowania RDF.

Autor jest twórcą popularnego internetowego kursu języka XML i edytora XML Infox.

Stwierdzenie opisujące portal, używające słownika Dublin Core. Element Bag to jeden z rodzajów pojemników grupujących opisy.
<?xml version="1.0"?>

<rdf:RDF

  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

  xmlns:dc="http://purl.org/metadata/dublin_core#">

    <rdf:Description about="http://www.gazeta.pl/">

      <dc:Title>Gazeta.pl</dc:Title>

      <dc:Description>Bogaty w treść portal, którego głównym atutem

      jest potencjał Wyborczej.</dc:Description>

      <dc:Publisher>Wydawnictwo Agora S.A.</dc:Publisher>

      <dc:Format>text/html</dc:Format>

      <dc:Language>pl</dc:Language>

      <dc:Subject>

        <rdf:Bag>

          <rdf:li>polityka</rdf:li>

          <rdf:li>ekonomia i gospodarka</rdf:li>

          <rdf:li>kultura</rdf:li>

          <rdf:li>edukacja</rdf:li>

        </rdf:Bag>

      </dc:Subject>

    </rdf:Description>

</rdf:RDF>

Nawigacja
wybierz dział
i/lub numer,
a następnie rok
lub podaj ID artykułu
Poprzedni artykuł
Następny artykuł
Najświeższe artykuły na ten temat
7/2003 - J2ME w praktyce - Wzorce projektowe
23/2002 - Wskaźnikiem szybciej - Programowanie w C#
22/2002 - Graficzne C (cz. 2) - Programowanie grafiki
Jeśli masz uwagi lub opinie, którymi chcesz podzielić się z innymi, wpisz je do tego formularza
Pseudonim *
Hasło *
Tytuł komentarza
Treść
Ocena
1 2 3 4 5 6 7 8 9 10
*) Jeśli nie masz hasła, to najpierw się zarejestruj, jeśli zapomniałeś hasła, to Ci je przypomnimy
Płyty CD
Podaj nazwę programu
Szukaj w:
nazwa,
folder,
opis
Sortuj wg:
nazwy
numeru
Wiadomości | Nowy numer | Archiwum | Akademia | PCkurier PLUS | IT.Forum | IT Track
Koszty IT | Produkt Roku | Prenumerata | Zasoby WWW | Kurs HTML
Lupus sp. z o.o. | Polityka prywatności | Wszelkie prawa zastrzeżone