Next: 4.2 Tutkimusta Up: 4 Tietokantamuunnokset Previous: 4 Tietokantamuunnokset

4.1 Tietokantojen ja tekstidokumenttien eroja

Tietokannat ovat olleet käytössä jo pitkään verrattuna rakenteisiin dokumentteihin. Niiden tärkeimpiä ominaisuuksia ovat tehokkaat haut. Tiedon etsiminen on oleellinen osa myös tavallisilla dokumenteilla. SGML-muotoisessa dokumentissa voidaan tehdä paljon monipuolisempia hakuja kuin tavallisessa dokumentissa. Voidaan esimerkiksi hakea dokumentteja, joissa on mainittu kirjailijan osoite (olettaen, että se on DTD:ssä määritelty). Em. haku pelkän tekstin perusteella ei olisi kovin mielekästä, sillä etsimällä esimerkiksi dokumentteja, joissa on sana ``osoite'', ei löydetä sellaisia dokumentteja, joissa kirjailijan osoite mainitaan ilman ``osoite''-sanaa. Vastaavasti voisi löytyä myös dokumentteja, joissa puhutaan osoitteista, mutta ei mainita kirjailijan osoitetta. Asiaa voidaan vielä vaikeuttaa yhdistämällä hakuun vaikkapa puhelinnumero ja se, että dokumenttien tulisi olla tietyn kielisiä. Nämä tiedot on luonnollisesti oltava myös DTD:ssä määriteltynä, jotta niitä voitaisiin käyttää haussa.

Tietokannoissa on yleensä kyse siitä, että tieto voi muuttua nopeassakin tahdissa, mutta tiedon esitystapa tai tietokannan rakenne on hyvinkin pysyvä. Esimerkiksi pankin asiakastietokanta on tällainen: asiakkaan tilitiedot voivat muuttua useita kertoja päivässä, mutta tietokannan rakenne - asiakkaan kuvaileva taulu - tuskin muuttuu edes useassa vuodessa.

Tekstimuotoisen tiedon perinteistä käsittelyä kuvaa se, että kun teksti on kerran kirjoitettu, siihen ei juuri tule muutoksia. Tekstin esittämistapaa sen sijaan on jouduttu muuttamaan siirryttäessä tekstinkäsittelyohjelmasta toiseen tms. Esimerkki tällaisesta tilanteesta on vaikkapa väitöskirja: kerran kirjoitettua väitöskirjaa tuskin kukaan rupeaa muuttelemaan, mutta se voidaan ehkä haluta paperitulostuksena, WWW:llä, CD-ROMilla ja niin edelleen.

Tietokantojen ja dokumentoinnin eroista on erityisesti lähteessä [Ray96].

Näin erilaisista lähtökohdista tulevien medioiden yhdistäminen on ensinäkemältä vaikea tehtävä ja kieltämättä käytännössäkin vaikeuksia on. Yksinkertaisia periaatteita on kuitenkin esitetty ja ohjelmistoja on luotu näiden periaatteiden mukaan.


Heikki Toivonen -- Last modified 28.1.1997 --