Älä keksi leijonaa uudelleen!

Luen parhaillaan Louis Rosenfeldin ja Peter Morvillen vuosituhannen vaihteessa kirjoittamaa klassikkoteosta “Information Architecture for the World Wide Web” (O’Reilly, 2002). Kirja käsittelee sitä, miten isojen verkkosivustojen (kuten vaikkapa Amazon.com) sisällöt järjestetään siten, että sisällön löydettävyys ja sivuston käytettävyys maksimoidaan huomioiden esimerkiksi käyttäjien tarpeet, liiketoiminnan tavoitteet ja sisällöntuotannon reunaehdot.

Informaatioarkkitehtuurin kysymyksiä ovat esimerkiksi navigaatiohierarkiat, hakutoiminnot, mitä metatietoa sisältöön liittyen tuotetaan, millaisia luokituksia sisällön kuvailuun käytetään, millaisia sisällöntuotantoprosesseja tarvitaan ja miten kaikki saadaan toimimaan. Informaatioarkkitehtuuria tehdään yhteistyössä käyttöliittymä-, ulkoasu-, sisältö-, liiketoiminta- ja teknologia-asiantuntijoiden kanssa. Tavoitteena on luoda toimivia ja kestäviä perusperiaatteita, joiden varaan sivuston muodostama sisällöllinen korttitalo kasataan.

icebergOivallinen kiteytys informaatioarkkitehtuurin eri ulottuvuuksista
(Lähde: What is Information Architecture)

Kirja on hyvä ja suosittelen lukemaan. Nimestään huolimatta “Information Architecture for the World Wide Web”-kirja käsittelee kuitenkin vain yksittäisten verkkosivujen informaatioarkkitehtuuria, ei koko webin. Millainen olisi koko webin informaatioarkkitehtuuri?

Verkkosisällöt yhteismitalliseksi

Semanttinen web on (vuonna 2001 esitetty) visio tulevaisuuden webistä, jossa eri sivustoilla olevat sisällöt  kytketään yhteen linkitetyksi tiedoksi siten, että samaa tarkoittavat asiat linkitetään toisiinsa yhteismitalliseksi, verkkomaiseksi tietorakenteeksi.

Esimerkiksi Suomen kulttuurisisältö on hajautuneena monenlaisten eri organisaatioiden syövereihin. Kullervo löytyy maalattuna Ateneumista, kirjoitettuna Suomalaisen kirjallisuuden seuran arkistoista, laulettuna Ylen arkistoista ja Lönnrotin koti Lohjalta. Näihin liittyy käsitteitä kuten Kalevala, Kullervo, Lohja ja Lönnrot, jotka liittyvät toisiinsa eri tavoin. Ihmiselle näiden eri asioiden yhdistäminen on luontaista, mutta tietokoneelle vaikeampaa.

Linkitetty tieto, avoin tieto ja semanttinen web ovat eri tulokulmia samaan asiaan: eri tietokannoissa ja verkkosivuilla sijaitsevan tiedon hyödynnettävyyden parantamista. Vaikka alkuinnostus semanttisesta webistä on jo laantunut, niin perusidea semanttisesta webistä on yhä kiinnostava. Lisäksi se on vaivihkaan muuttumassa todeksi.

Suomen julkishallinnossa ollaan parhaillaan ottamassa käyttöön semanttisen webin toimintaperiaatteita (kts. esiselvitys Julkishallinnon metatietopalvelusta, ontologiapalvelu Onki), jonka tavoitteena on edistää kuntien, valtion ja muiden tahojen satoihin tai tuhansiin eri verkkosivuihin ja tietojärjestelmiin hajautuneen tiedon löydettävyyttä ja yhteiskäyttöä sekä tietojen julkaisemista avoimena tietona.

Jaetut käsitteistöt (ontologiat ja sanastot) ja olemassa olevat linkitetyt tietokokoelmat tarjoavat informaatioarkkitehtuurin kiintopisteitä, joihin eri tiedontuottajat voivat kytkeä sisältöjään. Esimerkiksi miljoonia eri asioita käsittelevä Wikipedia toimii kansainvälisen linkitetyn tiedon pilven keskipisteenä. Jos haluat puhua leijonista, niin viittaa Wikipedian leijoniin.

Lion_waiting_in_Namibia
Tämä leijona on lainattu Wikipediasta matkakulujen säästämiseksi ja toisteisen työn vähentämiseksi.

Semanttinen informaatioarkkitehtuuri

Informaatioarkkitehtien kannalta semanttisen webin ideat sekä helpottavat että vaikeuttavat työtä.

Yksittäisen verkkosivuston (tai tietojärjestelmän) informaatioarkkitehtuurissa voidaan hyödyntää valmiita luokitteluita ja käsitteitä, joka säästää aikaa. Samalla tiedon yhteismitallisuus paranee, jos eri järjestelmissä käytetään samoja tunnisteita tiedon kuvaamiseen.

Yhteismitallisuus parantaa myös tiedon hyödynnettävyyttä, jos tieto julkaistaan avoimen tietona. (Avoin linkittämätön tieto vaatii käyttäjältään enemmän toimenpiteitä, joten sen käyttöarvo on pienempi kuin pidemmälle jalostettu linkitetty tieto. Toki jossain tapauksissa linkittämätön tieto on täysin riittävää ja parempi sekin kuin ei tietoa laisinkaan.)

Yhä tärkeämpää on myös osata hyödyntää valmiiksi saatavilla olevia avoimia sisältöjä, sanastoja jne, jotta oma työ suuntautuu lisäarvon luomiseen eikä toisteisen työn tekemiseen. Jos esimerkiksi Wikipediassa on jo jokin tieto valmiina, niin tätä avointa tietoa kannattaa käyttää hyödykseen.

Vaikeutta puolestaan lisäävät se, että jaettuja käsitteistöjä ja linkitettyä tietoa hyödyntäessä tulee samalla pohtia ovatko oman sivuston tarpeet ja näkökulmat yhteensopivat jaetun tiedon kanssa. Esimerkiksi lääketieteellinen sanasto on yleensä luotu lääkäreiden näkökulmasta pohjautuen tieteelliseen tutkimukseen, jota tavis ei ymmärrä vaikka yrittäisi. Todennäköisesti  selkokielisempi lähestyminen sisältöön tuottaa paremman käyttökokemuksen, jos kohderyhmänä ovat lääketieteen yksityiskohtiin perehtymättömät henkilöt.

Voittajia ovat ne verkkopalvelut, joissa parhaiten ymmärretään käyttäjän tarpeet, miten käyttäjälle tuotetaan ainutlaatuista lisäarvoa ja miten tämä arvo tuotetaan kustannustehokkaasti. Jos saman sisällön ja hyödyt saa muualta helpommin, nopeammin ja halvemmalla, niin edellytykset pärjäämiselle lienevät heikot.

Kilpailukykyisen verkkopalvelun suunnittelun avainasemassa saattavatkin siis tulevaisuudessa olla semanttiset informaatioarkkitehdit, jotka luovat yhteentoimivia verkkosisältöjä hyödyntäen omia ja verkosta saatavia, olemassa olevia sisältöjä jalostaen samalla oman palvelunsa ainutlaatuisia menestystekijöitä ja lisäarvoa.

PS. Teknologian vaikutuksia liioitellaan usein lyhyellä tähtäimellä ja vähätellään pitkällä tähtäimellä. Ehkä semanttinen web tulee sittenkin – mutta vasta sitten kun useimmilta loppui jo usko?