Avointa tietoa Atlantin takaa

Obaman hallinto julkaisi toukokuussa kiinnostavan raportin siitä, miten tiedon “älykäs” avaaminen (smart disclosure) digitaalisena, koneluettavana datana on toteutunut Yhdysvalloissa. Tässä yhteenvetoa raportin sisällöstä:

Taustaa

Datan julkaisemisella Yhdysvallat pyrkii edistämään erityisesti kuluttajien asemaa ja päätöksentekoa, mutta laajemmin markkinoiden toimivuutta, talouskasvua ja työpaikkojen lisääntymistä. “Äly” viittaa siis siihen, että kuluttaja, yhteiskunta ja markkinat kokonaisuutena toimisivat paremmin.

Dataa ovat avanneet paitsi julkinen hallinto niin myös (lain velvoittamana) yritykset ja muut hallinnon ulkopuoliset toimijat. Julkaistut datat jakaantuvat kahteen pääryhmään: 1) avoin tieto tuotteista ja palveluista sekä 2) henkilökohtainen avoin tieto, jossa kuluttaja pääsee käsiksi itseään koskevaan tietoon.

Tietojen yksi tärkeimmistä julkaisupaikka on Yhdysvaltojen julkishallinnon datakatalogi, data.gov, mutta dataa julkaistaan myös esimerkiksi organisaatioiden omilla verkkosivuilla.

Siltoja ja muuta tietoa Yhdysvalloista. Data.gov-verkkopalvelu 6.7.2013.
Siltoja ja muuta dataa Yhdysvalloista Data.gov-verkkopalvelussa (6.7.2013).

Dataa ja sovelluksia

Kansalaisen kannalta data ei yleensä ole sellaisenaan käyttökelpoista vaan tarvitaan sovelluksia, jotka muuttavat tiedon käyttökelpoiseksi arkipäivän käyttöön. Raportti mainitsee mm. seuraavat sovellukset ja niiden taustalla olevat datat:

Opinnot. Kouluihin, yliopistoihin ja opiskeluun liittyvää dataa on avattu paljon, joiden avulla esimerkiksi vanhemmat voivat valita lapselleen parhaiten sopivat opinahjot. Myös omat opintosuoritukset voi ladata koneluettavassa muodossa (oppilaitoskohtaisia eroja löytyy). Tietoja on esimerkiksi saatavilla osoitteesta education.data.gov, (jossa äsken vilkaistessa on esimerkiksi tilastoja siitä, miten paljon opiskelijoita milläkin opinahjolla on, miten moni osallistuu aamiaiselle ja mitkä ovat eri kampusten rikostilastot).

Energia ja ympäristö. Dataa on julkaistu esimerkiksi tuotteiden ja palveluiden energiatehokkuuteen, veden laatuun, saasteisiin ja jätteisiin liittyen. Yksi tärkeä toimintamuoto on “Green Button”, jonka avulla kuluttaja voi ladata itselleen oman energiakulutuksensa ja esimerkiksi kilpailuttaa sähköyhtiönsä.

Talous. Yrityksiin, sijoittamiseen, talouspalveluihin ja muihin talouden yksityiskohtiin liittyen on julkaistu paljon dataa.    Finanssisijoitustietoihin liittyen löytyy esimerkiksi palvelu, joka vertailee kuluttajien tekemiä sijoituksia ja tekee näiden pohjalta suosituksia ostoista ja myynneistä. Henkilökohtaiset luottokorttitiedot voi puolestaan pistää automaattitarkkailuun (tähän löytyy oma startup-verkkopalvelunsa), jotta saisi hälytyksen mikäli luottokorttiveloituksissa on epäilyttäviä veloituksia. Palvelu pohjautuu muiden kuluttajien tekemiin reklamaatioihin, joista on avoin tietokanta saatavilla.

Ruoka. Ravintoon, ravitsevuuteen, elintarvikkeiden turvallisuuteen liittyvää dataa ja paikkatietoa on julkaistu, josta jälkimmäinen sisältää esimerkiksi lähiruoan myyntipisteiden koordinaatit. Yksi sovellus ruokadatalle on ruokaympäristökartta “Food Environment Atlas”, joka on karttavisualisointi ruokavaihtoehdoista eri puolella Yhdysvaltoja. Kartasta selviää esimerkiksi, että New York Cityssä on tuhatta asukasta kohden 0,76 ruokakauppaa kun taas Las Vegasissa (ja lähialueella) vastaava luku on 0,15.

Kulkeminen. 78 % internetin käyttäjistä käyttää hakukoneita tietojen hakemiseen tuotteista ja palveluista, joita he harkitsevat ostavansa. Yksi tärkeä sovellustyyppi ovat tämän vuoksi valinta-automaatit (“choice engine”), jotka auttavat kuluttajia tekemään valintoja palveluihin ja tuotteisiin liittyen huomioiden monipuolisesti tuotteista saatavilla olevaa tietoa kuten tietoja tuotteiden vaaroista ja mahdollisista huonoista kokemuksista tuotteeseen liittyen. Esimerkiksi lentomatkaa ostaessa lentoyhtiöiden ajantasaisuustieto voi vaikuttaa siihen, millä yhtiöllä haluaa matkustaa.

Terveys. Raportin mukaan 80 % aikuisista käyttää internetiä hakeakseen terveyteen liittyvää tietoa. Terveyteen liittyvää tietoa on julkaistu paljon osoitteessa healthdata.gov. Omat terveystietonsa lataamalla itselleen (“Blue button”) voi esimerkiksi kilpailuttaa finanssipalveluitaan kuten (amerikkalaisen terveys)vakuutuksensa.

Turvallisuus. Kuluttajien ja kansalaisten turvallisuuden edistämiseksi on julkaistu dataa liittyen esimerkiksi liikkumiseen, lasten leluihin, terveystuotteisiin ja muihin kuluttajatuotteisiin, työpaikkoihin ja ympäristöön sekä tietoa tuotteiden takaisinkutsuista (esimerkiksi autojen viat).

Tietoliikenne. Dataa on saatavilla esimerkiksi laajakaistayhteyksien saatavuudesta eri puolilla Yhdysvaltoja.

Kuluttajien valitukset. Monet viranomaistahot keräävät tietoa kuluttajien valituksista esimerkiksi lentoihin, autoihin, kuluttajatuotteisiin ja taloustuotteisiin liittyen.

Yhdistelmät. Raportissa myös todetaan, että loppukäyttäjän kannalta vieläkin kiinnostavampia sovelluksia voi syntyä yhdistelemällä esimerkiksi edellä mainittuja tietoja toisiinsa. Esimerkiksi asuinpaikan valintaan voi vaikuttaa koulupalveluiden saatavuus, vapaa-ajanviettomahdollisuudet, ympäristön tila ja laajakaistan saatavuus. Datan yhdistämisen helpottamiseksi tavoitteena on raportin mukaan edistää esimerkiksi hyviä id-käytäntöjä, jossa esimerkiksi yrityksille annettaisiin pysyvä, yksilöivä tunnus (“Legal Entity Identifier” eli LEI) sen sijaan että tiedot yhdistettäisiin yritysten nimen perusteella, joissa on vaihtelevia kirjoitusasuja ja muita ongelmia.

data.gov-datasets-2013-07-06
75 716 tietokokoelmaa ladattavissa juuri nyt. (data.gov, 6.7.2013)

Amerikan oppeja

Raportissa luetellaan myös erilaisia asioita, joita tiedon julkaisemiseen liittyen on havaittu ongelmaksi tai hyviksi käytännöiksi. Tässä muutamia:

Koneluettavuus. Tiedot on pyritty julkaisemaan mahdollisimman käyttökelpoisessa, uudelleenkäytettävässä muodossa: koneluettavana (eksplisiittinen skeema), linkitettynä, metatiedoilla varustettuna ja ohjelmointirajapintojen (API) muodossa. Käytännön toteutukset vaihtelevat. Tietoja on ilmeisesti julkaistu ainakin XML:nä, RDF:nä, CSV:nä, Excel-tiedostoina ja tekstitiedostoina.

Yhteentoimivuus. Teknisiä standardeja (esim. skeemoja) on pyritty noudattamaan ja jossain määrin myös kehittämään eteenpäin (vaikka raportissa todetaankin, että standardointi ei ole Yhdysvalloissa julkisen hallinnon rooli.) Hallinnon eri osien tuottamien tietojen yhteentoimivuutta on pyritty edistämään esimerkiksi siten, että eri hallinnon haarat ovat yhteistyössä päättäneet missä muodossa tietoa julkaistaan.

Yksityisyys. Jokaisen julkaistun datan osalta yksityisyys on pitänyt huomioida. Osassa aineistoa tämä ei ole ongelma, osaa aineistosta on muokattu poistamalla henkilötiedot ja muut yksilöivät tiedot. Osa aineistosta on puolestaan saatavilla vain henkilölle itselleen (josta käytin edellä termiä “yksityinen avoin tieto”).

Tiedon laatu. Yksi raportissa mainittu lähestymistapa tiedon laadun varmistamiseen on ollut se, että kansalaiset ja muut toimijat voivat ilmoittaa huomaamansa puutteet tiedon julkaisijalle, jotta ne voidaan korjata. Eräänlaista yhteisöllistä tiedon laadun parantamista. Raportissa myös todetaan, että tieto voi olla alunperin tuotettu tiettyyn käyttötarkoitukseen, mutta kun tietoa käytetään johonkin muuhun käyttötarkoitukseen niin laadun kriteerit voivat muuttua.

Priorisointi. Kun hallinto päättää mitä tietoja julkaistaan – sisältäen ehkä erityisesti hallinnon ulkopuoliset tahot kuten yritykset, joita voidaan velvoittaa julkaisemaan tietoja – yksi tärkeä priorisointikeino on ollut seurata kuluttajien valituksia ja erilaisten sidosryhmien toiveita.

Käytön edistäminen. Julkishallinto on edistänyt erilaisin tapahtumin, kuten työpajojen, hackhatonien (poliittisesti korrektisti “code-a-thon”, kuten raportti asian ilmaisee) ja kilpailujen avulla datan käyttöä sovelluksissa, jotta mahdollisimman moni huomaisi saatavilla olevia tietoja ja innostuisi hyödyntämään sitä uusien palveluiden tarjoamiseksi kansalaisille.

Kustannukset. Datojen julkaisemisesta on syntynyt hallinnolle tapauksesta riippuen joko nettosäästöä tai -kustannuksia. Raportissa ei eritellä tämän tarkemmin tuloja ja menoja.

Julkaisunopeus. Tiedon julkaiseminen datana saattaa jossain tapauksissa nopeuttaa tiedon keräämisen ja julkaisemisen välisen ajanjakson lyhentämistä.

Raportin yhteenvetona todetaan, että tiedon saatavuus datana edistää kansalaisten etua arkipäivän päätöksenteossa. Tämän takia tietojen avaamista tulisi jatkaa, laajentaa ja tehostaa. Raportissa suositellaan, että tiedon avaamisen tulisi olla osa hallinnon organisaatioiden ydintoimintatapoja ja mainitaan, että julkaistut tiedot tulee linkittää ja kuvailla metatiedolla datakatalogeissa (kuten data.gov).

Lähde: Smart Disclosure and Consumer Decision Making: Report of the Task Force on Smart Disclosure. Executive Office of the President – National Science and Technology Council, 2013.