Mitä, ketkä ja miten – kolme kysymystä suuresta datasta

Mitä on big data?

Big data tarkoittaa erittäin suurten, järjestämättömien ja eri muodossa sekä eri lähteistä peräisin olevien tietomassojen keräämistä, säilyttämistä ja analysointia internetiä ja modernia teknologiaa hyödyntämällä. Big datalle on ominaista, että tietoa syntyy ja leviää valtavalla vauhdilla. Digitaalinen universumimme – kaikki luomamme ja jakamamme data – kasvaa jatkuvasti 40 prosentin vuosivauhtia. Tutkimuslaitos IDC arvioi, että kaiken vuoteen 2020 mennessä kertyneen datan säilömiseen tarvittaisiin ohuita tablettitietokoneita niin suuri määrä, että päällekkäin
kasattuna konepino ylettyisi yli 6,5 kertaa maasta kuuhun.

Piirroskuva, jossa on bittejä matkalla maasta kuuhun ja takaisin.

Big datan tietomassat kertyvät esimerkiksi paikannustiedoista, tietohakuja tekemällä, sosiaalisen median sisällöistä sekä erilaisten antureiden ja sensoreiden keräämästä tiedosta. Eri lähteistä peräisin olevia, keskenään erilaisia tietoja, esimerkiksi valokuvia, sijaintitietoja ja sosiaalisen median keskusteluja, voidaan yhdistää monella eri tavalla analysoitavaksi ja jalostettavaksi.

Big datalla sinällään ei ole itseisarvoa, mutta tietoa voidaan jalostaa mitä moninaisimpaan hyötykäyttöön. Siksi big dataa voidaan pitää nykyaikaisena vastineena suomalaisen taruston Sammolle. Kalevalan Sampo oli ihmekone, joka loi tyhjästä rikkauksia.

Ketkä dataa keräävät?

Valtava tietomassa kasvaa netinkäyttäjän kannalta usein aivan huomaamatta. Jokainen näppäimen painallus, sivun lataaminen ja nettiuutisen lukeminen voivat kasvattaa digitaalista jalanjälkeämme. Yhä useammat arkiset esineet ovat myös yhteydessä nettiin. Tietoa siis kertyy isoksi
kasaksi, mutta sitä myös kerätään aktiivisesti.

Tietoa keräävät esimerkiksi:

  • sosiaalisen median palvelujen tarjoajat (mm. käyttäjäprofiilit)
  • hakukoneiden ja verkkopalvelujen ylläpitäjät (hakuhistoriat, lokitiedot)
  • yritykset (ostotapahtumat, asiakasrekisterit, asiakkaiden verkkokäyttäytyminen)
  • julkishallinto (mm. terveydenhoito, viranomaisrekisterit, liikenteen suunnittelu ja valvonta)
  • navigointipalvelujen tarjoajat (mm. aika- ja paikkatiedot, ihmisten ja liikennevälineiden paikannus)

Miten dataa kerätään?

Netin ja mobiilisovellusten käyttäjien tietojen kerääminen tapahtuu monenlaisten prosessien kautta. Tietoa saadaan muun muassa silloin, kun ihmiset luovat ja käyttävät profiileja sosiaalisen median palveluissa tai antavat asiakkuustietoja yrityksen nettisivuilla tuotteita tilatessaan.

Hakukone muistaa aikaisemmin tekemiäsi hakuja säilyttämällä hakuhistoriasi ja netti-tv osaa suositella sinulle kiinnostavaa elokuvaa tai tv-sarjaa katseluhistoriasi perusteella. Reittioppaiden ja navigointipalveluiden toimivuus perustuu sekä yksittäiseltä käyttäjältä saatuun paikkatietoon että usean käyttäjän tekemiin valintoihin liikenteessä.

Verkkoon liitetty laite on tunnistettavissa IP-osoitteen avulla. Evästeiden avulla nettisivusto tai sovellus ja sen ylläpitäjä saa tietoa siitä, mitä henkilö netissä tekee. Teknistä tietoa saadaan myös suoraan esimerkiksi selaimesta: mitä enemmän selaimen käyttäjä on muokannut selainta asentamalla siihen esimerkiksi lisäosia, sitä paremmin netissä liikkuva voidaan tunnistaa.

Nettisanastoa

Verkkoselain (puhekielessä usein pelkkä selain) on tietokoneohjelma, joka antaa käyttäjänsä katsella ja lähettää tekstiä, kuvia ja muita WWWsivuilta löytyviä tietoja. Selaimia ovat mm. Chrome, Firefox, Safari ja Edge.

Sovelluksella voidaan viitata tietokoneelle asennettavaan ohjelmaan, älypuhelimelle asennettavaan ohjelmaan, peliin tai myös verkkoselaimeen asennettavaan lisäosaan. Sovellukset ovat yleensä työkaluja rajattuun tarkoitukseen, kuten tiedostojen siirtelyyn, kuvien jakamiseen, oman IP-osoitteen piilottamiseen tai viestittelyyn perheen ja ystävien kanssa.

Ylläpitäjä on verkkopalvelun toimivuutta ja käyttäjiä valvova henkilö tai tiimi. Useimmilla verkkopalveluilla, joihin on mahdollisuus rekisteröityä on ylläpitäjä tai vähintään verkko-osoitteen omistaja. Ylläpitoon voi olla yhteydessä verkkopalvelun käyttöön liittyvissä kysymyksissä. Suomalaisten .fi-päätteisten verkkopalveluiden omistajien yhteystiedot voi tarkistaa domain.fi-palvelusta, mikäli verkkopalvelussa ei kerrota ylläpidon yhteystietoja.

Mitkä ”evästeet”?

Internetsivustoilla voidaan käyttää evästeitä (cookies). Eväste on käyttäjän tietokoneelle lähetettävä ja siellä säilytettävä tiedosto. Evästeet mahdollistavat netinkäyttäjän tietojen tallentamisen hetkellisesti nettiselaimen aukiolon ajaksi tai pidemmäksi aikaa, jolloin esimerkiksi salasanat
tai verkkokaupan ostoskorin sisällön tiedot säilyvät nettisivun ja selaimen sulkemisenkin jälkeen. Evästeiden avulla netinkäyttäjä on usein helpompaa, kun käyttäjätiedot ovat jo valmiiksi sivuston muistissa.

Toisaalta evästeet mahdollistavat myös netinkäyttäjien seuraamisen, sillä evästeen avulla selviää muun muassa mistä verkko-osoitteesta sivulle siirryttiin ja kuinka kauan aikaa sivustolla vietettiin. Sivuston ylläpitäjä voi myös antaa käyttäjän tietoja muille tahoille, esimerkiksi mainostajille tai analysointiin erikoistuneille yrityksille.

Selaimen asetuksissa evästeet on mahdollista poistaa käytöstä tai tehdä niihin rajoituksia. Jotkut palvelut, kuten verkkopankit, kuitenkin tarvitsevat evästeitä toimiakseen asianmukaisesti. Katso lisää evästeiden poistosta selaimesi asetuksista ja ohjeista.

Toimintaidea

Listaa aluksi itsenäisesti, mihin kaikkeen käytät nettiä. Tarkastele listaa ja pohdi kaikkia niitä tapoja, joilla käyttämäsi laitteet, sivustot ja sovellukset saavat sinusta tietoa. Tarkastelkaa vastauksia ryhmässä ja pohtikaa, millaisia tietoja kenestäkin on saatettu kerätä.

Vinkki: Tehtävän purkamisen yhteydessä keskustelijat voivat tutustua yhdysvaltalaiseen Computer Hope -sivustoon, jossa on lueteltu asioita, joita Facebook voi päätellä käyttäjistään.

Eletään vuotta 2030. Olet siis 15 vuotta nykyistä vanhempi. Mieti mitkä kaikki palvelut ja esineet voisivat keräävät tietoja sinusta tulevaisuudessa. Valitse jokin elämäntilanne tai tapahtuma, jossa luulet sinusta kerättyjen tietojen hyödyttävän sinua ja antavan lisäarvoa tai mukavuutta elämääsi.

Piirrä kuva tai kerro tarina itsestäsi tuolla hetkellä.