Rikkaan asiakasymmärryksen muodostaminen clickstream -datan pohjalta

Wikipedian mukaan ”clickstream” on sarja sivukyselyitä, joista jokainen sivukysely tuottaa signaalin tehdystä toimenpiteestä. Perinteisesti yritykset ovat käyttäneet clickstream -dataa saadakseen tietoa siitä, mitä asiakkaat tekevät yrityksen verkkosivuilla ja mikä sivustolla toimii ja mikä ei.

Verkkosivujen optimointi on pitkälle kehittynyttä ja standardoitua. Uusi, kiinnostava käyttökohde clickstream- datalle on rikkaan asiakasymmärryksen muodostaminen, jolloin kerätään laajemmin ja tarkemmin asiakastason käyttäytymistietoa. Sen lisäksi, että tietoa voidaan kerätä yrityksen sisäiseltä verkkosivulta, sitä voidaan rikastaa myös mobiiliapplikaatioiden, sosiaalisen median ja ostetun median tiedoilla.

Lähtökohtaisesti asiakkaat käyttävät montaa eri päätelaitetta vuorovaikutuksessaan yrityksen kanssa. Tämä tuo lisähaasteen datan keruuseen ja tietojen yhdistelyyn, sillä mahdollisimman kattava asiakasymmärrys kuitenkin edellyttää, että eri päätelaitteiden kautta tapahtuneet sessiot saataisiin linkitettyä samaan asiakkaaseen.

clickstream data

Kerätyn tiedon päälle voidaan rakentaa liiketoiminta-analytiikkaa, kuten attribuutio -mallinnusta ja mahdollistaa siten asiakastason analytiikka ja asiakaskohtainen kohdennettu viestintä. Aiemmissa yrityksemme blogikirjoituksissa olemme kertoneet enemmän kohdennetun markkinoinnin liiketoimintahyödyistä ja -haasteista.

Miten tämä mahdollistetaan turvallisesti pilvipohjaisilla ja open source -ratkaisuilla?

Pilvipohjainen ympäristö on oikein rakennettuna yhtä tietoturvallinen tai jopa tietoturvallisempi kuin on-premise tai muu paikallinen ratkaisu tiedon tallentamiseen. Molemmissa ratkaisuissa on huolehdittava sekä verkkoympäristön että sovellustason tietoturvasta ja ymmärrettävä, mitkä tietoturvan osa-alueet ovat palveluntarjoajan ja mitkä palvelua käyttävän yrityksen vastuulla.

Tietosuoja-/regulaationäkökulmasta ei välttämättä silti kannata viedä ensimmäiseksi vahvaan asiakastunnisteeseen linkitettyä tietoa pilvialustalle. Heikompaan tunnisteeseen (eväste-id, mobiili-id, muu surrogaatti-id) sidottava tieto on vähäriskisempää tallentaa pilveen - pilviympäristössä clickstream- data on usein syntynytkin ja jo alun perin pilviympäristöön tallennettu.

Käytännössä toimiva analytiikkamoottori Amazon Web Services + Open Source -stack:

  1. Datan keruu tehdään tyypillisesti tapahtumahetkellä jollain Javascript-pohjaisella ratkaisulla. Verkkosivustoille lisätään tarvittavat Javascript –tagi(t), jotta halutut tapahtumat saadaan kerättyä talteen. Mainiota ilmaistyökaluja verkkokäyttäytymistiedon keräämiseen ovat esimerkiksi Snowplow tai Google Analytics.
  2. Data tuodaan joko suoraan tai API-kyselyjen kautta AWS Simple Storage Service (S3) -bucketiin, joka toimii kustannustehokkaana raakadatan varastona.
  3. Tieto prosessoidaan ja jalostetaan AWS:n skaalautuvaa Hadoop – ratkaisua eli  Elastic Map Reducea (EMR) käyttäen summatulle tasolle ja tallennetaan toiseen S3 buckettiin ja/tai tietokantaan (esim. RDS tai  Redshift käyttötarpeesta riippuen).
  4. Mikäli on tarvetta lähes reaaliaikaiseen datan prosessointiin ja datanlähteitä tai käsittelytarpeita on useita erilaisia, niin datankeruuratkaisut voidaan laittaa lähettämään tapahtumia Kafkalla tai AWS Kinesiksellä toteutettuun jonoon, josta useammat eri taustasovellukset voivat samanaikaisesti poimia ja prosessoida niitä.
  5. Tietoa voidaan hyödyntää kehittyneen analytiikan välinein (esim. open source R) ja perinteisin SQL-kyselyin joko prosessoitua dataa varten perustetusta tietokannasta tai suoraan hyödyntämällä EMR-klusterin päälle asennettavaa Sparkia tai Hivea.
  6. Tiedosta voidaan tuottaa visualisointeja ja mittaristoja integroimalla sen päälle esimerkiksi Pentaho open source – ratkaisu, kaupallinen tuote tai rakentamalla visualisoinnit suoraan HTML5n avulla.
clickstream arkkitehtuuri

Edellisenkaltainen analytiikkamoottori on nopea pystyttää (4-6 viikon asiantuntevalla työllä toimintavalmiiksi) ja erittäin kustannustehokas ratkaisu tuottamaan vakioitu alusta clickstream-datan ja muun käyttäytymisdatan keräämiselle, varastoimiselle ja analysoinnille.