Visualisointityökaluanalyysi - Haastaako Pentaho oikeasti johtavia työkaluja?

Viime vuosina datan määrän kasvu ja ymmärrys datan arvosta liiketoiminnalle on johtanut siihen, että monissa yrityksissä on päätetty panostaa tietovarantojen ja datamassojen analysoimiseen ja visualisoimiseen. Liiketoiminnassa syntyneen datan systemaattisella keräämisellä, tallentamisella, muokkaamisella ja analysoinnilla yritys kykenee tarkkailemaan esimerkiksi oman liiketoimintasuunnitelmansa toteutumista. Tavoitteena on tarjota valmiiksi tuotettu visuaalinen ja analyyttinen malli yrityksen keskeisistä toiminnoista johtoportaalle ja muille sitä tarvitseville henkilöille päätösten tueksi.

Business Intelligence – visualisointityökaluilla hyödynnetään systemaattisesti yrityksen tietovarannot ja muokataan käyttöön sopivaksi visualisointia varten. Samoilla työkaluilla luodaan muokatusta datasta visuaaliset mallit, jotka sisältävät erilaisia mittareita asioista, joita yritys haluaa seurata, esimerkiksi kuukausittainen myynti myymäläkohtaisesti.

Johtavien visualisointityökalujen lisäksi markkinoille on tullut uusia varteenotettavia haastajia kuten Pentaho ja Birst, joiden nousu johtuu monesta eri tekijästä, kuten helppokäyttöisyys, yhteisöllisyys, pilvipalvelut sekä hinta.

BIGDATAPUMPissa eri BI-visualisointityökaluja on käytetty useissa asiakasprojekteissa ja yrityksellä onkin laaja kokemus eri työkalujen käytöstä. Tällä kertaa tarkastelemme tarkemmin seuraavia työkaluja: Tableau, QlikTechin Qlikview, Microsoftin BI-ratkaisu sekä Pentahon Community Edition. 

tableau

Tableau

Tableau on tänä päivänä yksi kiinnostavimmista BI-työkaluista. Tableaun tuoteperheeseen kuuluvat seuraavat osat: Tableau Desktop, Tableau Server, Tableau Online, Tableau Public ja Tableau Reader. Syitä työkalun suureen suosioon on erittäin helppokäyttöinen graafinen käyttöliittymä ja se, että työkalujen avulla on mahdollisuus saavuttaa näyttäviä raportteja suhteellisen pienellä vaivalla ja nopealla aikataululla. Raporttien teko Tableaulla toimii pääasiassa drag & drop -tekniikalla.

Datan liittäminen raporttiin onnistuu monista eri tietokannoista. Työkalussa on valmiit optimoidut dataliitännät muun muassa seuraavista kannoista/datan lähteistä: Microsoft Excel, SQL Server, Oracle, Teradata, Vertica, Cloudera Hadoop ja Amazon Redshift. Lopputuloksena Tableaulla saadaan interaktiivisia dataraportteja, joita on mahdollista jakaa esimerkiksi nettisivuilla Tableau Publicin avulla. Raporttien lukemiseen on saatavilla myös ilmainen Tableau Reader -ohjelma, jonka avulla saa luettua Tableau Desktopilla tehtyjä tiedostoja. 

Ammattimaisessa käytössä ohjelmaan on käyttäjäkohtaiset melko kalliit lisenssit.

Vahvuudet

 • Helppokäyttöisyys 

 • Kehitysnopeus

 • Datan visualisointi ja analytiikka

Haasteet

 • Hinta (käyttäjäkohtaiset lisenssit)

 • Yleensä yrityksissä raportointia tehdään myös muilla työkaluilla

 • Rajoitetut ETL mahdollisuudet

QlikView

QlikView

QlikView on ruotsalaisen QlikTechin kehittämä BI-visualisointiohjelmisto, jonka suosio on kasvanut sen ilmestymisestä lähtien mittavasti. Suosion kasvun syyt on helppo ymmärtää.

QlikView pystyy käsittelemään dataa monesta eri lähteestä ja yhdistämään ne samanaikaisesti esimerkiksi Excel-tiedostoista, CSV-tiedostoista ja SQL-tietokannasta. Datan analysoinnissa käytetään graafista käyttöliittymää ja scriptejä sekaisin, jotta saadaan haluttu lopputulos aikaiseksi. Visuaalisella puolella QlikView’n käyttö on todella helppoa graafisen käyttöliittymän avulla ja mittaristot voidaankin muokata loppukäyttäjän toiveiden mukaisiksi.  Interaktiivisten mittareiden avulla on helppo suodattaa erilaisia näkymiä ja skenaarioita, joita voidaan muokata kaavioiden sisälläkin.

QlikView on hintava ja sen käyttö vaatii sekä tietokonekohtaiset käyttäjälisenssit, että serverilisenssit. Testikäytössä QlikView Personal Edition on kuitenkin ilmainen ja rajoittamattomin ominaisuuksin, joten ohjelmistoon on helppo tutustua ja kokeilla mihin se taipuu.

Vahvuudet

 • ETL

 • Graafinen käyttöliittymä

 • Muokattavuus

 • Vahva lokaalisti Suomessa, koska alun perin ruotsalainen

 • Yhteisö

 • Interaktiivisuus

 • Mobiili-integrointi mahdollisuudet

 • Rajoittamaton testikäyttö

Haasteet

 • Hinta (QV-server + käyttäjälisenssit)

 • Tietyt ominaisuudet, jotka ovat hardkoodattu eikä muokattavissa

 • Metadatan hallinta

microsoft bi työkalu

Microsoft BI

Microsoftin BI-visualisointityökalu koostuu Microsoft Exceliin saatavilla olevista ilmaisista lisäosista Power Query, PowerPivot sekä Power View. Ratkaisu toimii yllättävänkin hyvin, ainakin Excel 2013-versiossa (Office 365). Kehitys 2010 ja 2013 versioiden välillä on merkittävä.

Power Query osaa myös lukea ja käsitellä monista eri tietolähteistä tulevaa dataa sekä yhdistää ne kokonaisuuksiksi. Microsoftin tuotteessa tämä on kuitenkin QlikView’ta hankalampaa. PowerPivotilla queryt saadaan vietyä tietomalliin ja malleista saadaan aikaiseksi kuutioita, joiden pohjalta on helppo luoda toimivia graafisia mittaristoja.

Microsoft Excelin BI-ratkaisu on toimiva paketti, jonka rajoituksena tulee kuitenkin se, että se toimii Microsoft Excelin sisällä. Esimerkiksi PowerPivotin avuilla luodut taulut ja kaaviot muokkautuvat Excelin solujen mukaan, jolloin valitettavasti graafiset asettelut rikkoutuvat usein. Power View tarjoaa taas ihan omanlaisen näkymänsä datan visualisoinnille, mutta mittaristojen muokattavuutta on rajoitettu ja niiden kustomointi on melko vähäistä.

Microsoftin BI-ratkaisu on edullinen niille yrityksille tai yksityisille käyttäjille, joilla on jo käytössään Microsoftin palvelut entuudestaan. Lisäosat ovat maksuttomia ja Microsoft SQL-serverin kanssa integrointi sujuu helposti Microsoftin BI-tuoteperheen kanssa.

Vahvuudet

 • Microsoft Excel \ Muu Microsoft tuoteperhe

 • Power Query, PowerPivot, Power View ovat maksuttomia

 • Helppokäyttöisyys

 • SharePoint-yhteensopivuus

Haasteet     

 • Graafisten kaavioiden muokattavuus / kustomointi

 • Microsoft Excelin integroituminen tietokantapohjaiseen analytiikkaan

 • Hieman vielä lapsenkengissä, mutta tuotteen kehitys kirivaiheessa

pentaho analyysi

Pentaho CE

Pentaho on rakentinomaisesti noussut tuntemattomuudesta tunnetummaksi BI-visualisointiratkaisuksi ympäri maailman. Suurimpina syinä tähän varmasti ovat juuri julkaistut 5.0 ohjelmistoversiot, hyvä yhteisötuki ja se, että Pentaho tarjoaa kahta erilaista ratkaisua tuotteestaan. On saatavilla edullinen ”from ground to up” – tyylinen Community Edition – ratkaisu, jossa käytännössä kaikki rakennetaan itse. Toisena vaihtoehtona on Pentahon Enterprise edition, jossa saadaan helpottavia ja helppokäyttöisempiä ominaisuuksia käyttöön, ettei kaikkea tarvitse tehdä itse alusta asti. Tässä yhteydessä kuitenkin tarkastelemme edullisempaa Community Edition – ratkaisua.

Pentahon Community Edition tarjoaa kehittäjälleen valmiin palvelinpohjaisen alustan, jonka avulla pystyy kehittämään haluamansa mittariston käytettäväksi seuraamaan oman toimintasuunnitelmamallinsa toteutumista. Community Edition painottuu itse tekemiseen ja siksi kehittäjän tekninen tieto-taitotaso olisi hyvä olla suhteellisen korkealla tasolla. Mittaristoratkaisu kehitetään käyttäen HTML, CSS, JavaScript ja SQL teknologioita.

Dataa on mahdollista kerätä monista erilaisista lähteistä kuten esim. SQL-yhteydestä, Google Analytics-yhteydestä, Excel-tiedostoista, MongoDB:stä ja muokata niitä jatkokäyttöä varten sopivaan muotoon. Data integration -työkalu tarjoaa graafisen käyttöliittymän.

Kuutiot rakennetaan Schema workbench -nimisellä erillisellä, myös ilmaisella ohjelmistolla graafista käyttöliittymää käyttäen ja se edellyttää tietämystä tietokannoista ja niiden toiminnasta. Datan visualisointi Pentahon Community Editionin avulla on helppoa, jos tyydytään valmiisiin template -pohjiin. Vaikeammaksi se tulee, jos vaaditaan hyvännäköistä, omanlaista mittaristoa. Valmiiden taulukoiden ja kaavioiden käyttö käy helposti, mutta eteenpäin kehittäessä täytyy hallita HTML\CSS-ohjelmointia saadakseen graafista ulkoasua haluamansa näköiseksi. Pentahon mittaristot toimivat nettisivuna, toisin kuin QlikView ja Microsoft ohjelmistojen ratkaisut.

Pentaho Community Edition nojaa aika vahvasti kehittäjän omaan osaamiseen, ja mittaristojen lopputulokset ovat siten aika pitkälti kiinni kehittäjien tietotaidoista. Lisäksi Pentahon Community Editionia käyttäessä, suunnitelma pitää olla melko tarkka jo alusta asti, sillä tiettyjen asioiden muokkaaminen jälkikäteen saattaa olla pitkä ja vaivalloinen prosessi. Hyvällä määrittelyllä ja suunnittelulla Pentahon Community Edition on kuitenkin erittäin pätevä työkalu.

Pentaho tarjoaa myös loistavan yhteisön. Se on varmasti myös yksi syistä, miksi ohjelmisto on suosittu. Forumilla ihmiset ovat aktiivisia ja vastaavat mieluusti kysymyksiisi.

Vahvuudet

 • Muokattavuus

 • Yhteisöllisyys

 • Hinta

 • Server-ratkaisu

 • HTML-sivuina toimivat mittaristot

 • Mobiili-integrointi mahdollista

Haasteet

 • Liika muokattavuus

 • Ei kovin helppokäyttöinen

 • Kehitystyö vie aikaa

 • Pitää olla monen osa-alueen osaaja

 • Ei tue loppukäyttäjän tekemää ad hoc -analytiikkaa, vaatii ”teknisen kehittäjän luomaan raportointia ja visualisointia

Lue lisää Pentahosta blogistamme!