Power BI on erinomainen ilmainen työkalu henkilökohtaiseen käyttöön. Enkä tarkoita pelkästään kotoisia harrasteprojekteja vaan myös aivan oikeaa työkäyttöä silloin kun raportteja ei ole tarpeen automattisesti päivittää tai jakaa muille.

Tällöin analysoitava data on tyypillisesti Excel- tai tekstitiedostossa. Excelissä on vaikka kuukauden myyntiluvut. Yksittäinen tiedosto on helppoa imuroida Power BI:hin, siivota ja muokata data ja lopuksi tehdä siitä visualisointi (katso esimerkki).

Kaikki menee hyvin kunnes tulee seuraava kuukausi ja myynniltä uusi Excel.

Haluan tietenkin yhdistää uudet myyntiluvut vanhoihin. Vuoden lopussa minulle on kertynyt 12 kuukauden myyntidata. Ensimmäisenä mieleen tulee yhdistää Excelit Power BI:n append queries -toiminnolla kuten tein aiemmassa kirjoituksessani web kyselyiden kanssa. Turhan monimutkaista. Haluttuun lopputulokseen päästään paljon yksinkertaisemminkin. Käytetään tietolähteenä Excel-tiedoston sijaan kansiota!

Esimerkki – vuosittaisen myyntidatan kerääminen

Käydään kansion käyttäminen tietolähteenä läpi yksinkertaisen esimerkin avulla. Minulla on vuoden 2015 ja 2016 kuukausittaiset myyntiluvut tallennettuna samaan kansioon csv-tiedostoina.

folder

Tiedon lataaminen tietomalliin

Haluan molemmat tiedostot mukaan visualisointiini. Aloitetaan käynnistämällä Power BI Desktop, painetaan Get Data ja valitaan Folder.

import folder

 

Valitaan kansio jossa csv-tiedostot ovat.

choose folder.png

Työkalu näyttää mitä tiedostoja löytyi.

choose folder step 2.png

Huomioita:

  • Säilytä kansiossa ainoastaan tietomalliin siirrettäviä datatiedostoja.
  • Tiedostojen pitää olla rakenteeltaan samanlaisia. Samat otsikot samassa järjestyksessä jne. Tämä on tietenkin ongelmallista sitten kun exceleitä sinulle tarjoava taho päättää muuttaa esitysmuotoa.

Painan edit ja Query Editor avautuu. Editorissa ei näy vielä dataa vaan molemmat csv-tiedostot omina riveinään.

combine binaries.png

Painan Content-sarakkeen otsikossa olevaa Combine binaries -painiketta (kaksi nuolta alaspäin). Power BI olettaa (virheellisesti) että csv-tiedoston kentät on eroteltu toisistaan pilkulla. Vaihdan erottimeksi (Delimeter) puolipiste (semicolon) ja painan OK.

csv file handling.png

Nyt minulla on samassa tietojoukossa molempien csv-tiedostojen sisältö. Lisäksi Power BI on luonut uuden Source.Name -sarakkeen josta näkee tiedoston josta rivin tiedot ovat tulleet (kätevää esim virheitä etsiessä).

combined csv files.png

Tietotyypit ovat vielä väärin, joten korjaan ne. Helpoiten tämä onnistuu klikkaamalla otsikon vasemmalla puolella olevaa nykyisen tietotyypin symbolia. Hyvältä näyttää!

corrected data types.png

Luon vielä visualisointia varten date-tyyppisen sarakkeen. Yhdistän siinä Month ja Year -sarakkeet.

add date column.png

Lopputulos näyttää tältä.

new date column.png

Muunnan vielä Date-sarakkeen tyypiksi päivämäärän jolloin rivin päivämääräksi muodostuu raportointikuukauden ensimmäinen päivä. Tämä riittää meille.

new date column ready.png

Painamalla lopuksi Close & Apply aineisto latautuu tietomalliin ja ne ovat käytettävissä visualsointeihin.

Visualisointi

Tehdään yksinkertainen visualisointi joka kuvaa myynnin kehittymistä.

monthly sales step 1.png

Oletuksena visualisointi näyttää kehittymisen vuositasolla. Haluan seurata myynnin kehitystä kuukausitasolla koko seuranta-ajalta. Vaihdankin Date:n vieressä olevasta kolmiosta aika-akseliksi päivämäärän (Date) hierarkisen esitysmuodon (Date Hierarchy) sijaan.

change date hierarchy.png

Nyt näen haluamallani tavalla miten myynti on lähtenyt kasvamaan.

monthly sales step 2

Lisään kuukausikäppyrän viereen pylväinä vuosien kokonaismyynnin. Merkityksellinen tieto sekin.

yearly sales

Ennuste (Forecast)

Visualisointiin voi lisätä myös puhtaasti historiatietoon perustuvan ennusteen. Haluan tämän mukaan kuukausitason myyntilukukäppyrään. Ennuste löytyy klikkaamalla visualisointi-osuuden suurennuslasi-symbolia.

analytics.png

Tehdään uusi ennuste seuraavilla arvoilla:

  • Forecast length: 3 points = ennuste kolmelle seuraavalle kuukaudelle
  • Ignore last: 0 points = otetaan ennusteeseen mukaan kaikki edeltävät arvot
  • Confidence interval: 95% = mitä tarkempaa ennustetta haetaan, sitä suurempi vaihteluväli ennusteelle tulee
  • Seasonality: 12 points = ennustetaan kuukausitasolla, 12 kuukautta muodostaa yhden syklin eli tutummin vuoden.

forecast.png

Hyväkysytään ja nyt meillä on käppyrässä mukana ennuste seuraavalle kolmelle kuukaudelle. Musta viiva on ennuste. Harmaa alue on väli johon 95% todennäköisyydellä osutaan.

forecast ready.png

Vuoden 2017 myyntilukujen lisääminen

Lopuksi päästään kirjoituksen varsinaiseen pihviin. Myynniltä tule uusi csv-tiedosto joka sisältää vuoden 2017 luvut. Tallennan sen tietolähteenä toimivaan kansioon.

sales 2017.png

Power BI:n työkaluriviltä löytyy refresh-painike. Painan sitä.

refresh.png

Kaikki päivityy hetkessä ja nyt minulla on visualisoinnissa mukana myös vuoden 2017 luvut!

updated visualization.png

Tämä kirjoitus on osa laajempaa sarjaa jossa käyn läpi Office 365:n työkaluja. Mistä niissä on kyse ja miten niitä voisi hyödyntää.