Power BI on erinomainen ilmainen työkalu henkilökohtaiseen käyttöön. Enkä tarkoita pelkästään kotoisia harrasteprojekteja vaan myös aivan oikeaa työkäyttöä silloin kun raportteja ei ole tarpeen automattisesti päivittää tai jakaa muille.
Tällöin analysoitava data on tyypillisesti Excel- tai tekstitiedostossa. Excelissä on vaikka kuukauden myyntiluvut. Yksittäinen tiedosto on helppoa imuroida Power BI:hin, siivota ja muokata data ja lopuksi tehdä siitä visualisointi (katso esimerkki).
Kaikki menee hyvin kunnes tulee seuraava kuukausi ja myynniltä uusi Excel.
Haluan tietenkin yhdistää uudet myyntiluvut vanhoihin. Vuoden lopussa minulle on kertynyt 12 kuukauden myyntidata. Ensimmäisenä mieleen tulee yhdistää Excelit Power BI:n append queries -toiminnolla kuten tein aiemmassa kirjoituksessani web kyselyiden kanssa. Turhan monimutkaista. Haluttuun lopputulokseen päästään paljon yksinkertaisemminkin. Käytetään tietolähteenä Excel-tiedoston sijaan kansiota!
Esimerkki – vuosittaisen myyntidatan kerääminen
Käydään kansion käyttäminen tietolähteenä läpi yksinkertaisen esimerkin avulla. Minulla on vuoden 2015 ja 2016 kuukausittaiset myyntiluvut tallennettuna samaan kansioon csv-tiedostoina.
Tiedon lataaminen tietomalliin
Haluan molemmat tiedostot mukaan visualisointiini. Aloitetaan käynnistämällä Power BI Desktop, painetaan Get Data ja valitaan Folder.
Valitaan kansio jossa csv-tiedostot ovat.
Työkalu näyttää mitä tiedostoja löytyi.
Huomioita:
- Säilytä kansiossa ainoastaan tietomalliin siirrettäviä datatiedostoja.
- Tiedostojen pitää olla rakenteeltaan samanlaisia. Samat otsikot samassa järjestyksessä jne. Tämä on tietenkin ongelmallista sitten kun exceleitä sinulle tarjoava taho päättää muuttaa esitysmuotoa.
Painan edit ja Query Editor avautuu. Editorissa ei näy vielä dataa vaan molemmat csv-tiedostot omina riveinään.
Painan Content-sarakkeen otsikossa olevaa Combine binaries -painiketta (kaksi nuolta alaspäin). Power BI olettaa (virheellisesti) että csv-tiedoston kentät on eroteltu toisistaan pilkulla. Vaihdan erottimeksi (Delimeter) puolipiste (semicolon) ja painan OK.
Nyt minulla on samassa tietojoukossa molempien csv-tiedostojen sisältö. Lisäksi Power BI on luonut uuden Source.Name -sarakkeen josta näkee tiedoston josta rivin tiedot ovat tulleet (kätevää esim virheitä etsiessä).
Tietotyypit ovat vielä väärin, joten korjaan ne. Helpoiten tämä onnistuu klikkaamalla otsikon vasemmalla puolella olevaa nykyisen tietotyypin symbolia. Hyvältä näyttää!
Luon vielä visualisointia varten date-tyyppisen sarakkeen. Yhdistän siinä Month ja Year -sarakkeet.
Lopputulos näyttää tältä.
Muunnan vielä Date-sarakkeen tyypiksi päivämäärän jolloin rivin päivämääräksi muodostuu raportointikuukauden ensimmäinen päivä. Tämä riittää meille.
Painamalla lopuksi Close & Apply aineisto latautuu tietomalliin ja ne ovat käytettävissä visualsointeihin.
Visualisointi
Tehdään yksinkertainen visualisointi joka kuvaa myynnin kehittymistä.
Oletuksena visualisointi näyttää kehittymisen vuositasolla. Haluan seurata myynnin kehitystä kuukausitasolla koko seuranta-ajalta. Vaihdankin Date:n vieressä olevasta kolmiosta aika-akseliksi päivämäärän (Date) hierarkisen esitysmuodon (Date Hierarchy) sijaan.
Nyt näen haluamallani tavalla miten myynti on lähtenyt kasvamaan.
Lisään kuukausikäppyrän viereen pylväinä vuosien kokonaismyynnin. Merkityksellinen tieto sekin.
Ennuste (Forecast)
Visualisointiin voi lisätä myös puhtaasti historiatietoon perustuvan ennusteen. Haluan tämän mukaan kuukausitason myyntilukukäppyrään. Ennuste löytyy klikkaamalla visualisointi-osuuden suurennuslasi-symbolia.
Tehdään uusi ennuste seuraavilla arvoilla:
- Forecast length: 3 points = ennuste kolmelle seuraavalle kuukaudelle
- Ignore last: 0 points = otetaan ennusteeseen mukaan kaikki edeltävät arvot
- Confidence interval: 95% = mitä tarkempaa ennustetta haetaan, sitä suurempi vaihteluväli ennusteelle tulee
- Seasonality: 12 points = ennustetaan kuukausitasolla, 12 kuukautta muodostaa yhden syklin eli tutummin vuoden.
Hyväkysytään ja nyt meillä on käppyrässä mukana ennuste seuraavalle kolmelle kuukaudelle. Musta viiva on ennuste. Harmaa alue on väli johon 95% todennäköisyydellä osutaan.
Vuoden 2017 myyntilukujen lisääminen
Lopuksi päästään kirjoituksen varsinaiseen pihviin. Myynniltä tule uusi csv-tiedosto joka sisältää vuoden 2017 luvut. Tallennan sen tietolähteenä toimivaan kansioon.
Power BI:n työkaluriviltä löytyy refresh-painike. Painan sitä.
Kaikki päivityy hetkessä ja nyt minulla on visualisoinnissa mukana myös vuoden 2017 luvut!
Tämä kirjoitus on osa laajempaa sarjaa jossa käyn läpi Office 365:n työkaluja. Mistä niissä on kyse ja miten niitä voisi hyödyntää.