Kolumnkvalitet och kolumndistribution i Power Query / Power BI

Kolumnkvalitet och kolumndistribution i Power Query / Power BI

Verktyget Power Query (som finns både i Excel och Power BI) är ett fantastiskt verktyg som revolutionerat användningen av Excel. Vill du ha en kort introduktion till Power Query – kolla in detta Exceltips i så fall. Nu hoppar vi nämligen direkt in i Power Query 😊.

Även om du redan börjat använda Power Query så finns en del ”dolda” funktionaliteter. En av mina favoriter är några kryssrutor i menyfliken Visa [View] och i gruppen Förhandsgranskning [Data Preview].

Kryssrutorna Kolumnkvalitet [Column quality], Kolumndistribution [Column distribution] och Kolumnprofil [Column profile] ger dig snabb och smart information om de data som du håller på att hämta/bearbeta. Dessa kryssrutor är dock som standard inaktiverade, så du behöver helt enkelt kryssa i dem för att använda dem. (Skulle du inte se kryssrutorna kan du behöva uppdatera till en senare version av Excel eller Power Query/BI).

Vi rekommenderar dessa Excelkurser:
www.infocell.se – lärarledda kvalitetskurser i Excel
www.officekurs.se – oslagbar e-kurser i Excel & Office-paketet

I exemplet nedan hämtar vi ett dataset innehållande uppgifter om olika fakturor. Med dessa kryssrutor aktiverade får vi tre tilläggsdelar tillgängliga i programfönstret. I bilden ser du var de olika delarna syns.

Kolumnkvalitet

I fältet Kolumnkvalitet [Column quality] (det röda fältet i bilden) kan du snabbt och se om datauppsättningen innehåller några felvärden eller celler som är tomma för respektive kolumn. I exemplet ovan finns två tomma cellvärden i kolumnen Varumärke. Håller du musen på området Kolumnkvalitet visas ytterligare information där du enkelt ser att det finns två tomma värden.

Huruvida man åtgärdar detta direkt i Power Query eller i källdata, beror ju givetvis på situationen.

Kolumndistribution

I fältet Kolumndistribution [Column distribution] (det gröna fältet i bilden) ser du hur kolumnens olika värden är fördelade. Du ser också hur många distinkta och unika värden som varje kolumn innehåller.

Även i detta område kan du hovra med musen och få lite ytterligare information om kolumnvärdena.

För kolumnen Fakturadatum visas att det finns 539 olika datum (distinkta) och att 256 av dessa datum endast förekommer en gång (unika).

Kolumnprofil

När kryssrutan Kolumnprofil [Column profile] är aktiverad och du markerar en kolumn, kommer området längst ner i programfönstret att visa statistik och distribution av kolumnens värden.

I området Kolumnprofil får man en tydligare överblick över fördelningen mellan produkterna för kolumnen Produkt och samlad statistik syns nere till vänster i bild. Fler statistiska värden syns om kolumnen innehåller numeriska värden. Detta ger dock en utökad bild, samtidigt kan kolumnprofilen uppta en stor del av skärmen, vilket gör att jag själv brukar ha den inaktiverad och endast tar fram den vid behov.

Fler än 1000 rader? Inga problem!

Standard är att programmet baserar kolumnanalysen på de 1000 första raderna i datauppsättningen. Detta ändrar du dock enkelt genom att klicka nere i statusraden och väljer att kolumnprofileringen ska gälla för hela datauppsättningen.

Kurser i Power Query

  • Vår lärarledda tvådagarskurs i Power Query, Power Pivot och Power BI hittar du på www.infocell.se
  • Våra e-kurser i Power Query och de andra Powerprogrammen hittar du på www.officekurs.se
  • Anpassade kurser i Excel och Powerprogrammen? Kontakta Tobias Ljung, 0522-506008, Tobias@infocell.se

Du gillar kanske också...

Börja prenumerera idag!

Ta del av tips & tricks i Excel och Office en gång i månaden helt kostnadsfritt.

Grattis! Du kommer nu att få Excelbrevet varje månad helt gratis.