Database
 sql >> Database >  >> RDS >> Database

Pivoting, Unpivoting e Suddivisione delle colonne nell'editor di query di Power BI

Per riferimento, Power BI è un software di visualizzazione e analisi dei dati sviluppato da Microsoft. Power BI può essere usato per la visualizzazione di dati statici e interattivi. Prima di poter creare visualizzazioni effettive con Power BI, puoi eseguire la preelaborazione dei dati utilizzando l'editor di query di Power BI.

Con l'editor di query, puoi eseguire varie attività di trasformazione dei dati, come modificare i tipi di colonne, gestire i valori mancanti, eliminare righe e colonne, ruotare e annullare il pivot di colonne, dividere colonne e così via.

In questo articolo, vedrai come eseguire il pivot, annullare il pivot e dividere le colonne utilizzando l'editor di query di Power BI.

Importazione di un set di dati nell'editor di query

Il set di dati utilizzato come esempio in questo articolo è in un formato di file CSV che può essere scaricato utilizzando questo collegamento kaggle. Scarica il file CSV nel tuo file system locale.

Quindi, apri Power BI Desktop, fai clic sul pulsante "Ottieni dati" dal menu in alto. Dall'elenco a discesa, seleziona "Testo/CSV" come mostrato di seguito.

Power BI richiederà del tempo per importare i dati. Una volta caricati i dati, dovresti vedere la finestra qui sotto.

Il set di dati contiene informazioni su popolazione, area, tasso di natalità, tasso di mortalità, densità di popolazione, PIL pro capite, telefoni per 1000, ecc. per tutti i paesi del mondo. Per caricare i dati nell'editor di query, fai clic sul pulsante "Trasforma dati".

L'editor di query si presenta così:

Nell'editor di query, puoi eseguire varie pre-elaborazioni come pivot, unpivoting e suddivisione delle colonne.

Teoria del pivot e unpivoting

Prima di passare effettivamente alle colonne pivot e unpivoting con l'editor di query di Power BI. Consideriamo un esempio molto semplice di unpivoting.

Non pivot

Si supponga di disporre di un set di dati che contiene le seguenti informazioni. Le righe della tabella seguente corrispondono ai paesi, mentre le colonne mostrano le informazioni sul PIL pro capite e sul tasso di alfabetizzazione per i paesi corrispondenti nelle righe. (Nota:questi sono solo valori fittizi, non i valori effettivi)

Paese PIL pro capite Tasso di alfabetizzazione
Francia 30.000 95%
Germania 25.000 96%

Se sposti una singola colonna, ad esempio PIL pro capite, il set di dati con una colonna non pivot avrà questo aspetto.

Paese Attributo Valore Alfabetizzazione
Francia PIL pro capite 30.000 95%
Germania PIL pro capite 25.000 96%

Puoi vedere che la colonna PIL pro capite è stata sostituita da due colonne, ovvero Attributo e Valore. I valori nella colonna "Attributo" corrispondono al nome della colonna non pivot, mentre la colonna "Valore" contiene i valori che esistevano in precedenza nella colonna non pivot. Poiché solo una singola colonna è unpivoted, i valori nella colonna "Attributo" saranno sempre gli stessi. Inoltre, il numero di righe nel set di dati con una colonna unpivoted rimarrà lo stesso.

Proviamo ora a vedere cosa succede quando annulliamo il pivot di due colonne. Sbloccheremo entrambe le colonne PIL pro capite e tasso di alfabetizzazione nel set di dati originale. Il set di dati con due colonne non pivot è simile a questo.

Paese Attributo Valore
Francia PIL pro capite 30.000
Francia Tasso di alfabetizzazione 95%
Germania PIL pro capite 25.000
Germania Tasso di alfabetizzazione 96%

Nel set di dati sopra, puoi vedere che per ogni nome di paese, la colonna "Attributo" ora contiene due valori univoci:PIL pro capite e tasso di alfabetizzazione. La colonna "Valore" contiene i valori corrispondenti per gli Attributi. Si noti che il numero di righe è raddoppiato. Allo stesso modo, se sposti tre colonne, il numero di righe in un set di dati aumenta di tre volte.

Pivota

Il pivot, come suggerisce il nome, si riferisce al processo utilizzato per invertire un set di dati non pivot nella sua forma originale. Ad esempio, durante il pivot la tabella di input appare così:

Paese Attributo Valore
Francia PIL pro capite 30.000
Francia Tasso di alfabetizzazione 95%
Germania PIL pro capite 25.000
Germania Tasso di alfabetizzazione 96%

Dopo aver applicato il pivot sulle colonne "Attributo" e "Valore", il set di dati assume la forma seguente:

Paese PIL pro capite Tasso di alfabetizzazione
Francia 30.000 95%
Germania 25.000 96%

Ora che sappiamo cosa sono il pivoting e unpivoting, vediamo come implementarli con Power BI.

Pivoting e unpivoting con Power BI

Vediamo prima un esempio di come annullare il pivot di una singola colonna con l'editor di query di Power BI. Se guardi il set di dati, contiene una colonna denominata "Popolazione". Per annullare il pivot della colonna "Popolazione", fai clic sull'intestazione della colonna e quindi seleziona l'opzione "Trasforma" dal menu in alto. Vedrai apparire un nuovo menu con diverse opzioni in alto, fai clic sull'opzione "Unpivot Columns" dal menu e quindi fai clic su "Unpivot Columns" dall'elenco a discesa, come mostrato di seguito:

La colonna "Popolazione" sarà sostituita dalle colonne "Attributo" e "Valore", come mostrato di seguito:

Ora, per ruotare una colonna, hai due opzioni. Puoi fare clic sull'opzione "x Colonne non pivot" dalla finestra "Passaggi applicati", come mostrato nella schermata seguente.

L'altra opzione è selezionare una colonna e quindi selezionare "Trasforma -> Colonna pivot" dal menu in alto, come mostrato di seguito.

Durante la rotazione di una colonna, è necessario specificare la colonna che contiene i valori per la colonna non pivot. Nel nostro caso, la colonna "Valore" contiene i valori per la colonna "Attributo" non pivot. Guarda lo screenshot seguente come riferimento.

La colonna pivot "Popolazione" ha il seguente aspetto:

Sposta la colonna "Popolazione" proprio accanto a "Pop. Densità (per sq. mi.)” facendo clic sull'intestazione della colonna “Popolazione” e trascinando, come mostrato nella schermata seguente.

Successivamente, sbloccheremo due colonne, ovvero "Popolazione" e "Pop. Densità (per mq.)”. Seleziona entrambe le intestazioni di colonna e poi annulla il pivot, come mostrato di seguito:

Dopo aver annullato il pivot, dovresti vedere le due colonne seguenti create nel set di dati. Puoi vedere che la colonna "Attributo" ora contiene informazioni su "Popolazione" e "Pop. Densità (per mq.)”.

Seleziona entrambe le intestazioni delle colonne (CTRL + clic), quindi trascina le colonne accanto alla colonna "Paese", come mostrato di seguito.

Ora puoi vedere i nomi dei "Paesi", la loro popolazione totale e la densità di popolazione per miglio quadrato. Cambiamo il nome della colonna "Attributo" in "Tipo di popolazione" poiché la colonna "Attributo" mostra due tipi di popolazione:la popolazione totale e la densità di popolazione per miglio quadrato. Il set di dati con un nome di intestazione di colonna aggiornato ha il seguente aspetto:

Dividi colonne

Prima di dividere le colonne, sostituiremo alcuni valori nella colonna "Tipo di popolazione".

Il valore “Popolazione” nella colonna “Tipo di popolazione” si riferisce alla popolazione totale. Sostituiremo il valore “Popolazione” con “Pop. Totale” in modo che abbia lo stesso schema di “Pop. Densità (per mq.)”. Per sostituire i valori nelle colonne, vai su "Trasforma -> Sostituisci valori", come mostrato nella schermata seguente.

Dopo aver sostituito i valori, il set di dati avrà questo aspetto.

Ora divideremo la colonna "Tipo di popolazione" in due. I suoi primi cinque caratteri verranno aggiunti alla prima colonna, mentre i caratteri rimanenti verranno aggiunti all'altra colonna. Per dividere una colonna, vai su "Trasforma -> Dividi colonne". Divideremo per i primi cinque caratteri, quindi seleziona l'opzione "Dividi per numero di caratteri" dal menu a discesa. Divideremo la colonna per i primi 5 caratteri più a sinistra. Per riferimento, guarda lo screenshot seguente.

Una volta che le colonne sono state divise, dovresti vedere le seguenti due colonne.

Abbiamo solo bisogno della colonna "Tipo di popolazione.2" poiché contiene informazioni sul tipo o sulla scala della popolazione. Fare clic sulla colonna "Tipo di popolazione.1" e quindi selezionare "Elimina".

Infine, puoi rinominare la colonna "Tipo di popolazione.2" in "Tipo di popolazione" come mostrato di seguito.

Dalla figura seguente, puoi vedere che ci sono due diversi tipi di valori della popolazione per ogni paese. Il valore "Totale" nella colonna "Tipo di popolazione" si riferisce alla popolazione totale del paese. Il valore effettivo per la popolazione totale è memorizzato nella colonna "Valore della popolazione". Allo stesso modo, il valore "Densità (per sq. mi.)" mostra che questo valore di popolazione si riferisce alla densità di popolazione.

Conclusione

In sintesi, l'articolo illustra come eseguire il pivot e l'annullamento del pivot nell'editor di query di Power BI. Inoltre, copre la teoria di base dietro colonne pivot e unpivoting illustrate da esempi chiari. Infine, l'articolo spiega come viene implementato il processo di divisione delle colonne nell'editor di query di Power BI.