目次
はじめに
皆さん、お疲れ様です。
最近、Power BIを使うプロジェクトに参画していて色々と学びのある毎日を過ごしています。
ということで直近で学んだ、実際に実装したPower BIのデータ整形・変換について紹介させていただきます。
今回はPower BI desktopの「データの変換」メニューから開けるPower Query Editorでの処理について触れていきたいと思います。
高度な処理ではありませんが、「こういうことができるんだ」というところを知っていただけると嬉しいです!
利用するデータ
Geminiに生成してもらったダミーデータを使ってデモンストレーションしてみたいと思います。
今回使うデータはこちらです。(Google スプレッドシート)
Power BIにこちらを取り込んでデータの変換メニューを開いてみるとこんな感じです。
何ができる?
1行目をヘッダーに指定
取り込んだデータを見てみるとヘッダーがセットされていないように見えますね。
1行目のレコードに列名の情報が入っていますので「1行目をヘッダーとして使用」機能を利用してヘッダーをセットしてみます。
プレビュー画面左上のテーブルアイコンをクリック、
「1行目をヘッダーとして使用」を選択します。
ヘッダーがセットされました。
データのフィルタリング
次はデータをフィルタリングしてみます。
ここでは「配送地域」が東京のデータに絞ってみたいと思います。
フィルタイングの条件は「配送地域」=東京となります。条件を指定する列の列名の右側にある▼をクリックし、
ドロップダウンメニューを開きます。
フィルタから条件に該当する「東京」のみを選択して
「OK」を押下します。
条件を満たすデータのみにフィルタリングされたことが分かります。
列名の変更
列名の変更も簡単にできます。
ここでは「カテゴリ」を「製品カテゴリ」に変更してみたいと思います。
①、②いずれの方法でも列名を変更することができます。
①名前を変更したい列の列名のところをダブルクリック
②名前を変更したい列の列名を右クリック列名を入力してEnterを押すと
変更完了です。
データ型の指定
データ型も数回のクリックで行うことができます。
列「注文ID」の方をテキストにしてみます。列名の左側にデータ型が表示されています。
アイコンをクリックするとドロップダウンリストが展開されます。
リストから「テキスト」を選択します。
列及びテーブルデータの並べ替え
データの変換から列と行の並び順を変更することもできます。
列はドラッグアンドドロップ操作することで並び順を変えられます。レコードの並べ替えはフィルタリング時と同様、基準となる列の右側の▼を押下し、
ドロップダウンメニューを展開して該当列の昇順または降順でデータを並べ替えられます。
「注文日」の降順にデータを並べてみます。
テーブルのデータが注文日が新しい順にソートされました。
値の置換
Power BIのデータの変換からは値を置き換えることが出来ます。
この機能を使うことでnullを0にする、エラーをnullに置き換えるなどのことが可能です。
列「支払方法」のキャッシュレスを電子マネーに置き換えます。値の置換を行いたい列の右側の▼を押下し、
ドロップダウンメニューを展開して「値の置換...」を選択します。
検索する値と置換後の値を入力して「OK」をクリックします。
キャッシュレスが電子マネーに置き換わりました。
列の追加及び削除
ソースデータにはない列をPower BI上で作成したり、不要な列を削除するこが出来ます。
列を追加する方法はいくつかありますが、
ここではよく使われる日付列を基に年、月等カレンダー情報の列を作成する方法をお見せしたいと思います。
注文日を基に注文年月という列を作成してみます。
列「注文日」を選択した状態で、画面上部の「列の追加」タブを選択すると「日付」というメニューが活性化されます。
年月の列を追加したいですので「月の開始日」を選択して
注文日の月の初日のデータを持つ列を作成します。注文日に基づいて列「月の開始日」が作成されました。
列名も「注文年月」に変えてあげます。
列「配送地域」は東京のみですので削除したいと思います。削除したい列を右クリックして「削除」を選択すると列が削除されます。
行の削除
テーブルの行を削除することも可能です。
例えば、元データの上位2行は空白列の場合空白行を削除する時などに使えます。
今回は1行目のレコードを削除してみます。
「ホーム」タブから「行の削除」>「上位の行の削除」を選択します。
行数に1を入力して「OK」をクリックすると最初の行が削除されます。
データのグルーピング
次にデータのグルーピングについてです。
粒度が細かいデータを集計して新たにテーブルを作りたい場合などに活用できます。
注文月ごとに注文IDの数をカウントして列「月別注文件数」を作成してみます。
「変換」タブから「グループ化」を選択します。
グループ化する列として「注文年月」を指定して、
作成する列名と操作を入力してから「OK」をクリックします。「注文年月」と「注文件数」を持つデータができました。
おわりに
Power BIのデータの変換からはコードを書かなくても加工ができます。
各メニューの名称も初見の人にも分かりやすくなっていますので初めての人も使いやすいのではないかと思います。
この記事では紹介できなかった部分がたくさんありますので今後も紹介させていただきます。