山とランニングの日記: Power BIが重くなった時のBufferの使い方

2022年3月2日水曜日

Power BIが重くなった時のBufferの使い方

Power BIを使い込んでくると必ずといっていいほど、速度問題にぶち当たります。

グラフの表示などレポート表示側の速度問題は、１ページあたりのビジュアル数を制限することに尽きるのですが、ソースデータの更新に時間がかかり出すと、このPower Query側の問題はなかなか解決できず困っている人が多いと思います。インポートモードからDirect Queryモードにするのはなかなかなハードルが高いですし、わたしもずっと苦労しています。

わたしは、まず、EXCELやJSON,XMLなど構造を持ったデータをソースデータにするのを諦めてCSVにすることだと思っています。使っていてこれらのタイプは便利なのですが、実感としてCSVとはかなり速度差があるように思います。

次にソースデータを読み込むときの様子を観察していると、同じソースが何度も読み込まれていることに気が付きます。この回数を減らさないといけません。これはPower Queryの特長で、分析に利用するデータセットに必要なクエリは毎回すべて動きます。またそれぞれのクエリは独立に動くので、同じデータセットが何度も読み込まれます。これを解決するのがTable.Buffer()、List.Buffer()、Binary.Buffer()ですが、よく理解して配置しないとほとんど効果がありません。効果を発揮する場所は限定的です。

ＭＳのドキュメントにクエリ参照について説明があり、そこでにBufferについて言及があります。
https://docs.microsoft.com/ja-jp/power-bi/guidance/power-query-referenced-queries

クエリの参照は便利なのでよく使われると思います。ここで上記ドキュメントにある図を利用させていただきます。わたしも勘違いしていましたが、以下のQuery1の最後にTable.Buffer()を配置すると早くなるような気がします。でもこれは効果がないケースがほとんどです。以下の図のように、Power BIは以下のような参照構造のクエリは、結局３のクエリが動いていることになり、Query1のBufferは共有されず、３つ作られます。Bufferは一つのクエリの中でしか効果がなく、クエリ間では共有されません。

で、効果が出るのは、一つのクエリの中で、何度も同じテーブルを参照する（繰り返し処理など）ケースで効果が出ます。インポートモードの場合、Binary.Buffer()で根本をおさえ、あ重い処理で作成したテーブルやリストをクエリ内で何度も参照する場合は、Table.Buffer()、List.Buffer()が有効になります。
要するには一つ一つのクエリの処理が少ないケースではほとんどBufferは効果がないです。

また、クエリ参照でテーブルをいくつも作る場合、DAX側で「新しいテーブル」で作ればデータの再読み込みはないので、処理は速くなると思います。ただし、メモリを結構使うので、あまりたくさんこの方法でテーブルを作るとメモリ不足に陥る可能性もあります。

なお、Power BI デスクトップの設定にキャッシュサイズの設定があります。これはPower Queryエディタのステップ実行の画面のキャッシュで、ソースデータの読み込みの速度改善にはまったく効果はないです。

0 件のコメント:

コメントを投稿

登録: コメントの投稿 (Atom)

山とランの最近の記録

●2016・17年の山
７月知床半島ロングトレイル
９月松本駅～蝶が岳往復ロングトレイル
１月北海道層雲峡アイス
２月北海道網走能取岬アイス
５月毛勝山

●2017・18年の山
8月北海道；斜里岳、雌阿寒岳
９月北海道；支笏湖樽前山
１月北海道層雲峡アイス
２月北海道網走能取岬アイス
５月剱岳八峰・毛勝山（予定）

●マラソン自己ベスト
篠山ABC 2008 3:12:50（3:11:19）
篠山ABC 2012 3:14:11（3:14:01）
加古川マラソン2012 3:14:49（3:14:32）

●2015・16年のマラソン
６月サロマウルトラ100km

　　10:26:10(10:23:19）
11月大阪・淀川市民マラソン 11回目
　　4:20:54(4:20:35)
11月神戸マラソン 3:55:55(3:55:13)
１月宮古島ワイド100km 13:35:34　
　　コースが102㎞だった
３月篠山ABCマラソン（DNS）
４月さが桜マラソン 4:19:05(4:17:53)
４月長野マラソン 3:48:52(3:47:53)

●2016・17年のマラソン
６月サロマウルトラ100km

　　10:56:33(10:54:39)
11月大阪・淀川市民マラソン 12回目

　　3:52:43(3:52:18)

11月神戸マラソン 4:09:10（4:05:16）
１月宮古島ワイド100km 　12:55
３月徳島マラソン　4:14:55
４月長野マラソン　4:00:30

●2017・18年のマラソン
６月サロマウルトラ100km　12:55

11月大阪・淀川市民マラソン 13回目

　　4:23:17

11月神戸マラソン 4:03:52

11月大阪マラソン 4:07:00
４月長野マラソン（予定）

★しばらく更新を止めています。

　ずいぶん、本数も少なり、タイムも遅くなってしまいましたが、ランを楽しむことは変わりません。山も少なくなりました、体力に合わせて無理をせずいろいろな山を楽しんでいきたいと思っています。

しばらく山とランは遠のいています

2022年3月2日水曜日

Power BIが重くなった時のBufferの使い方

0 件のコメント: