しばらく山とランは遠のいています

仕事、そしてコロナの関係でしばらく山やランからは遠ざかっています。来年の春から復帰できるようそろそろ運動再開していきたいと思います。ちなみに今、BIツールのPower BIが半分趣味になって、完全な運動不足になっています。20201020

2020年6月12日金曜日

【Power BI】ソースデータの読み込み速度の改善1

この5月6月は完全に山とランは諦めました。

現在、Power BIのソースデータ(CSV)をPowerQueryで読み込む時間の短縮に没頭しています。1000万行クラスのデータをインポートするのですが、単純に読み込むのではなくて、その後、いろいろなクエリに参照されて、複数のテーブルが出来上がるのですが、観察していると何度も何度もソースデータを読みに行きます。何時間もかかって読み込んでいてはどうしようもないので悪戦苦闘しています。

Power BIのソースデータ(CSV)をPowerQueryで読み込む場合、読み込いながら次々に処理をしていくストリーム型の処理をしているとのこと。この動作がブラックボックスなのでなかなかうまくいかないです。

MSさんのサポートにしつこく聞きまくり、いろいろサイトも調べて、試して、以下のサイト見つけました。このサイトに高速化のポイントが整理されていてとっても参考になります。これを参考に改造を順番に試していくことにしました。

BI ccountant
Speed/Performance aspects

0 件のコメント: