2020年6月12日金曜日

【Power BI】ソースデータの読み込み速度の改善1

この5月6月は完全に山とランは諦めました。

現在、Power BIのソースデータ(CSV)をPowerQueryで読み込む時間の短縮に没頭しています。1000万行クラスのデータをインポートするのですが、単純に読み込むのではなくて、その後、いろいろなクエリに参照されて、複数のテーブルが出来上がるのですが、観察していると何度も何度もソースデータを読みに行きます。何時間もかかって読み込んでいてはどうしようもないので悪戦苦闘しています。

Power BIのソースデータ(CSV)をPowerQueryで読み込む場合、読み込いながら次々に処理をしていくストリーム型の処理をしているとのこと。この動作がブラックボックスなのでなかなかうまくいかないです。

MSさんのサポートにしつこく聞きまくり、いろいろサイトも調べて、試して、以下のサイト見つけました。このサイトに高速化のポイントが整理されていてとっても参考になります。これを参考に改造を順番に試していくことにしました。

BI ccountant
Speed/Performance aspects

0 件のコメント:

コメントを投稿

申し訳ないですが、コメントの公開は管理者の確認後に行われます。