しばらく山とランは遠のいています

仕事、そしてコロナの関係でしばらく山やランからは遠ざかっています。来年の春から復帰できるようそろそろ運動再開していきたいと思います。ちなみに今、BIツールのPower BIが半分趣味になって、完全な運動不足になっています。20201020

2021年3月7日日曜日

【Power BI】Covid-19 第三波、今後の収束状況が気になりBIレポートを更新

 少し時間が出来たので、新型コロナのBIレポートを修正しました。
Covid-19も数字が公表されたから1年が経過し、統計データを公開している機関も対応が変ってきました。世界のデータはEUの公開データを使っていますが、これが一週間間隔の集計値にかわり、データ構造も変更になり、その対応をしました。
European Centre for Disease Prevention and Control
https://www.ecdc.europa.eu/en/publications-data/data-national-14-day-notification-rate-covid-19

ここで問題発覚、欧米では週番号単位の集計が一般的なのか新しいデータには一切日付が入っていません。週番号の付与は世界で何種類かあり、PowerBIで普通に計算してしまうと米国方式になります。EUのこのデータは欧州方式で年によって場合分けをしないといけなく面倒です。残念ながらPower BIのPowerQueryにはこの関数がなく、式を作らないと対応できません。日付は文化があるのでいろいろたいへんですね。勉強になりました。

相変わらず米国はひどいですね。第四波はもっと跳ね上がるのでしょうか。日本はこれを見ると大阪、死亡者の数が異常に高いと思うのですが。

日本はこれまで東洋経済が公開していたデータを使っていましたが、これが中断してしまいました。それで、さすがにこの時期なら政府機関が都道府県別のきちんとしたデータを公開しているだろうと思ったら、その期待は見事に裏切られました。厚生省は毎日読み取って自分でデータを作らないといけなく使い物になりません。まとめた推移を集計したデータをどうして公開しないか不思議でならないです。内閣府にいい線いっているデータを見つけましたが一部都道府県別がなく諦めました。いろいろ探して、NHKが推移を都道府県別に集計したデータを公開していることを知り、これを使わせてもらうことにしました。単純なCSVだったのでこれまでのレポートを崩さないようにソースデータ部分のプログラムを慎重に改造して完了です。

NHK特設サイト 新型コロナウイルス
https://www3.nhk.or.jp/news/special/coronavirus/data-widget/#mokuji1

日本国内では、世界のデータはもちろん、日本のデータでさえ公的機関はまともに対応が出来ていない(見つけられないだけかもしれませんが)。もっといろいろなデータを組み合わせたいのですが、程遠い状況です。ヨーロッパはさすがです。わたしは個人的にPower BIのトレーニングも兼ねて扱っていますが、コロナ禍の中、ベースの統計データですから利用ニーズは高いと思います、もっと気軽に扱えるようにしてもらいたいものです。


0 件のコメント: