少し時間が出来たので、新型コロナのBIレポートを修正しました。
Covid-19も数字が公表されたから1年が経過し、統計データを公開している機関も対応が変ってきました。世界のデータはEUの公開データを使っていますが、これが一週間間隔の集計値にかわり、データ構造も変更になり、その対応をしました。
European Centre for Disease Prevention and Control
https://www.ecdc.europa.eu/en/publications-data/data-national-14-day-notification-rate-covid-19
ここで問題発覚、欧米では週番号単位の集計が一般的なのか新しいデータには一切日付が入っていません。週番号の付与は世界で何種類かあり、PowerBIで普通に計算してしまうと米国方式になります。EUのこのデータは欧州方式で年によって場合分けをしないといけなく面倒です。残念ながらPower BIのPowerQueryにはこの関数がなく、式を作らないと対応できません。日付は文化があるのでいろいろたいへんですね。勉強になりました。
相変わらず米国はひどいですね。第四波はもっと跳ね上がるのでしょうか。日本はこれを見ると大阪、死亡者の数が異常に高いと思うのですが。
日本はこれまで東洋経済が公開していたデータを使っていましたが、これが中断してしまいました。それで、さすがにこの時期なら政府機関が都道府県別のきちんとしたデータを公開しているだろうと思ったら、その期待は見事に裏切られました。厚生省は毎日読み取って自分でデータを作らないといけなく使い物になりません。まとめた推移を集計したデータをどうして公開しないか不思議でならないです。内閣府にいい線いっているデータを見つけましたが一部都道府県別がなく諦めました。いろいろ探して、NHKが推移を都道府県別に集計したデータを公開していることを知り、これを使わせてもらうことにしました。単純なCSVだったのでこれまでのレポートを崩さないようにソースデータ部分のプログラムを慎重に改造して完了です。
NHK特設サイト 新型コロナウイルス
https://www3.nhk.or.jp/news/special/coronavirus/data-widget/#mokuji1
日本国内では、世界のデータはもちろん、日本のデータでさえ公的機関はまともに対応が出来ていない(見つけられないだけかもしれませんが)。もっといろいろなデータを組み合わせたいのですが、程遠い状況です。ヨーロッパはさすがです。わたしは個人的にPower BIのトレーニングも兼ねて扱っていますが、コロナ禍の中、ベースの統計データですから利用ニーズは高いと思います、もっと気軽に扱えるようにしてもらいたいものです。
0 件のコメント:
コメントを投稿