マーケティング企画部の渡辺です。
前回に続いて、「次世代統計利用システム」のオープンデータから「地域メッシュ統計データ」を読みこんで活用する方法を紹介します。
今回は「地域メッシュ統計データ」を実際に読み込んでアプレッソ周辺がどんなところか、調べてみます。
※前回の記事(今回の記事は続きの記事です)
オープンデータ 次世代統計利用システム編 #2「地域メッシュ統計データ」を取得
https://dstn.zendesk.com/hc/ja/articles/220078628
「地域メッシュ統計データ」を読み込んでみよう
前回、「地域メッシュ」とは何か説明し、総務省統計局が公開している「次世代統計利用システム」の「地域メッシュ統計データ」ではどのようなデータが公開されているのか、一覧を取得してみました。
今回は、具体的にデータを取得してみて、アプレッソ本社周辺の情報を調べてみることにします。
アプレッソ本社は地域メッシュコード「5339-4558-2」の500m×500mのメッシュの南東にあります。統計データは一次メッシュ単位で提供されていますので(「5339」)、具体的には、以下のデータを読み込んでみることにしましょう。
- 平成21年経済センサス(500Mメッシュ):全産業事業所数及び全産業従業者数 M5339
- 平成22年国勢調査-世界測地系(500Mメッシュ):男女別人口総数及び世帯総数 M5339
では、前回取得した統計データ一覧のXMLから、それぞれの統計資料の「ID」を調べてみましょう。
<LIST_INF id="T000609M5339">
<STAT_NAME code="00200511">地域メッシュ統計</STAT_NAME>
<GOV_ORG code="00200">総務省</GOV_ORG>
<STATISTICS_NAME>平成22年国勢調査-世界測地系(500Mメッシュ)20101001</STATISTICS_NAME>
<TITLE no="081">男女別人口総数及び世帯総数 1次メッシュ M5339</TITLE>
(略)
</LIST_INF>
<LIST_INF id="T000617M5339">
<STAT_NAME code="00200511">地域メッシュ統計</STAT_NAME>
<GOV_ORG code="00200">総務省</GOV_ORG>
<STATISTICS_NAME>平成21年経済センサス(500Mメッシュ)20090701</STATISTICS_NAME>
<TITLE no="097">全産業事業所数及び全産業従業者数 1次メッシュ M5339</TITLE>
(略)
</LIST_INF>
よって取得するデータの「ID」は「T000609M5339」と「T000617M5339」だと解りました。
統計データを取得する
では、第一回目の記事と同じように、IDから統計データを取得してみましょう。
※第一回目の記事
「オープンデータ 次世代統計利用システム編 #1」 政府提供の「統計情報」を取得
https://dstn.zendesk.com/hc/ja/articles/220350827
既に作成したスクリプトの「statsDataId」を書き換えるだけで取得できます。まずは「男女別人口総数及び世帯総数」を取得してみましょう。
[RESTアダプタでデータを取得する場合]
●「ネットワーク→REST→GET実行」 のアダプタを配置して、以下のようなアイコン一つのスクリプトを作成する。
●アダプタのプロパティを開き、以下のように設定をします。
→[必須設定]:次世代統計利用システム、[クエリパラメータ]/[ヘッダ名][値]:「appId」 と ユーザ登録で取得したアプリケーションID、[パラメータ]/[ヘッダ名][値]:「statsDataId」と「T000609M5339」
→レスポンス設定タブ:[データ出力先]:「ファイルパス]:/data/openData.xml
●スクリプトを実行すると、指定したIDのデータを読みこむことが出来ます。
これで統計データが取得できました。
アプレッソ周辺の情報を調べる:人口
では、取得したデータの中身を確認してみましょう。データの読み方は第一回の記事で説明した通りです。
<CLASS_INF>:データについての説明
<DATA_INF>で使われているデータ値についての説明。
<DATA_INF>:データ本体
<VALUE>で一つのデータになっている。
アプレッソ本社は地域メッシュコードでは「5339-4558-2」にありますが、データ中では「area="533945582"」として表記されています。該当するデータを探すと、以下の四つが見つかります。
<VALUE cat01="T000609001" area="533945582" unit="人">4756</VALUE> <VALUE cat01="T000609002" area="533945582" unit="人">2285</VALUE>
<VALUE cat01="T000609003" area="533945582" unit="人">2471</VALUE>
<VALUE cat01="T000609004" area="533945582" unit="世帯">2690</VALUE>
<CLASS_INF>の記述からデータを解読すると、以下のようになります。
地域メッシュコード「5339-4558-2」の2010年の情報
- 人口総数は 4756人
- うち男性は 2285人
- うち女性は 2471人
- 世帯数は 2690世帯
アプレッソ周辺は、どういうわけか「男性より女性の人口が多い」ことが解りました。また、一世帯あたり1.77人で、単身世帯が多い地区であることも解ります。
アプレッソ周辺の情報を調べる:事業所の数
次に、同じメッシュでのもう一つのデータ
- 平成21年経済センサス(500Mメッシュ):全産業事業所数及び全産業従業者数 M5339
を取得してみましょう。
「ID」は「T000617M5339」でしたから、同じようにしてデータをxmlで取得します。
同じく「area="533945582"」でデータを調べてみると以下のようなデータが見つかります。
<VALUE cat01="T000617001" cat02="1" area="533945582" unit="事業所">444</VALUE>
<VALUE cat01="T000617002" cat02="1" area="533945582" unit="人">4664</VALUE>
「cat01="T000617001"」「cat02="1"」が何かは、取得したxmlの <CLASS_INF> に記述があります。
<CLASS_OBJ id="cat01" name="全産業事業所数及び全産業従業者数">
<CLASS code="T000617001" name="全産業事業所数" level="2" unit="事業所"/>
<CLASS code="T000617002" name="全産業従業者数" level="2" unit="人"/>
</CLASS_OBJ>
よって、結果をまとめると以下となります。
地域メッシュコード「5339-4558-2」の2009年の全産業事業所数及び全産業従業者数
- 事業所の数は 444事業所
- 従業者の総数は、4664人
計算してみると、事業所あたりの平均従業員数は10.5人となります。アプレッソの周辺は小規模な事業者が多いようです。
まとめ、と次回の記事
今回はアプレッソ本社を含む500m×500mの統計データを調べてみました。再度のまとめになりますが、こんなことが解りました。
アプレッソ周辺はこんなところ
- 男性より女性の人口が多い
- 世帯の平均人数は1.77人(単身世帯が多い)
- 事業所の平均従業員数は10.5人(小規模な事業者が多い)
今回はまず、一つのメッシュのデータを読み込んで、どんなことが解るかを紹介しました。
しかし「地域メッシュ統計データ」の特徴は、市区町村単位ではなく、日本全体で500m×500mの単位での統計情報が提供されていて、データを「面」として取り扱いやすい点にあります。
そこで次回の記事ではさらに、「地域メッシュ統計データ」のデータを「ビジュアル」に表示する処理をします。
次回の記事では、ビジュアル的になかなかカッコいい処理結果を作ります。ぜひ次回も記事を読んでいただければと思っております。