AZUSA INSTITUTE OF RESEARCH 梓総合研究所

JP / EN

識者の見聞録(研究理事)

HOME > 識者の見聞録(研究理事) > モバイル位置データを利用した人の行動解析の現状と今後の展望 (その1)

モバイル位置データを利用した人の行動解析の現状と今後の展望 (その1)

RYOSUKE SHIBASAKI

2023.12.21

柴崎亮介

梓設計総合研究所 研究理事
LocationMind(株)CTO、
麗澤大学教授・副学長、東京大学特任教授(名誉教授)

このコラムは2部制です。

筆者は、学術研究者としてだけでなく実事業として、色々なモバイルデータを、時にはリアルタイムで扱った経験を有しており、そうした経験を元にモバイル位置データを利用した行動解析の現状と今後の展望についてまとめる。

 

モバイルデータは、例えば東日本大震災を契機にNHKスペシャル等で取り上げられたのが、世間一般にその存在と有用性を知られた最初の事例であると言える(図1、図2参照)。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図1

図1 東日本大震災当日朝の首都圏における人の流動状況
(データ提供:混雑統計Ⓡ (株)ゼンリンデータコム)

モバイル位置データを利用した人の行動解析の現状と今後の展望 図2

図2 東日本大震災当日の夜における人々の流動状況
(徒歩で帰宅しようとしている人々が多数見える)
(データ提供:混雑統計Ⓡ (株)ゼンリンデータコム)

 

一般的な定期観測や統計調査が災害時に観測や調査を偶然行っているということは極めて稀であるため、モバイルデータのような常時観測データは災害時の観測手段として、特に期待されている。逆に言えば定期的に実施されている統計調査等を置き換えるか否かについては、いくつかの現在さまざまな試行が進み、両者の組合せというところに落ち着くと考えられる。図2を見ると、東日本大震災の発生後、 数多くの人々が帰宅難民となって歩いて帰る状況がきわめて詳細に描かれている。

こうした人の移動を時間空間にマッピングすると図3のようになる。滞留と移動がっつながりながら「軌跡」を形作る。この軌跡に、自宅、店舗、公園などの滞在地点、移動経路と移動手段といったラベルが添付されているが、これは最初から貼ってあるものではなく、GPS位置データから移動ルートや滞留地点を抽出し、 デジタル地図データと重ね合わせることで 対流の目的や 移動の交通手段などを推定する。この推定作業をデータ(軌跡)の数だけ行う。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図3

図3 時空間内で表現した人の移動軌跡

モバイル位置データを利用した人の行動解析の現状と今後の展望 図4

図4 都市空間等における人々の移動軌跡

 

データソースによって数は違うが、概ね人口の5%から10%位のデータが、実態として収集されている。「実態として」とは、 データの品質から見て使えるデータの数といった意味である。

こうしたデータを扱う上で非常に興味深い側面で、しかもまだ十分に開拓されていないものに、人の動きから消費支出などの行動関連指標を推定することがある(図5参照)。例えば店にある一定時間滞在することは、その店舗での消費支出と恐らく強い相関があると推定される。また特定の交通手段で移動することは、カーボンの排出量、あるいはE Vであれば電力の消費量へとつながると期待される。店舗側も訪問者数が多ければ、より多くの電力等を消費する可能性がある。すなわち、人々の移動や滞留、施設毎の訪問者数・滞在時間分布などをGPSデータから直接推定すれば、それらを元に消費支出やカーボン排出量とその時間・空間分布の変化を網羅的、かつかなり正確に捉えることができるのではないかと期待される。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図5

図5 人々の移動・滞留などの活動履歴と、消費支出、エネルギー消費等との関連

 

もう一つの側面は、世界のかなり多くの国でこうした匿名化されたモバイルGPSデータを購入することができるようになったことである。図6はジャカルタの例であるが、こういった途上国の大都市においても、かなり大規模なモバイルGPSデータによる人の行動解析を行うことができる。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図6

図6 モバイルGPSを利用したジャカルタ都市圏における交通分析結果
(LocationMind(株)提供)

 

拡大推定による定量的な推定精度の向上

観測されたモバイルGPSデータの解析から、個々の人の行動についてはかなり正確な推定を行えることが分かってきた。理想的には、市民や住民の全員からモバイルGPSデータが得られれば、単純に集計するだけで全体像を把握できる。しかし、実際のモバイルGPSデータはサンプルであり、そこから全体像を定量的に推定する必要がある。すなわち5%から10%ぐらいのサンプリング率のデータから、どのように全体像を拡大推計するかである。GPSデータからは居住地を推定できるため、居住地の地域単位でGPSデータを集計できる。それを国勢調査などと比較することで、夜間人口に適合した拡大係数を地域毎に推定できる。しかし、拡大推定されたモバイルGPSデータは、本来、鉄道の利用者数や道路の交通量、また大規模商業施設などの訪問者数なども定量的に推定できる点に大きな期待がある。しかし夜間人口だけに着目した拡大推定では十分な精度が得られないケースがある。こうした場合には、鉄道の利用者数や道路の交通量、また大規模商業施設などの訪問者数などの実際の計測値のサンプルに適合するように、拡大係数を再調整する。拡大係数は全体で一律ではなくより細かく想定し、それらが非負条件などを満たすように推定を行う必要がある。これらの推定はどうして大規模な計算が必要になるため、これらを高速化、リアルタイム化することは重要である。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図7

図7 国際調査以外に交通量や駅改札通過人数等も利用した拡大推定の高精度化

 

現地の地点毎の観測データ(実際の人数や車両数のカウント)と突き合わせ、推定精度を改善した事例を挙げる。図8は、歩行者の断面通行量と突き合わせてキャリブレーションを行った例である。おおむねこのぐらいの相関、あるいは絶対パーセント誤差を得ることができる。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図8

図8 GPSカウントを用いて歩行者交通量を推定した例
(LocationMind(株)提供)

 

図9は、自動車の断面交通量(車種の区別は無し)との突き合わせ結果である。また鉄道駅の利用者については、山手線の改札口通過人数との比較の結果、比較的大規模な駅については大体概ね5%から10%程度の精度に追い込むことができる。 ただし、もちろん小さな駅では、通過人数が少なくどうしても精度は悪化し、20%を越えるものもある。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図9

図9 GPSカウントを用いて自動車交通量を推定した例
(LocationMind(株)提供)

 

 

リアルタイム予測への展開

このように、GPSデータによる推定が定量的な精度を持ち得るようになると、データを用いたリアルタイム推定や、予測が十分利用価値を発揮できる状態となる。図10はリアルタイム予測の事例を示している。これは東京駅、新宿駅への流入者数を 予測しているが 毎日繰り返される平日の流入者数については比較的高い精度を達成していることがわかる。一方お盆の初日の週末といった人々の行動の不確実性が高いケースにおいては 予測結果がやや実績値と乖離し予測精度が低下していることがわかる。 ここでは、人間の移動をGPSデータにより短期予測する(予測のリードタイムは1時間)ことを試みている。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図10

図10 駅への流入者数の予測事例
(LocationMind xPop © LocationMind Inc. )

出典:Online Trajectory Prediction for Metropolitan Scale Mobility Digital Twin, Zipei Fan,Xiaojie Yang,Wei Yuan,Renhe Jiang,Quanjun Chen,Xuan Song and Ryosuke Shibasaki
SIGSPATIAL ’22: Proceedings of the 30th International Conference on Advances in Geographic Information Systems,https://doi.org/10.1145/3557915.3561040

 

人々の行動の繰り返しといった平常時の性質を利用しつつ予測を行うためには、過去の相当長い期間にわたってモバイルGPSデータを学習し、予測モデルを構築する必要がある。モバイルGPSデータは数分毎に取得されるため、1ヶ月単位の過去のGPSデータをそのまま利用して行動傾向を学習することは、データ点数が大きくなり、深層学習(例えばLSTM)などを利用しても容易ではない。一方、人の行動を数分単位で予測することは、多くの利用目的にとってそれほど重要ではないと考えられる。

そこで、この例では予測を二段階に分けている(図11)。一つは、クラスターレベルの予測である。これは東京の後、上野に行き、その後常磐線を北千住、柏と移動するといった、主要地点間の移動に関する予測である。たとえば柏のあとは、取手に行くといった予測に対応する。トリップレベルに対応する予測と言っても差し支えない。そのあと、柏から取手に行く経路や交通手段を予測する段階を設ける。これをノードレベルの予測と呼んでいる。この段階では移動する人の属性に依らず交通モードや移動経路は限定されると考えられる。たとえば鉄道、一般道が一般的な交通モードであり、鉄道の場合には常磐線、道路であれば、国道6号線、常磐道などにほぼ限定される。するとノードレベルでは比較的限られた選択肢からの予測を行うことになり、タスクが単純化される。結果として複雑なモデルを利用した予測は必要ではなくなる。一方、クラスターレベルの予測では行き先などの自由度が高いため、上野のあと柏へ行くのか、赤羽や大宮へ行くのかなど比較的難易度の高い予測を行う必要がある。しかし、元々のGPSデータは「主要滞留地点」にまとめられているために点数は大きく減少していることから長期間にわたる学習を比較的容易に行える。これにより、通勤・通学のような繰返し型の移動は確実に予測され、また頻度の低い移動についてもより正確な予測を行える可能性が広がる。さらに予測モデルそのものが単純化されることで、学習時間ばかりではなく予測計算時間も短縮可能となり、リアルタイム予測が実現できる。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図11

図11 2段階構成による人々の流動の予測モデル

 

なお、データドリブンな機械学習による予測は、例えば災害など、過去にそれほど多くの事例がない「異常事態」が生じた時には精度が大きく低下すると言われている。これは学習すべきデータがほとんどないことに起因する。長期的にはモデルが十分な「汎化性能」を獲得し、これまでなかった事例に対しても対応できるようになることが期待されるものの、そもそも大規模言語モデル等に比べ、人の活動データ等は十分多様な環境下での多様なデータが得られる訳ではない。特にレアな現象は、学習の中で大多数を占める「日常の繰返し」事象の中に埋もれてしまい十分な学習が行えないことが多い。そこで「いつもの通り」であった日と、年末年始などのように比較的数少ない「特異な状況」の日を分けて予測モデルを構築し、リアルタイムで流れてくるデータストリームに対して全てのモデルを同時に適用し最も予測性能のよいものをより重要視して予測を行うといった方法が考えられる。これはアンサンブル予測と言われ、気象予測などの分野では広く使われている。また大規模災害のように過去の事例がほとんど無いケースにおいては、人々の行動に関して様々な予測シミュレーションが実施されていることがある。こうした場合には予測シミュレーション結果をそれぞれ学習し、学習モデル群をアンサンブル化することでいわゆる未曾有の大災害にも対応できる可能性がある(図12)。

モバイル位置データを利用した人の行動解析の現状と今後の展望 図12

図12 人流予測へのアンサンブル予測の適用
(LocationMind(株)提供)

その2 へ

LEADERSHIP 研究理事・役員