機械学習を用いた列車混雑予測手法
1.概要
ダイヤ乱れ時に混雑予測情報を旅客に提供できれば、旅客の快適性低下の防止に繋げることができると考えられます。そこで、大都市通勤路線において、1時間程度の運転見合わせが発生し、そこから運転を再開した後、遅延が収束するまでを対象に、ニューラルネットワーク (NN) やLightGBMを用いて列車混雑を予測する手法を構築しました。
2.列車混雑を予測するまでの流れ
列車混雑の予測は、①過去のデータを用いた予測モデルの学習と、②ダイヤ乱れ当日の現在時刻までの実績データから現在時刻以降の列車混雑を予測する2つの処理を行います(図 1)。予測モデルの学習では、過去の列車混雑や列車間隔から、データ間の関係性や法則性を学習し、予測モデルを構築します。そして、ダイヤ乱れ当日に、現在時刻までの実績の列車混雑や列車間隔を学習済みの予測モデルに入力し、現在時刻以降の予測混雑が出力されます。この処理を、各列車が各駅を発車する度に行うことで、リアルタイムに直近の実績データを反映した予測結果で更新します。
3.ニューラルネットワーク (NN) を用いた列車混雑予測
NNは、人間の脳の神経細胞網の働きを計算機上で疑似的に扱えるようにモデル化したものです。一つ一つの神経細胞をパーセプトロンと呼ばれる計算モデルで表し、NNはパーセプトロンが複雑に結合したネットワークになります。本研究では、3層構造のフィードフォワード型ニューラルネットワークを用います。 予測モデルは、駅・方面・時間帯毎に別々のモデルを用意して学習し、当日に対応する予測モデルで予測することで、平常時と列車運行時刻が大幅に異なるダイヤ乱れ時の予測精度を向上させています。また、出力データを、予測対象列車の終着駅までの乗車率と現在時刻時点の乗車率との差分値とすることで、平常時と乗車率の値が大幅に異なるダイヤ乱れ時の予測精度を向上させています。図 2にNNの入出力データを示します。
大都市圏の通勤路線を対象に、ダイヤが乱れていない54日分のデータとダイヤが乱れた4日分のデータから学習したモデルを用いて別のダイヤ乱れ日を予測し、精度評価を行いました。運転再開から4時間以内の各列車・駅発時点における予測乗車率と正解乗車率の誤差の累積比率から、予測した全列車・駅の84.9%が、乗車率30%pt以内の誤差で予測できていることを確認しました(図 3)。また、1時間以上遅延している列車・駅に限定しても76.2%であり、大幅にダイヤが乱れている列車でも予測ができていることを確認しています。
4.LightGBMを用いた列車混雑予測
LightGBMは、決定木ベースの教師あり学習手法です。アンサンブル学習の一種である勾配ブースティング手法を用いることにより、従来の決定木を用いた手法よりも高精度に予測できます。 予測モデルは、全列車の全駅発時点で共通のモデルを使います。他の予測手法よりも多重共線性の影響が比較的少ない決定木ベースの手法の特徴を活かし、列車の混雑に影響を与えると考えられる要素を入力データとし、学習・予測を行います。出力データは、乗車率0%~250%を25%区切りで9つに分割した混雑区分です。図 4にLightGBMの入出力データを示します。
大都市圏の通勤路線を対象に、ダイヤが乱れていない54日分のデータとダイヤが乱れた4日分のデータから学習したモデルを用いて別のダイヤ乱れ日を予測し、精度評価を行いました。運転再開から3時間以内の各列車・駅発時点における次の駅の混雑区分の正解率は74.5%であり、予測混雑区分と正解混雑区分の混同行列からも、おおむね正しく予測できていることを確認しました(図 5)。一方で、正解混雑区分が6以下のときは1段階過剰に、8以上のときは1~2段階過少に予測する傾向があることも確認しています。
参考文献
- 中挾晃介,辰井大祐,國松武俊,田中峻一:ニューラルネットワークを用いたダイヤ乱れ時の列車乗車率予測モデルの考案,情報処理学会第97回ITS研究発表会,[MBL/ITS]機械学習(2),2024
- 上田寛人,中挾晃介,國松武俊:LightGBMを用いたダイヤ乱れ時の列車混雑区分予測モデルの検討,情報処理学会第97回ITS研究発表会,[MBL/ITS]機械学習(3),2024
- 中挾晃介,上田寛人,國松武俊,武内陽子,辰井大祐:ダイヤ乱れ時の列車運行時刻の変化に対応したニューラルネットワークによる列車混雑予測手法,情報処理学会第98回ITS研究発表会,[一般講演セッション1](4),2024