Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 20, No. 3, pp.19-26
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 28 Feb 2022
Received 08 Feb 2022 Revised 08 Mar 2022 Accepted 11 Mar 2022
DOI: https://doi.org/10.14801/jkiit.2022.20.3.19

시공간 특성을 고려한 딥러닝 기반 교통 속도 예측 모델

박홍규*
*동양미래대학교 컴퓨터소프트웨어공학과
Deep Learning Model for Traffic Speed Prediction Considering Spatial-Temporal Correlation
Hongkyu Park*

Correspondence to: Hongkyu Park Dept of Computer Science, Dongyang Mirae University, Seoul, Korea, Tel. +82-2-2610-1771, Email: hongkyu211@dongyang.ac.kr

초록

교통량과 속도는 지능형 교통 시스템을 구축하기 위해 필요한 가장 중요한 교통 정보이다. 최근 사물인터넷, 빅데이터, 인공지능 등의 기술 발전에 따라 다양한 딥러닝 기술들이 교통 정보 예측에 많이 활용되고 있다. 본 논문에서는 도로의 공간적 특징과 시간에 따른 속도 변화 특징을 반영하기 위하여 3개의 모델을 결합한 CNN-RNN-Attention 속도 예측 모델을 제안한다. 컨볼루션 신경망(CNN)과 순환신경망(RNN)을 활용하여 도로의 공간적 특성과 시계열 특성을 각각 학습하고, 학습된 결과에 어텐션(Attention) 기법을 적용하여 가중치를 부여함으로써 성능을 향상시켰다. 제안된 모델은 한국도로공사 링크 통행속도 데이터를 활용하여 실험을 진행하였으며, CNN 단일 모델, GRU 단일 모델 그리고 CNN과 GRU을 결합한 모델 대비 성능이 우수함을 증명하였다.

Abstract

The volume and the speed of traffic are the key factors for establishing an intelligent traffic system. The latest technical accomplishments such as Internet on Things, big data and artificial intelligence made various deep learning technologies possible to be used for predicting traffic conditions. In this Paper, we propose a CNN-RNN-Attention prediction model combines three models to reflect the spatial-temporal characteristics. Convolutional Neural Network(CNN) and Recurrent Neural Network(RNN) are used to learn spatial and temporal characteristics of roads, respectively. Then we go through the attention model which improves the performance of our model by calculating the weights of CNN-RNN results. The proposed model was tested using the link speed data of Korea Expressway Corporation, and it was proved that the performance result was superior to that of the CNN single model, the RNN single model and the model which are combines CNN with RNN.

Keywords:

traffic predidction, deep learning, CNN, RNN, Attention

Ⅰ. 서 론

첨단 ICT 혁신 기술들의 발달과 교통 빅데이터의 확산으로 인해 지능형 교통 시스템은 계속해서 발전하고 있으며, 미래 모빌리티 분야를 선도하기 위해서 많은 기업들이 투자를 하고 있는 분야이다. 지능형 교통 시스템이란 교통수단 및 시설에 첨단 기술을 접목하여 교통 체계의 운영 및 관리를 자동화해 교통의 효율성과 안전성을 향상시키는 교통 시스템을 의미한다. 버스 도착 안내 시스템, 상황에 따라 자동으로 차량 신호가 바뀌는 스마트 신호 시스템, 내비게이션의 실시간 길 안내 등이 주요 서비스들이다. [1]에서는 지능형 교통 시스템을 위해 해결해야 하는 문제 유형을 3가지 유형, 즉, 택시 운행 궤적의 정상여부 판단과 같은 교통 분류(Traffic classification), 미수집된 데이터를 생성하는 교통 생성(Traffic generation), 속도, 통행량, 여행 수요 등을 예측하는 교통 예측(Traffic forecasting)으로 정의하였다.

그 중에서도 도로의 속도를 예측하는 기술은 시간과 연료 낭비, 공기 오염 등 커다란 사회/경제적 비용을 유발하는 교통 혼잡을 해결하기 위해 가장 근간이 되는 기술로써, 내비게이션의 실시간 길 안내, 스마트 물류 등 다양한 교통 서비스를 가능케 하는 핵심 기술이다. 그러므로 지금까지 많은 연구들이 진행되어 왔다. 과거 시계열 통계 데이터를 기반으로 미래를 예측하는 자동회귀누적이동평균(ARIMA, Auto Regressive Integrated Moving Average)를 활용한 다양한 예측 모델[2]-[5], K-최근접 이웃 모델[6]과 SVM을 활용한 모델[7][8][9]들도 많이 제안되었다. 하지만 교통 데이터의 특성상 주기적으로 데이터 수집은 가능하지만 결측치 등 많은 노이즈와 불확실성을 가지고 있기 때문에 전통적인 시계열 모델은 좋은 예측 성능을 가지기 어렵다.

최근에는 빅데이터와 딥러닝 기술들이 많이 발전하면서 교통 분야에서도 많이 활용되고 있다. 오토인코더[10], LSTM[11], 컨볼루션 신경망(CNN)[12], 심층신뢰망(DBN) [13] 등을 활용한 다양한 교통 예측 모델이 제안되었으며, 최근에는 시공간적 특성을 가진 교통 정보 데이터의 특성을 고려하기 위해 복수의 딥러닝 모델을 결합하는 방식[14][15]들도 많이 연구되고 있다.

본 논문에서는 도로의 공간적 특징과 시간에 따른 속도 변화 특징을 반영하기 위하여 3개의 모델을 결합한 CNN-RNN-Attention 속도 예측 모델을 제안한다. CNN과 순환 신경망(RNN)을 활용하여 도로의 공간적 특성과 시계열 특성을 각각 학습하고, 학습된 결과에 어텐션(Attention) 기법을 적용하여 미래 속도에 영향을 미치는 특성에 가중치를 부여한다.

본 논문에서 제안한 모델은 링크별로 속도 예측 모델을 생성하였으며, 성능 측정을 위해 국내 고속도로와 도시고속국도의 통행속도를 5분 단위로 집계한 한국도로공사의 링크 통행속도 데이터를 활용하였다. 링크란 일정한 규칙에 따라 정의된 도로의 특정 구간을 의미한다. 실험은 크게 2단계로 나누어 진행하였다. 우선, 전처리와 실험을 통해 학습 데이터 최적화를 진행하여 최종 데이터를 생성하고, 본 제안 모델의 성능 평가 및 하이퍼 파라미터 최적화를 진행하였다.


Ⅱ. 관련 연구

[1]에서는 지능형 교통 기술과 관련된 연구들을 시공간(Spatio-temporal) 데이터, 전처리, 교통 예측, 교통 어플리케이션으로 구분하였으며, 교통 예측 문제를 해결하기 위한 여러 연구들을 도로 네트워크 활용, 온도 등 환경 데이터 활용, POI 등 교통에 영향을 미치는 공간적 특성 고려, 휴일과 같은 시간적 특성 고려 등으로 구분하여 정리하였다.

교통 예측 문제는 출발지에서 목적지까지의 시간(Travel time) 예측, 교통 수요(Ttraffic demand) 예측, 교통 흐름(Traffic flow) 예측, 교통 속도(Traffic speed) 예측 등으로 구분할 수 있으며[1], 교통량, 교통 속도 등을 예측하는 방법은 크게 모수통계학과 비모수통계학 방식으로 나눌 수 있다[16].

모수통계학의 가장 대표적인 방법은 ARIMA을 활용하여 과거의 시계열 통계 데이터를 활용하여 미래 값을 예측하는 방법이다. [2]에서는 단일 지점의 교통량을 예측하기 위해 ARIMA 모델을 활용하였으며 Box-Jenkins 방법을 사용하여 ARIMA 모델의 파라미터를 설정하였다. 시계열 데이터를 활용하여 미래를 예측하기에 적합한 모델이었기에 [2]이 제안된 이후로, SARIMA[3], CTM-SARIMA[4], EMD-ARIMA[5] 등 ARIMA를 활용한 다양한 방법들이 제안되었다. 하지만 표본에서 얻어지는 통계량을 이용하여 모집단의 특성을 예측하는 모수통계학 기반 접근 방식은 확률분포에 대한 엄격한 가정이 불가능하고 결측치 등 많은 노이즈와 불확실성이 있는 교통 데이터에는 적합하지 않다.

이러한 한계로 인해 최근에는 비모수통계학 방식의 예측 방법들이 주로 제안되었다. [6]는 교통량과 속도를 예측하기 위하여 K-최근접이웃모델(KNN) 방법을 활용하였고, SVR[7], online-SVM[8], seasonal SVM[9]과 같은 SVM(Support Vector Machine) 계열의 알고리즘을 적용하였다. [17]는 ANN(Artificial Neural Network)을 활용하였으며, [18]는 웨이블릿 변환을 통해 교통 흐름의 불필요한 변동을 제거한 후, ANN을 적용하여 고속도로의 미래 교통 흐름을 예측하였다. 이러한 방식들은전문가 수준의 도메인 사전 지식을 기반으로 많은 전처리 작업이 수반되어야 좋은 성능을 나타낼 수 있는 단점이 존재한다.

최근에는 빅데이터와 인공지능 기술의 발달로 인해 딥러닝 기반의 예측 모델들이 많이 제안되고 있다. [10]은 stacked autoencoder 모델을 활용하여 데이터의 시공간 특성을 반영하여 교통량 예측을 하였다. [11]은 시계열 데이터 분석에 적합한 RNN 계열의 LSTM 알고리즘을 사용하여 교통량, 교통 속도 그리고 교통 혼잡을 예측하는 모델을 제안하였다. [12]은 속도 데이터로부터 생성된 지도 이미지에 공간적 특성을 추출하는 데 적합한 CNN을 적용하였으며, [13]는 DBNs(Deep Belief Networks)를 활용하여 교통량을 예측하였다. [19]은 연결 네트워크를 활용하여 데이터를 그래프 형태로 변환하고 RNN을 활용하여 학습을 진행하여 링크의 공간적 특성을 학습하며, HTM(Hierachical Temporal Memory)[20]은 단일 알고리즘으로 교통 정보 데이터의 시공간적인 특징을 동시에 학습 가능한 모델이며, 기존의 LSTM 방식보다 더 좋은 성능을 얻음을 증명하였다.

또한, 복수의 딥러닝 모델을 결합한 연구도 많이 진행되고 있으며, 주로 데이터의 시공간적인 특징을 동시에 학습 가능하도록 CNN과 RNN을 결합한 모델이 주로 제안되고 있다. [14]은 CNN과 LSTM을 결합한 SRCN 모델을 제안하였으며, [15]은 속도, 통행량 등 데이터별로 1D-CNN과 RNN을 적용하여 개별 모델을 생성한 후에 어텐션 모델을 통해 개별 모델들을 결합하는 하이브리드 멀티모달(Multimodal) 딥러닝 프레임워크(HMDLF)를 제안하였다.

데이터의 시공간적인 특징을 학습하기 위해 CNN과 RNN을 활용한다는 점은 본 논문에서 제안하는 CNN-RNN-Attention과 유사하지만, [15]는 개별 모델의 결합을 위해 Attention 모델을 사용한 반면 본 논문은 Attention 모델을 활용하여 CNN-RNN의 결과 벡터에 가중치를 부여함으로써 시계열 특성을 더 잘 반영하도록 하였다.


Ⅲ. 속도 예측 모델

3.1 데이터 집합 및 전처리

본 논문에서 활용한 데이터는 국내 고속도로와 도시고속국도의 통행속도를 5분 단위로 집계한 한국도로공사 고속도로 공공데이터 포털에서 제공되는 링크 통행속도 데이터(http://data.ex.co.kr/portal/fdwn/view?type=DSRC&num=24)를 활용하였다. 링크란 일정한 규칙에 따라 도로를 마디 형태로 구분한 것이다. 도로를 주행할 때 교차로, 분기점, 터널입구 등 속도의 변화가 발생되는 곳을 노드라고 하며, 노드와 노드를 연결한 선(도로)를 링크라고 한다. 링크는 교통 정보를 관리하는 기준 단위로 주로 사용된다. 상세 데이터 컬럼들은 표 1과 같으며, 링크 통행속도 데이터를 기반으로 링크 특성 데이터, 공통코드 데이터 등을 결합하여 생성하였다. 표 1에서 보는 바와 같이, 1,978개의 링크로 이루어진 총 36개 노선에서 차종유형별 링크별 평균속도가 매일 5분 단위로 집계된 데이터이다. 매달 약 3,300만 건의 데이터가 수집되었으며, 미수집된 속도는 –1로 처리되어 있다.

Data sets

통행속도가 미수집된 비율은 차종유형이 ‘일반’인 경우(일반 차선)에는 약 35%, ‘버스’인 경우(버스 차선)에는 약 89%였다. 미수집 데이터가 너무 많으면 학습 성능이 저하되므로, 본 논문에서는 차종유형이 ‘일반’인 데이터만 활용하였다.

또한, 노선별로 미수집 비율을 집계하여 미수집비율이 낮고(22%) 링크의 개수가 많은(232개) 노선인 경부고속도로(노선번호=10)를 대상 데이터 집합으로 선정하였다.

링크의 속도는 해당 링크의 앞/뒤로 연결된 인접링크들의 속도에 영향을 받으므로 속도를 예측하고자 하는 링크의 앞/뒤 링크 4개씩 총 9개 링크에 대해서 이전 60분 동안 수집된 5분 단위 통행 속도를 최종 데이터로 선정하였으며 그림 1과 같이 휴일여부 정보도 추가하였다.

Fig. 1.

Training data sets

3.2 링크 속도 예측 모델

본 논문에서 제안하는 링크 속도 예측 모델은 CNN을 활용하여 링크들의 공간적 특성을 학습하며, RNN을 활용하여 시간적 특성을 학습한다. RNN모델은 복잡하고 학습 시간이 오래 걸리는 LSTM의 간소화 버전이라고 할 수 있는 GRU를 활용하였다.

그리고 나서 시계열 정보에 대한 가중치를 부여하기 위하여 순환신경망을 통해 학습된 결과들은 완전 연결 계층(Fully connected layer)과 Softmax를 통해 어텐션 가중치(Attention weight)를 생성한다. 이렇게 생성된 어텐션 가중치는 GRU에서 나온 결과들과의 아마다르 곱(Element-wise product)을 통해 컨텍스트 벡터를 생성한다.

생성된 컨텍스트 벡터는 속도 예측에 가장 중요한 정보인 GRU의 맨 마지막 히든 레이어(Hidden layer)의 정보와 결합(Concatnate)하여 완전 연결 계층을 통해 최종 예측을 하며, 자세한 내용은 그림 2와 같다.

Fig. 2.

Speed prediction model


Ⅳ. 성능 평가

본 논문에서는 도로의 공간적 특징과 시간에 따른 속도 변화 특징을 반영하기 위하여 CNN, RNN 그리고 Attention 기법을 활용한 속도 예측 모델을 제안하였다. 제안된 모델의 성능을 확인하기 위하여 한국도로공사에서 제공되는 링크 통행속도 데이터를 사용하였다. 속도 예측 모델은 링크별로 생성하였으며 30분 후와 1시간 후의 속도를 예측하였다.

링크 통행속도 데이터는 2013년부터 2021까지 데이터로 제공되고 있으나, 년도에 따라 링크 아이디가 달라 2021년 데이터만 활용하였으며, 기간을 나눠 1월부터 10월까지의 데이터는 학습 데이터로 사용하고, 11월과 12월 데이터는 테스트 데이터로 사용하였다. 데이터 원본은 36개 노선의 1,978개의 링크 데이터를 가지고 있으나, 결측치 개수와 링크의 연결성 등을 고려하여 최종적으로는 경부고속도로의 232개 링크를 대상 링크로 선정하였다.

실험 환경은 아마존 클라우드 서비스(AWS)의 t2.xlarge(16GB, 4vCPU)에서 진행되었다.

모델의 성능을 비교 측정하기에 앞서, 최종 데이터 최적화를 위해서 최적 시간 기준과 최적 N개 인접 링크 선정이 필요하였으며, 이를 위해 20개의 표본 링크를 대상으로 테스트를 진행하였다. 최적 시간 기준 선정을 위하여 총 5개의 시간 기준(15분, 30분, 60분, 90분, 120분)을 조절변인으로 테스트를 진행하였으며, 실험 결과는 그림 3과 같다. 단순히 종합된 MAE 성능지표만으로는 60분과 90분이 성능이 가장 좋았지만, 큰 차이가 나지 않았으나, 시간 기준별 최적 MAE 성능이 나타난 링크의 개수를 확인한 결과(그림 3-b), 60분으로 최종 선정하였다.

Fig. 3.

Experimental result for optimal duration

최적 N개 인접 링크 선정을 위해서 총 5개의 인접 링크수를 조절변인으로 실험을 진행하였다. 그럼 4-a와 같이, MAE 기준으로는 N=4와 N=8의 성능이 가장 좋았으나, 인접 링크 개수별 최적 MAE 성능이 나타난 링크의 개수(그림 4-b)와 학습 속도를 고려하여 최적 인접 링크의 개수는 4로 선정하였다.

Fig. 4.

Experimental result for the # of links

위 2개의 실험을 통해 속도를 예측하고자 하는 링크와 앞/뒤 4개의 링크, 총 9개의 링에 대해서 이전 60분 동안 수집된 5분 단위 통행 속도를 최종 데이터로 생성하였다.

다음 실험은 10개의 표본 링크를 선정하여 모델링 방법에 따른 성능을 비교하였다. 본 논문에서 제안하는 속도 예측 모델과 CNN 단일 모델, GRU 단일 모델 그리고 CNN과 GRU을 결합한 모델의 예측 성능을 측정하였다.

본 논문에서 제안하는 모델(CNN+RNN+Attention)은 예측값(t+30, t+60)별로 GRU의 은닉층(Hidden state)들의 어텐션 가중치를 생성하여 시계열 정보에 대한 가중치를 부여한다. 이를 통해 데이터의 시공간적 특성을 효과적으로 학습함으로써 표 2에서 보는 바와 같이 가장 우수한 예측 성능을 나타내었다.

Performance comparison by modeling method

그림 5는 Attention 모델을 적용하여 계산된 가중치를 보여준다. x축 값이 0에서 12로 갈수록 최근 시간을 의미하며 y축은 중요도(가중치)다. 그림 5에서 보는 바와 같이 최근 시간에 대한 중요도(가중치)가 높아지는 것을 알 수 있으며, 이는 Attention 모델이 잘 동작하고 있음을 의미한다.

Fig. 5.

Experimental result for Attention model

하이퍼 파라미터 최적화를 위해 표 3의 파라미터 조합을 선정하여 10개의 표본 링크들을 대상으로 제안 모델의 성능을 측정하였으며, 그 결과, 컨볼루션 레이어 개수는 3, 커널 크기는 2, padding은 valid, maxpooling 크기는 3일 때 가장 우수한 성능을 나타내었다.

Hypter parameter optimization

마지막으로 모델링 방법에 따른 학습 시간과 추론(예측) 시간을 비교하였다. 표 4에서 보는 바와 같이 추론(예측) 시간은 거의 동일하나, CNN, RNN 단일모델이나 CNN+RNN 모델에 비해 CNN-RNN-Attention 모델의 학습 시간은 상대적으로 오래 걸리므로 오프라인 환경에서 모든 데이터를 한 번에 학습시키는 배치 학습에 적합하다.

Train time by modeling method


Ⅴ. 결론 및 향후 과제

본 논문에서는 도로의 공간적 특징과 시간에 따른 속도 변화 특징을 반영하기 위하여 3개의 모델을 결합한 CNN-RNN-Attention 속도 예측 모델을 제안한다. CNN과 RNN을 활용하여 도로의 공간적 특성과 시계열 특성을 각각 학습하고, 학습된 결과에 Attention 기법을 적용하여 가중치를 부여하여 최종 예측 모델을 생성하였다.

속도 예측 모델은 링크별로 생성하였으며, 성능 측정을 위해 국내 고속도로와 도시고속국도의 통행속도를 5분 단위로 집계한 한국도로공사의 링크 통행속도 데이터를 활용하였다. 샘플 링크를 선정하여 최종 데이터 생성을 위한 실험과 전처리를 통해 데이터 최적화를 진행하였으며, 그 결과, 특정 링크의 인접한 앞/뒤 4개 링크의 최근 1시간 데이터로 최종 학습 데이터로 생성하였다. 생성된 최종 데이터로 본 논문에서 제안하는 속도 예측 모델과 CNN 단일 모델, GRU 단일 모델 그리고 CNN과 GRU을 결합한 모델의 예측 성능을 측정하였으며, 타 모델 대비 제안 모델의 성능이 우수함을 증명하였다.

향후 연구로는 계절, 날씨, 사고 정보 등 통행 속도에 영향을 미칠 수 있는 외부 변수들을 고려하여 학습 데이터로 추가하거나 개별 모델로 학습하여 예측의 정확도를 향상시킬 예정이다. 또한 본 논문에서 제안하는 모델은 링크별로 생성되어 링크의 개수가 많아지면 모델의 개수도 선형적으로 증가하여 확장성이 떨어지므로 진입/진출여부, 직선여부, 링크길이 등 링크의 특성별로 군집화하고 군집별로 모델을 생성하여 모델의 확장성을 개선할 예정이다.

Acknowledgments

"이 논문은 동양미래대학교 학술연구지원사업의 지원으로 수행된 연구과제입니다."

References

  • H. Yuan and G. Li, "A Survey of Traffic Prediction: from Spatio‑Temporal Data to Intelligent Transportation", Data Science and Engineering, Vol. 6, pp. 63–85, Jan. 2021. [https://doi.org/10.1007/s41019-020-00151-z]
  • B. Smith, B. Williams, and R. Oswald, "Comparison of Parametric and Nonparametric Models for Traffic Flow Forecasting", Transportation Research Part C: Emerging Technologies Vol. 10, No. 4, pp. 303-321, Aug. 2002. [https://doi.org/10.1016/S0968-090X(02)00009-8]
  • B. Williams and L. Hoel, "Modeling and Forecasting Vehicular Traffic Flow as a Seasonal ARIMA Process", Theoretical Basis and Empirical Results. J. Transp. Eng. Vol. 129, No. 6, pp. 664-672, Nov. 2003. [https://doi.org/10.1061/(ASCE)0733-947X(2003)129:6(664)]
  • B. Williams, "Multivariate Vehicular Traffic Flow Prediction Evaluation of ARIMAX Modeling", Transportation Research Record Journal of the Transportation Research Board Vol. 1776, No. 1, pp. 194-200, Jan. 2001. [https://doi.org/10.3141/1776-25]
  • H. Wang, L. Liu, S. Dong, Z. Qian, and H. Wei, "A novel work zone short-term vehicle-type specific traffic speed prediction model through the hybrid EMD-ARIMA framework", Transportmetrica B: Transport Dynamics, Vol. 4, No. 6, pp. 159–186, Jul. 2015. [https://doi.org/10.1080/21680566.2015.1060582]
  • S. Clark, "Traffic Prediction Using Multivariate Nonparametric Regression", Journal of Transportation Engineering, Vol. 129 No. 2, pp. 161-168, Mar. 2003. [https://doi.org/10.1061/(ASCE)0733-947X(2003)129:2(161)]
  • C. H. Wu, J. M. Ho, and D. T. Lee, "Travel-Time Prediction with Support Vector Regression", IEEE Transactions on Intelligent Transportation Systems Vol. 5, No. 4, pp. 276-281, Dec. 2004. [https://doi.org/10.1109/TITS.2004.837813]
  • M. Castro-Neto, Y. S. Jeong, M. K. Jeong, and L. D. Han, "Online-SVR for Short-Term Traffic Flow Prediction under Typical and Atypical Traffic Conditions", Expert Systems with Applications Vol. 36, No. 3, pp. 6164-6173, Apr. 2009. [https://doi.org/10.1016/j.eswa.2008.07.069]
  • W. C. Hong, Y. Dong, F. Zheng, and C. Y. Lai, "Forecasting Urban Traffic Flow by SVR with Continuous ACO", Applied Mathematical Modelling, Vol 35, No. 3, pp. 1282-1291, Mar. 2011. [https://doi.org/10.1016/j.apm.2010.09.005]
  • Y. Lv, Y. Duan, W. Kang, Z. Li, and F. Y. Wang, "Traffic Flow Prediction with Big Data: A Deep Learning Approach", IEEE Transactions on Intelligent Transportation Systems, Vol. 16, No. 2, pp. 865-873, Apr. 2015.
  • X. Ma, Z. Tao, Y. Wang, H. Yu, and Y. Wang, "Long Short-Term Memory Neural Network for Traffic Speed Prediction Using Remote Microwave Sensor Data", Transportation Research Part C: Emerging Technologies, Vol. 54, pp. 187-197, May 2015. [https://doi.org/10.1016/j.trc.2015.03.014]
  • X. Ma, Z. Dai, Z. He, J. Ma, and Y. Wang, "Learning Traffic as Images: A Deep Convolutional Neural Network for Large-Scale Transportation Network Speed Prediction", Sensors Vol. 17, No. 4, pp. 818-833, Apr. 2017. [https://doi.org/10.3390/s17040818]
  • A. Koesdwiady, R. Soua, and F. Karray, "Improving Traffic Flow Prediction with Weather Information in Connected Cars: A Deep Learning Approach", IEEE Transactions on Vehicular Technology, Vol. 65, No. 12, pp. 9508-9517, Dec, 2016. [https://doi.org/10.1109/TVT.2016.2585575]
  • H. Yu, Z. Wu, S. Wang, Y. Wang, and X. Ma, "Spatiotemporal Recurrent Convolutional Networks for Traffic Prediction in Transportation Networks", Sensors Vol. 17, No. 7, pp. 1501-1516, Jun. 2017. [https://doi.org/10.3390/s17071501]
  • D. Shengdong, L. Tianrui, G. Xun, and H. Shi-Jinn, "A Hybrid Method for Traffic Flow Forecasting Using Multimodal Deep Learning", International Journal of Computational Intelligence Systems Vol. 13, No. 1, pp. 85-97, 2020. [https://doi.org/10.2991/ijcis.d.200120.001]
  • A. Ermagun and D. Levinson, "Spatiotemporal Traffic Forecasting: Review and Proposed Directions", Transport Reviews Vol. 38, No. 6, pp. 786-814, Mar. 2018. [https://doi.org/10.1080/01441647.2018.1442887]
  • M. G. Karlaftis and E. I. Vlahogianni, "Statistical Methods versus Neural Networks in Transportation Research: Differences, Similarities and Some Insights", Transportation Research Part C: Emerging Technologies Vol. 19, No. 3, pp. 387-399, Jun. 2011. [https://doi.org/10.1016/j.trc.2010.10.004]
  • S. Kashi and M. Akbarzadeh, "A Framework for Short-Term Traffic Flow Forecasting Using the Combination of Wavelet Transformation and Artificial Neural Networks", Journal of Intelligent Transportation Systems, Vol. 23, No. 1, pp. 60-71, Nov. 2018. [https://doi.org/10.1080/15472450.2018.1493929]
  • X. Wang, C. Chen, and Y. Min, "Efficient metropolitan traffic prediction based on graph recurrent neural network", Computing Research Repository, preprint, 2018.
  • M. Jonathan, John F. Roddick, and Z. Rocco, "An Evaluation of HTM and LSTM for Short-Term Arterial Traffic Flow Prediction", IEEE Transactions on Intelligent Transportation Systems, Vol. 20, No. 5, pp. 1847-1857. May 2019. [https://doi.org/10.1109/TITS.2018.2843349]
저자소개
박 홍 규 (Hongkyu Park)

2004년 : 연세대학교 정보산업공학과 학사

2007년 : 연세대학교 대학원 컴퓨터공학과 석사

2012년 : 연세대학교 대학원 컴퓨터과학과 박사

2012년 ~ 2015년 : 삼성전자

2015년 ~ 2017년 : SK텔레콤 종합기술원

2017년 ~ 현재 : 동양미래대학교 조교수

관심 분야 : 실시간 빅데이터 처리 및 분석, 인공지능

Fig. 1.

Fig. 1.
Training data sets

Fig. 2.

Fig. 2.
Speed prediction model

Fig. 3.

Fig. 3.
Experimental result for optimal duration

Fig. 4.

Fig. 4.
Experimental result for the # of links

Fig. 5.

Fig. 5.
Experimental result for Attention model

Table 1.

Data sets

Columns Values
date_day 20210101 ~ 20211231
date_minute every 5 minutes (00, 05, 10, ... 55)
route_num 36 routes
Link_id 1978 links
lane_type 1: regular lane
2: bus lane
avg_speed average speed of link
link_length 100m ~ 16,740m
link_type rest section: 117개
regluar section: 1861개
road_grade express way: 1,918 counts
city national highway: 60 counts

Table 2.

Performance comparison by modeling method

Modeling MAE(t+30) MAE(t+60) Total MAE
CNN 5.83 6.27 6.05
RNN(GRU) 6.62 7.22 6.92
CNN+RNN 5.62 6.13 5.88
CNN+RNN+Attention 5.12 5.51 5.32

Table 3.

Hypter parameter optimization

Parameters Values
# of convolution layers [2,3,4,5]
Kernal size [2,3]
Padding [‘valid’,‘same]
Maxpooling [None, 2,3]

Table 4.

Train time by modeling method

Modeling Train time(sec) Predict time(sec)
CNN 147 1.32
RNN(GRU) 102 1.28
CNN+RNN 256 1.34
CNN+RNN+Attention 272 1.31