Korean Institute of Information Technology

Home

The Journal of Korean Institute of Information Technology - Vol. 21 , No. 1

[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 21, No. 1, pp. 131-138
Abbreviation: Journal of KIIT
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Jan 2023
Received 07 Nov 2022 Revised 13 Jan 2023 Accepted 16 Jan 2023
DOI: https://doi.org/10.14801/jkiit.2023.21.1.131

딥러닝 기반 클러스터링을 통한 자전거 도로 분석
이재만* ; 김선종**
*부산대학교 IT응용공학과 박사과정
**부산대학교 IT응용공학과 교수(교신저자)

Bicycle Road Analysis using Clustering based on Deep Learning
Jae-Man Lee* ; Seon-Jong Kim**
Correspondence to : Seon-Jong Kim Dept. of IT Engineering, Pusan National University, Korea Tel.: +82-55-350-5413, Email: ksj329@pusan.ac.kr

Funding Information ▼

초록

최근, 개인의 건강관리를 위한 야외활동이 늘어나고 있는 추세이다. 특히, 자전거 활동 인구가 증가함에 따라 사고로 인한 위험도 늘어나서 자전거 도로에 대한 관리가 필요하다. 본 논문에서는 자전거 활동에 위협이 되는 위험 물체를 인공지능을 기반으로 인식하였고, 클러스터링을 이용하여 도로의 상태를 분석하였다. 이는 도로의 상태나 위험 요소를 인터넷을 통해 사전에 알려줌으로써 사고를 방지할 수 있기 때문이다. 일반적인 위험 요소는 맨홀, 포트홀, 빗물받이 등이 있다. 이러한 위험 요소에 대한 영상은 YOLOv5s을 통해 학습시켰으며, 데이터는 자전거 도로 구간을 이동하면서 스마트폰으로 자전거에 장착하여 영상과 위치를 수집하였다. 주어진 구간에서 수집한 영상은 1,729장으로 클러스터링을 이용하여 분류하였으며, 분석 결과를 지도와 함께 표현하였다. 따라서, 이를 통해 도로의 상태가 바뀌는 지점과 위험 요소의 위치를 확인할 수 있다.

Abstract

Recently, outdoor activities for personal health care are increasing. In particular, as the number of people active in cycling increases, the risk of accidents also increases, so management of bicycle roads is required. In this paper, dangerous objects threatening bicycle activities were recognized based on artificial intelligence and the condition of the road was analyzed using clustering. This is because accidents can be prevented by notifying road conditions or risk factors in advance through the information. Common hazards include manholes, potholes, and rain gutters. Images of these risk factors were learned through YOLOv5s, and data were collected by attaching a smartphone to a bicycle while moving along a bicycle road section to collect images and locations. 1,729 images collected in a given section were classified using clustering, and the analysis results were expressed along with a map with 93% accuracy. Therefore, through this, it is possible to identify the point where the condition of the road changes and the location of the risk factor.


Keywords: bicycle road, road condition, risk factor, artificial intelligence, clustering

Ⅰ. 서 론

우리는 일상생활 속에서 자전거를 이용한 활동 인구가 늘어나는 것을 체감할 수 있다. 한국교통연구원[1]의 보도자료에 따르면, 2017년 우리나라의 자전거 이용 인구수가 1,340만 명에 달하며 이 중에서 330만 명은 매일 자전거를 이용한다고 추정하고 있다. 현재로 생각한다면 이보다 더 많은 사람이 자전거를 이용하고 있다고 할 수 있다. 특히, 도시 근교인 공원 또는 강을 따라 자전거 도로가 조성되어 많은 시민이 이용하는 모습을 볼 수 있다.

현재 국가에서는 사용량이 많고 중요한 일반도로에 오래전부터 꾸준한 유지보수와 관리를 위해 다양한 투자와 연구를 하고 있다. 이는 진동 계측 기반 또는 레이저 스캐닝 방법[2], 열화상 데이터를 기반으로 포트홀을 검출하는 방법[3], 라벨링 작업을 최소화하기 위해 준 지도 학습기법 중 적대적 학습 방법[4], 도로의 동적 장애물을 감지하는 방법[5] 등의 고급 장비나 최신 기술을 이용하여 분석한다.

또한, 매년 다르게 제공하는 데이터 세트를 활용하여 도로 손상 검출 성능 관련 알고리즘을 경쟁시키는 CRDDC2022(Crowdsensing-based Road Damage Detection Challenge)[6]도 있다. CRDDC에서는 여러 국가에서 수집된 데이터를 요약[7]하고 있으며, 이때, 제공하는 도로 데이터는 드론, 모터바이크, 차량에서 촬영한 7개 국가의 도로 영상으로 구성되어 있다.

이와 달리 자전거 도로는 긴급한 문제로 보지 않기에 유지보수 및 자전거 도로의 연구는 느린 편이다. 해외의 경우, 미국 미네소타주에서는 공원 및 산책로의 자전거 도로 상태를 기록하는 연구용 자전거[8]를 운영하고 있다. Camera, GPS, IMU 센서와 같이 다양한 정보를 주기적으로 수집하여 상당한 수준으로 관리하고 있다.

우리나라에서는 자전거 도로에 대한 상황은 기존의 특수한 장치나 센서를 이용한 연구뿐만 아니라 기본적인 데이터도 없는 상황이다. 물론, 이 경우에는 도로에서 사용하는 영상처리 기법을 사용해 실시간으로 검출이 가능한 방법[9], 저가형 웹캠을 사용해 아스팔트, 포장, 비포장과 비교적 단순하게 도로를 인식하는 방법[10] 등을 이용할 수 있다. 최근에는 가벼운 인공지능 모델[11]을 사용해 실시간성과 성능 모두 향상되어 AIoT 장치에서도 검출할 수있도록 하는 도로도 있다. 또한, 드론 영상을 이용하는 도로도 있는데, 이는 인공지능인 Mask R-CNN으로 크랙을 검출하는 방법[12]을 적용하고 있다.

본 논문에서는 자전거 도로의 영상을 기반으로 한 인공지능을 사용하여 위험 요소를 인식하거나 클러스터링 기법으로 도로 상태를 분석한다. 이를 통해 도심에 맞는 자전거 도로 상태나 경로에 대한 정보를 제공하여 사고를 사전에 방지할 수 있는 정보를 제공한다.


Ⅱ. 인공지능 기반 자전거 도로 분석
2.1 데이터 수집

자전거 도로에 대한 데이터는 기존의 CRDDC 에 의한 표본 데이터뿐만 아니라 직접 수집하였다. 그림 1을 보면 기존의 CRDDC의 7개국에서 수집된 데이터를 살펴보면 도로 표면을 멀리 볼 수 있는 형태로 수집되었다.


Fig. 1. 
ORDDC2022 data

그림 2는 본 논문에서 사용된 영상 데이터로써, 자전거의 핸들 바 높이에서 촬영하였다. 이렇게 함으로 멀리 있는 영상은 아니지만, 자전거 가까이서 지면의 영상을 깨끗하게 얻을 수 있다.


Fig. 2. 
Bicycle road data

그림 3는 수집된 데이터의 처리 과정을 나타낸 것이다. 수집된 동영상 및 GPS 값을 물체검출과 클러스터링 처리 후, 그 결과를 데이터베이스로 구축하고 이후에 해당 자전거 도로 구간을 이용하는 사용자들에게 정보를 제공하고자 한다.


Fig. 3. 
Process of the collected data

2.2 인공지능 모델

본 논문에서는 위험 요소에 대한 인식 모델로써 YOLOv5s 모델을 사용하였다. 이는 이전의 CRDDC2020에 참가한 팀들이 사용한 딥러닝 모델과 그에 따른 순위 등을 요약[7]한 결과에서 가장 높은 성능을 보여주었기 때문이며 YOLOv4와 같이 CSPNet 기반의 백본을 사용하며 달라진 점은 학습된 모델의 크기가 작고 학습 속도가 빨라진 장점이 있음에도 물체검출 성능은 비슷하기에 사용하였다.

목표로 하는 위험 물체검출을 하기 위해 모델의 성능은 충분하며 학습 데이터 및 입력 영상의 품질이 더 중요하기 때문에 본 논문에서 목표로 하는 위험 물체검출에는 충분하다.

2.3 위험 물체검출 및 인식

기존에 도로에서는 주로 아스팔트 포장에 생기는 구멍인 포트홀과 크랙 검출을 중점으로 다루고 있지만, 자전거 도로는 일반도로와 다르게 자전거에 위험을 주는 물체 맨홀, 빗물받이를 추가하고 이를 그림 4에 표시하였다. 특히, 맨홀은 시간이 지나면서 도로에 침식으로 높게 튀어나오거나, 낮게 들어가는 경향이 있다. 또한, 바퀴가 얇은 로드 사이클의 경우 빗물받이에 마찰력이 부족해 운전자가 낙차 사고를 유발할 수 있다.


Fig. 4. 
Images of the circle, rectangle manhole, rain gutter, and pothole

2.4. 경로 분석

2.1의 그림 1에 CRDDC2022 데이터는 영상이 연속으로 이어지는 간격이 길거나, 연속되지 않은 데이터로 구성되어 있고 각 영상이 촬영 시간에 맞는 GPS 데이터가 없다. 그래서 클러스터링을 통한 결과물을 지도에 나타내기가 불가능해 특정 구간에 대해 영상은 초당 30프레임, 위치(GPS) 값은 1Hz로 수집하는 스마트폰 앱을 만들어 데이터를 획득하였다.

수집한 동영상은 사전 학습(Pre-trained)된 특징추출기인 VGG(Visual Geometry Group)-19[13]로 추출된 특징을 비지도 학습인 K-평균 알고리즘(K-means clustering algorithm)으로 클러스터링하는데 여기서 K는 입력 데이터 수 N개보다 작거나 같은 수의 그룹으로 나누기 위한 파라미터이다. VGG-19는 19개의 계층으로 구성된 CNN(Convolutional Neural Network)으로 이미지 분류에 사용하였고, 비지도 클러스터링을 수행하고 그 결과를 그래프와 지도에 표현하여 분석한다.


Ⅲ. 실험 및 결과 고찰
3.1 위험 요소 인공지능 학습

위험 요소 학습 데이터의 경우, 인터넷과 주변에서 영상을 획득하여 약 200장을 라벨링 작업으로 준비하였으며 COCO128 데이터셋을 PyTorch기반의 YOLOv5s로 Pre-trained된 파일을 사용하고 앞서 그림 4에서 설명한 4가지 종류의 데이터를 train 80%, val, test 10%씩 각각 구성하고 200 epochs로 학습하였다.

3.2 위험 요소 인공지능 검출

실험에서 입력 데이터로 사용할 영상은 5km 구간을 30분간 주행한 동영상이며 사전에 해당 경로를 조사하여 사람의 시각으로 볼 때 위험도가 높은 위험 요소를 28개를 지정하였고 학습한 모델에 영상을 입력하여 위험 요소를 검출해 표 1에 YOLO에서 사용하는 임계 값(Confidence score) 기준으로 각 결과를 나타내었다.

Table 1. 
Detection result of risk factor
confidence score detection count accuracy(%)
0.90 6 18.75
0.85 9 28.12
0.80 11 35.29
0.75 18 45.00
0.70 23 52.27
0.65 39 55.71
0.60 48 55.81
0.55 52 55.32
0.50 61 55.45

표 1의 결과를 분석해보면 수집한 데이터로 학습한 모델에서 임계 값이 0.60이 최적의 성능을 낼 수 있는 수치이다.

그림 5의 정밀도와 재현율을 분석해보면 위험 요소 검출 결과 중 일부를 그림 6에 나타내었는데 맨홀과 빗물받이 같은 경우는 물체의 형상이 뚜렷하고 패턴이 일정한 규칙이 있어 인식이 잘 되는 편이지만 포트홀의 경우는 다양한 패턴 때문에 이것을 검출하기 위해 다양한 형상을 학습시키는 만큼 오차가 많이 발생하는 것을 검출된 데이터를 확인해본 결과 알 수 있었다. 학습에는 많은 데이터가 중요하고 포트홀도 좀 더 세분화하여 학습할 필요가 있다.


Fig. 5. 
Precision and recall


Fig. 6. 
Detection results of the risk objects

그림 7은 위험 요소가 아님에도 위험 요소로 검출한 영상을 몇 가지 나열하였다. 영상을 살펴보면 도로가 물에 젖었거나 기타 오염된 흔적이지만 마치 포트홀처럼 생김새와 비슷하여 생긴 결과이며 이것 역시 형태가 다양하여 보완이 필요하다.


Fig. 7. 
Incorrect detection of the risk objects

우리가 수집한 포트홀 데이터로 학습한 결과와 비교를 위해 Faster-RCNN-Incention-V2[15]로 인터넷에서 모은 약 600장으로 학습된 모델을 사용해 동일한 우리의 입력 데이터에서 포트홀만을 검출하여 비교하였다.

표 2의 결과를 분석해보면 포트홀 검출에서 도로에 오염으로 인한 검출이 대다수를 차지하고 있으며 형상이 다양함이 원인이라 볼 수 있다.

Table 2. 
Pothole detection comparison results
Model Pothole/detection Accuracy(%)
Ours 13/29 44.82
Faster-RCNN
Incention-V2
9/48 18.75

3.3 도로 클러스터

획득한 영상의 프레임을 모두 클러스터링하기에는 수가 많고 처리시간이 오래 걸리기 때문에 1초 단위로 1,729개의 프레임 영상으로 추출하였다. 그림 8은 그중에서 유형이 같거나 다른 몇 가지 영상들을 나열하였다.


Fig. 8. 
Input images for clustering

그림 9는 본 논문에서 클러스터링 결과 분석을 위해 2가지로 표현하는 방법을 나타낸 것으로 입력 영상(a)에서 VGG-19를 통해 특징 추출(b)한 데이터의 차원 수가 많아 그래프 표현이 어렵다.


Fig. 9. 
Processing process (a) Input image, (b) Feature extraction, (c) Statistics, and (d) Visualization on the map

이를 통해, 2차원 그래프로 한눈에 클러스터링 결과를 확인할 수 있고 지도에 표현하여 도로 구간 분석에 사용할 수 있다.

그림 10은 그래프로 클러스터링 결과를 시각화한 결과이다. 분석해보면 비교적 뚜렷하게 패턴들이 나뉘는 것을 확인할 수 있는데 VGG-19가 도로의 노면에서 충분히 특징을 추출했다고 생각할 수 있다. 이를 통해 실제의 도로 형태에 맞게 같은 패턴들끼리 모여졌는지 클러스터링 패턴 1,729개의 영상을 확인하고 결과를 나타내었다.


Fig. 10. 
Visualization result of clustering

표 3은 확인한 결과를 나타내었고 분석해보면 아스팔트의 경우 도로에 숫자 또는 과속방지턱과 같은 것에서 오차가 발생하였고 시멘트 1, 2는 같은 형태의 도로지만 구간의 오염도가 달라 다른 패턴으로 나뉘었고 보도 구간에서 수집된 시간이 짧아 특별한 오차는 없었다. 클러스터링에서 k 값을 더 크게 하여 다양하게 해보는 방법도 있지만 사실상 도심을 떠나더라도 그만큼 나눌만한 형태의 도로 형태는 다양하지 않다고 보고 4가지 정도로 나누는 것이 성능 결과에서 볼 수 있듯이 합리적이다.

Table 3. 
Clustering results
Cluster label Input image Detection Accuracy(%)
asphalt 541 454 83.91
cement1 809 796 98.39
cement2 347 338 97.40
sidewalk 32 32 100.0
total/avg 1,729 1,620 93.69

그림 11은 클러스터링이 잘못된 대표적인 패턴 영상이며 11(a)은 빠른 시점변화로 인해 카메라의 초점이 맞질 않아 흐릿한 이유이며 11(b)은 여러 형태의 도로로 인해 특징이 분산되었고 11(c)은 질감이 매우 비슷한 결과이다.


Fig. 11. 
Examples of Incorrect clustering pattern

3.4 도로의 위험 및 정보 분석

그림 12(a)은 구간의 클러스터링 결과 패턴들을 색상 및 위치값으로 지도에 표현하였다. 결과를 보면, 색이 명확하게 분리된 부분도 있지만 여러 가지 색이 잡음처럼 바뀌는 짧게 바뀌는 부분이 있다. 이것은 오차를 나타내며 그 외에는 비교적 뚜렷하게 구간을 표현하고 있다. 그림 12(b)는 수집된 영상에서 위험 물체의 검출 결과를 지도에 겹쳐 표현하였고 사용자가 구간의 전체 또는 일부를 주행 전 또는 주행 중에 도로의 상태를 확인해 볼 수 있다.


Fig. 12. 
Mapping results (a) Clustering results on a map, (b) Result of combining the locations of risk factor objects into map


Ⅳ. 결 론

본 논문에서는 자전거 주행 구간의 도로 노면 상태와 맨홀, 빗물받이, 포트홀 등의 위험 요소를 검출하고, 위치 정보가 포함된 도로의 클러스터링 결과를 형태 정보로 제공하는 방법을 제안한다. 위험 요소와 도로 정보는 사전에 위치와 동기화시켰으며, 인공지능과 클러스터링을 통해 선별된 정보를 사용자가 주행 전에 미리 해당 구간의 도로의 상태를 파악할 수 있도록 하였다.

실험을 통해, 첫 번째는 위험 요소들을 검출하여 그 위치를 얻었다. 위험 요소는 뚜렷한 패턴을 보이는 공산물인 맨홀이나 빗물받이의 경우는 문제없이 검출되었으며 오류도 발생하지 않았다. 반면 포트홀은 파손 패턴들이 다양해 단순한 라벨링을 통한 학습 데이터로는 오류 발생이 빈번하다는 것을 알 수 있다. 두 번째는 VGG-19 기반의 특징추출 결과를 비지도 학습 클러스터링으로 도로의 형태가 다른 패턴들과 위치 정보를 얻을 수 있었다. 이를 통해 우리는 두 가지 정보를 지도에 표현해 사용자에게 위험 요소와 도로의 형태가 바뀌는 위치 정보를 제공할 수 있다. 이때, 정확도는 입력 영상의 획득을 도로와 가깝게 촬영하여 도로의 질감과 색상을 얻을 수 있어서 93%의 정확도를 얻을 수 있었다. 앞으로는 더 다양한 구간의 데이터를 수집하여 정확도 및 분석에 필요한 자원에 최적화 방안에 관한 연구를 진행할 예정이다.


Acknowledgments

본 과제(결과물)는 교육부와 한국연구재단의 재원으로 지원을 받아 수행된 3단계 산학연협력 선도대학 육성사업(LINC 3.0)의 연구결과입니다


References
1. Korea Transport Institute, https://www.koti.re.kr/user/bbs/BD_selectBbs.do?q_bbsCode=1005&q_bbscttSn=20170309140233834 [accessed: Sep. 02, 2022]
2. S. H. Choi, S. Y. Kim, and Y. H. Jung, "A Mechanism to profile Pavement Blocks and detect Cracks using 2D Line Laser on Vehicles", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 21, No. 5, pp. 135-140, Oct. 2021.
3. Aparna, Y. Bhatia, and R. Rai, "Convolutional neural networks based potholes detection using thermal imaging", Journal of King Saud University-Computer and Informatio, Vol. 34, pp. 578-588, Mar. 2022.
4. S. B. Shim, "Detection Algorithm of Road Surface Damage Using Adversarial Learning", The Korea Institute of Intelligent Transport Systems, Vol. 20, No. 4, pp. 95-105, Aug. 2021.
5. S. B. Shim and J. J. Jeong, "Detection Algorithm of Road Damage and Obstacle Based on Joint Deep Learning for Driving Safety", The Journal of The Korea Institute of Intelligent Transportation Systems, Vol. 20, No. 2, pp. 95-111, Apr. 2021.
6. Crowdsensing-based Road Damage Detection Challenge(CRDDC2022), https://crddc2022.sekilab.global [accessed: Sep. 02, 2022]
7. D. Arya, H. Maeda, and S. K. Ghosh, "Global Road Damage Detection: State-of-the-art Solutions", IEEE International Conference on Big Data, Atlanta, GA, USA, pp. 5533-5539, Nov. 2020.
8. https://www.trekview.org/blog/2021/trek-view-ride-quality-index [accessed: Sep. 02, 2022]
9. Y. Jo and S. Ryu, "Real Time Pothole Detection System based on Video Data for Automatic Maintenance of Road Surface Distress", KIISE Transactions on Computing Practices, Vol. 22, No. 1, pp. 8-19, Jan. 2016.
10. T. Rateke, K. A. Justen, and A. V. Wangenheim, "Road Surface Classification with Images Captured From Low-cost Camera - Road Traversing Knowledge (RTK) Dataset", Revista De Informática Teórica E Aplicada, Vol. 26, No. 3, pp. 50-64, Dec. 2019.
11. H. A. Muhammad, K. Saran, and H. Y. Muhammad, "Pothole Detection Using Deep Learning: A Real-Time and AI-on-the-Edge Perspective", Advances in Civil Engineering, Apr. 2022.
12. M. H. Lee, N. K. Woo, and C. W. Lee, "Crack Detection on the Road in Aerial Image using Mask R-CNN", Journal of the Korea Industrial Information Systems Research, Vol. 24, No. 3, pp. 23-29, Jun. 2019.
13. S. Karen and Z. Andrew, "Very Deep Convolutional Networks for Large-Scale Image Recognition", International Conference on Learning Representations, Apr. 2015.
14. YOLOv5, https://github.com/ultralytics/yolov5 [accessed: Sep. 02, 2022]
15. https://url.kr/c31z5u [accessed: Jan. 13, 2023]

저자소개
이 재 만 (Jae-Man Lee)

2011년 08월 : 부산대학교 바이오정보전자전공(공학사)

2014년 02월 : 부산대학교 IT응용공학과(공학석사)

2021년 03월 ~ 현재 : 부산대학교 IT응용공학과 박사과정

관심분야 : 신호 및 영상처리 머신/딥러닝

김 선 종 (Seon-Jong Kim)

1996년 08월 : 경북대학교 전자공학과(공학박사)

1995년 02월 ~ 1997년 02월 : 순천제일대학 전임강사

1997년 03월 ~ 현재 : 부산대학교 IT응용공학과 교수

관심분야 : 신호 및 영상처리, 머신/딥러닝, VR/AR, 스마트 카메라