[ Article ]

The Journal of Korean Institute of Information Technology - Vol. 24, No. 3, pp.101-116

ISSN: 1598-8619 (Print) 2093-7571 (Online)

Print publication date 31 Mar 2026

Received 20 Feb 2026 Revised 16 Mar 2026 Accepted 19 Mar 2026

DOI: https://doi.org/10.14801/jkiit.2026.24.3.101

사람의 경험적 데이터를 활용한 Graph Attention Network 기반 배송 경로 생성 방법

서한빛^*

; 오홍석^*

; 한병엽^**

; 서영덕^***

; 이의종^*

*충북대학교 소프트웨어학부
**㈜디퓨전랩
***인하대학교 컴퓨터공학과
*충북대학교 소프트웨어학부(교신저자)

Graph Attention Network–based Delivery Route Generation Incorporating Human Experiential Data

Hanbit Seo^*

; Hongseok Oh^*

; ByungYup Han^**

; Young-Duk Seo^***

; Euijong Lee^*

Correspondence to: Euijong Lee School of Computer Science, Chungbuk National University, Republic of Korea Tel.: +82-43-261-3133 Email: kongjjagae@cbnu.ac.kr

초록

전자상거래의 급속한 성장과 당일·익일 배송 수요 증가로 인해 실제 현장 환경을 반영한 효율적 배송 경로 생성 기술의 중요성이 커지고 있다. 기존의 거리 최소화 중심 최적화 기법은 숙련된 배송 기사들이 경험적으로 형성한 경로 선택 전략을 충분히 설명하기 어렵다. 본 연구는 실제 배송 기사 경로 데이터를 활용하여 사람의 경험적 전략을 반영한 배송 경로 생성 방법을 제안한다. GAT(Graph Attention Network)와 Pointer Network를 결합한 모델을 기반으로 이동 빈도 정보, 지역 클러스터링, 2-opt 기반 경로 개선 기법을 적용하였다. 실험 결과, 제안된 방법은 배송 경로의 구조적 일관성을 유지하면서 실제 배송 경로와 유사한 이동 시간을 보였다. 본 연구는 실제 배송 경로 데이터를 학습 신호로 활용하여 경험 기반 배송 경로 생성을 시도했다는 점에서 의의를 가진다.

Abstract

The rapid growth of e-commerce and the increasing demand for same-day and next-day delivery have increased the importance of efficient delivery route generation methods that reflect real-world operational environments. Conventional distance-minimization approaches have limitations in capturing the route selection strategies developed through the practical experience of delivery drivers. This study proposes a delivery route generation method that incorporates human experiential strategies using real delivery route data. The proposed model combines a Graph Attention Network (GAT) and a Pointer Network and integrates transition frequency information, regional clustering, and a 2-opt-based route improvement technique. Experimental results show that the generated routes maintain structural consistency and achieve travel times comparable to actual delivery routes.

Keywords:

delivery route generation, human experiential strategy, graph attention network, pointer network

Ⅰ. 서 론

배송 경로 생성 문제는 물류 및 배송 산업 전반에서 중요한 역할을 수행해 왔으며, 전통적으로는 이동 거리 또는 비용을 최소화하는 최적화 문제로 다루어져 왔다. 그러나 실제 배송 환경에서는 단순한 거리 기반 기준만으로는 배송 기사들이 선택하는 경로를 충분히 설명하기 어렵다. 배송 기사들은 지리적 거리뿐만 아니라 특정 지역을 묶어서 방문하거나, 과거에 반복적으로 사용된 이동 패턴을 따르는 등 경험적 전략에 기반하여 경로를 구성하는 경우가 많기 때문이다.

기존의 차량 경로 문제(VRP, Vehicle Routing Problem)[1] 및 외판원 문제(TSP, Traveling Salesman Problem) 연구[2]는 이동 거리 혹은 비용의 최소화를 목표로 하는 수리적 최적화를 중심으로 발전해 왔다. 그러나 이러한 전통적 경로 탐색 방법은 실제 현장에서 관찰되는 배송 기사 주도 경로 생성 과정을 충분히 설명하지 못한다. 배송 기사의 주도적 경로 생성 과정에서는 동일한 거리 행렬과 제약 조건이 주어져도 기사들은 지역 단위의 묶음 방문, 반복적으로 축적된 이동 습관의 재사용, 교통 및 업무 흐름에 대한 경험적 전략에 따라 최적해와는 다른 경로를 선택하는 경향이 있다. 그럼에도 기존 VRP, TSP 기반 접근은 이러한 경험적 요소를 모델 내부에 명시적으로 포함하기 어렵고, 결과적으로 최적화 관점에서 좋은 경로와 현장에서 실제로 선택되는 경로 사이에 구조적 괴리가 발생한다[3].

최근에는 이러한 한계를 보완하기 위해 인공지능(AI, Artificial Intelligence) 기반 접근법이 제안되고 있으나, 다수의 연구는 여전히 합성 데이터나 수리적 최적화 해를 학습 대상으로 사용하는 경우가 많다[4]. 이로 인해 실제 배송 기사들이 생성한 경로 데이터 자체를 학습 신호로 활용하여, 사람의 경험이 축적된 이동 패턴(예: 지역 연속성, 반복 이동 빈도)을 모델이 내재화하도록 설계한 연구는 상대적으로 제한적이다[5]. 더 근본적으로는, 거리 최소화로 환원되지 않는 현장 중심의 경로 선택 규칙이 무엇이며, 이러한 규칙이 어떤 형태로 경로에 반영되는지에 대한 학습 및 모델링 체계가 충분히 정립되어 있지 않다. 이로 인해 현실적인 방문 순서를 생성하기 위한 방법론적 기반이 여전히 부족한 상황이다.

본 연구에서는 이러한 한계를 극복하기 위해 실제 배송 기사들의 운행 경로 데이터를 활용하여 사람의 경험적 전략을 반영한 배송 경로 생성 방법론을 제안한다. 제안된 방법은 배송지를 노드로 표현한 그래프 구조를 기반으로 GAT(Graph Attention Network)[6]를 사용하여 배송지 간의 관계를 임베딩하고, Pointer Network 기반 디코더[7]를 통해 중복 없는 방문 순서를 생성한다. 또한 과거 이동 빈도, 지역적 연속성, 그리고 경로 후처리를 위한 2-opt 기법[8]을 단계적으로 결합함으로써 보다 현실적이고 배송 효율을 높이는 경로 생성을 목표로 한다.

Ⅱ. 관련 연구

배송 경로 생성과 최적화 문제는 물류 및 배송 산업에서 핵심적인 연구 주제이다. 표 1은 본 연구와 관련된 주요 선행 연구들을 사용된 모델 또는 알고리즘, 결과를 기준으로 비교 분석한 것이다. 선행 연구는 메타휴리스틱 기반 최적화, 인공지능 기반 경로 계획, 그리고 실제 배송 데이터 학습 기반 접근 등 다양한 범주에서 연구가 진행되었으며, 각각 의미 있는 성과를 도출하였다.

Table 1.

Related work table

먼저, 메타휴리스틱 기반 경로 최적화 연구로서 J. Ochelska-Mierzejewska et al.[9]은 차량 경로 문제 해결을 위해 유전 알고리즘을 적용하고 선택·교차·돌연변이 연산자의 조합을 체계적으로 비교 분석하였다. 그 결과, 교차 연산자 중심의 유전 알고리즘이 최적해 대비 약 12~13% 수준의 성능 차이를 보이면서도 대규모 문제에서 근사 최적 경로를 도출할 수 있음을 확인하였다.

다음으로, 현실 환경 정보를 반영한 인공지능 기반 경로 계획 연구로서 W. C. Hu et al.[10]은 교통량과 기상 정보를 활용하여 주행 속도를 예측하고 이를 그래프 기반 최단 경로 탐색과 결합한 경로 계획 시스템을 제안하였다. 다층 퍼셉트론 기반 교통 예측 모델은 약 95%의 정확도를 보였으며, 전체 시스템 수준에서도 약 88% 이상의 예측 성능을 달성하여 실제 물류 운영 적용 가능성을 제시하였다.

최근에는 실제 배송 데이터를 직접 학습하는 딥러닝 기반 경로 학습 연구가 주목받고 있다. B. Mo et al.[11]은 지역 허브에서 고객까지의 배송 환경에서 실제 운전자 경로 궤적을 학습하기 위해 pair-wise attention 기반 pointer neural network를 제안하였으며, 기존 최적화 기반 및 기계학습 기반 방법 대비 실제 경로 편차를 약 15% 감소시키고 disparity score 0.0369의 예측 정확도를 달성하였다.

이처럼 기존 연구들은 메타휴리스틱 기반 최적화, 현실 환경을 고려한 인공지능 경로 계획, 그리고 실제 배송 궤적 학습 기반 딥러닝 접근 등으로 발전해 왔다. 그러나 대부분의 연구는 거리 최소화 중심의 최적화 또는 이미 수행된 경로의 순서를 예측하는 문제에 초점을 두고 있으며, 배송 기사 경험이 축적된 실제 경로 데이터를 학습 신호로 활용하여 현실적인 배송 경로를 직접 생성하는 통합적 접근은 여전히 제한적인 상황이다.

이에 본 연구에서는 실제 배송 기사 운행 데이터를 기반으로 사람의 경험적 전략을 반영한 배송 경로 생성 방법을 제안한다. 제안된 방법은 배송지를 그래프로 표현한 뒤 Graph Attention Network를 통해 배송지 간 구조적 관계를 학습하고, Pointer Network 기반 디코더를 활용하여 중복 없는 방문 순서를 생성한다. 또한 이동 빈도 기반 학습, 지역 클러스터링, 그리고 2-opt 기반 경로 개선 기법을 단계적으로 결합함으로써 실제 배송 경로와 유사한 이동 시간과 구조적 일관성을 갖는 사람의 경험적 전략이 반영된 현실적인 배송 경로 생성을 목표로 한다.

Ⅲ. GAT 기반 배송 경로 생성 방법

본 절에서는 그림 1에 제시된 사람의 경험적 전략을 반영한 배송 경로 생성 방법론을 소개한다. 제안된 방법론은 데이터 수집, 데이터 전처리, 그리고 경로 생성의 세 가지 주요 단계로 구성되며, 전체적인 처리 흐름과 각 단계 간의 관계를 개괄적으로 설명한다. 각 단계에 대한 구체적인 내용은 이후 하위 절에서 순차적으로 상세히 기술한다.

Fig 1.

Overview of methodology for reflecting hum

또한 본 연구에서는 실제 배송 기사들의 경험적 판단을 경로 생성 과정에 효과적으로 반영하기 위해 이동 빈도 기반 학습, 지역 클러스터링 기법, 그리고 2-opt 기반 경로 개선 기법을 추가적으로 도입하였다. 이러한 기법들은 경로 생성 단계에 유기적으로 결합되어, 단순한 거리 최적화에 기반한 경로가 아닌 보다 현실적이고 자연스러운 배송 경로를 생성하는 데 기여한다.

3.1 데이터 전처리

본 연구에서 사용한 배송 데이터는 실제 배송 과정에서 수집된 기록으로, 다양한 현실적 요인에 의해 불규칙한 이동 패턴과 예외적인 사례를 포함하고 있다. 이러한 데이터는 그대로 학습에 사용하면 모델이 일반적인 배송 경로의 특성을 학습하는 데 방해가 될 수 있으므로, 본 연구에서는 모델 학습에 앞서 배송 경로의 일관성과 대표성을 확보하기 위한 데이터 전처리 과정을 수행하였다.

우선, 이상치에 해당하는 배송 경로를 제거하였다. 실제 데이터에는 평균 이동 거리 대비 3배에서 4배 이상 증가하는 이동이 포함된 경우, 마지막 배송이 도착 허브(End hub)와 멀어지는 경우 등이 존재하는데, 이는 일반적인 배송 흐름이 아닌 중간 긴급 배송, 배송 종료 후 추가 배송과 같은 비정상적인 경로 변경으로 판단하였다. 또한 단일 배송만 포함된 사이클이나, 하나의 배송 사이클 내에서 동일한 배송지를 여러 번 방문하는 경우 역시 일반적인 경로 패턴과는 거리가 있다고 판단하여 모델이 불필요한 장거리 이동이나 반복 방문을 학습하는 것을 방지하기 위해 제외하거나 조정하였다.

다음으로, 하나의 건물 또는 동일한 좌표에 여러 고객이 존재하는 경우를 하나의 배송지로 통합하는 전처리를 수행하였다. 이러한 경우 실제 배송에서 배송 기사는 동일한 위치에서 여러 배송을 처리하게 되며, 데이터상에서는 같은 위도, 경도의 위치를 여러 번 배송하는 것으로 표현되기 때문에 통합하였다. 통합된 배송지는 해당 위치에서 처리된 배송의 대표 노드로 간주하였으며, 배송 순서상에서도 하나의 방문으로 처리하였다.

마지막으로, 분석 대상 지역의 일관성을 확보하기 위해 지역 외의 고객 데이터를 제거하였다. 본 연구는 특정 지역 내 배송 경로 패턴을 학습하는 것을 목표로 하므로, 지리적 범위가 다른 데이터가 포함되면 모델이 지역 특성에 맞지 않는 이동 패턴을 학습할 가능성이 있다. 이에 따라 배송지 좌표를 기준으로 행정 구역 범위를 벗어나는 고객은 전처리 단계에서 제외하였다.

이와 같은 데이터 전처리 과정을 통해 본 연구에서는 일반적인 배송 상황을 잘 반영하는 경로 데이터만을 선별하였으며, 이를 통해 이후 학습 단계에서 모델이 비정상적인 이동이나 예외적인 사례에 영향을 받지 않고 배송 경로의 구조적 특성과 경험 기반 패턴을 효과적으로 학습할 수 있도록 하였다.

3.2 경로 생성을 위한 모델

본 연구에서는 배송 경로 생성 문제를 단순한 거리 기반 최적화를 통한 해결이 아닌, 배송지 간의 구조적 관계를 과거 배송 경험이 반영된 학습을 통한 생성 문제로 정의한다. 이러한 문제를 해결하기 위해, 각 배송지를 노드로 표현한 그래프 구조를 입력으로 받아 노드 간 관계를 학습하는 GAT를 인코더로 사용하고, 학습된 노드 표현을 기반으로 실제 배송 순서를 단계적으로 생성하는 Pointer Network 기반 디코더를 결합한 모델을 제안한다.

GAT는 그래프 신경망의 한 종류로, 이웃 노드로부터 정보를 집계할 때 각 이웃의 중요도를 동일하게 가정하지 않고, 어텐션 메커니즘을 통해 중요도를 학습적으로 결정한다는 특징을 가진다. 기존의 GCN(Graph Convolutional Network)[12]는 이웃 노드들의 정보를 정규화된 합으로 취합하는 반면, GAT는 노드 쌍 간의 상호작용을 기반으로 어텐션 계수를 계산하여, 더 중요한 이웃 노드의 정보를 강조한다. 이를 통해 각 노드는 주변 배송지들 중 더 큰 영향을 미치는 노드들로부터 더 많은 정보를 전달받게 된다.

구체적으로, 노드 i와 이웃 노드 j 사이의 중요도는 다음과 같은 어텐션 점수로 계산된다.

e i j = LeakyReLU a T Wh i Wh j

(1)

식 (1)에서 h_i와 h_j는 각각 노드 i와 j의 입력 특징 벡터이며, W와 a는 학습 가능한 파라미터를 의미한다. 계산된 어텐션 점수는 식 (2)에서 softmax 함수를 통해 정규화되어, 이웃 노드 간 상대적 중요도를 나타내는 어텐션 가중치로 변환된다.

α i j = exp ⁡ e ij ∑ k ∈ N i exp ⁡ e ik

(2)

이를 통해 각 노드는 이웃 노드들로부터 전달되는 정보를 식 (3)에서 중요도에 따라 가중 합하여 새로운 표현으로 갱신한다.

h i ′ = σ ∑ j ∈ N i α i j W h j

(3)

배송 경로 문제에서 이러한 특성은 특히 중요하다. 실제 배송 데이터에서는 무조건 지리적으로 가장 가까운 배송지를 다음 방문지로 선택하지 않는 경우가 많다. 배송지의 배달을 원활하게 하기 위해 특정 지역을 묶어서 배송하거나, 최대한 좌회전을 지양하고, 도착했을 때 배송지가 오른쪽에 있어야 하는 등의 이유 때문이다. 즉, 배송지 간 관계는 단순한 유클리디안 거리로 설명되지 않으며, 실제 도로상의 다양한 요인과 허브와의 연관성 등이 복합적으로 작용한다. GAT는 이러한 비선형적이고 고르지 않은 관계를 어텐션 가중치로 자연스럽게 모델링할 수 있기 때문에, 본 연구의 문제 설정에 적합한 인코더 구조라고 판단되어 적용되었다.

GAT 인코더를 통해 각 배송지는 자신의 위치 정보와 이웃 배송지와의 관계를 종합적으로 반영한 저차원 임베딩 벡터로 변환된다. 이 임베딩은 단순한 좌표 정보의 요약이 아니라, 그래프 전체 문맥에서 해당 배송지가 가지는 상대적 위치와 중요도를 포함하는 표현이다. 이러한 표현은 이후 경로 순서를 결정하는 디코더 단계에서 핵심적인 입력으로 사용된다.

경로 생성 단계에서는 Pointer Network 기반 디코더를 사용하였다. Pointer Network는 출력 공간이 고정된 클래스 집합이 아니라, 입력에 포함된 원소들의 인덱스를 직접 가리키는 방식으로 출력을 생성하는 신경망 구조이다. 이는 배송 경로 예측과 같이 "입력으로 주어진 배송지들을 중복 없이 한 번씩 방문하는 순서"를 출력해야 하는 문제에 매우 적합하다. 일반적인 분류 모델이나 회귀 모델은 이러한 순열 제약을 직접적으로 표현하기 어렵지만, Pointer Decoder는 각 디코딩 단계에서 아직 방문하지 않은 노드들 중 하나를 선택하도록 설계할 수 있다.

디코더의 각 단계 t에서 모델은 이전 단계까지 선택된 배송지 정보를 요약한 디코더 상태 s_t와 각 배송지 노드의 임베딩 h_j를 이용하여 다음 방문 후보에 대한 점수를 계산한다.

u t j = v T tanh ⁡ W 1 h j + W 2 s t

(4)

식 (4)에서 v, W₁, W₂는 학습 가능한 파라미터이며, 이 점수는 현재 경로 문맥에서 배송지 j가 다음 방문지로 선택될 적합도를 나타낸다. 식 (5)에서 이 점수를 기반으로 softmax 함수를 적용하여 다음 방문지에 대한 확률 분포를 계산한다.

P π t = j π < t, X = s o f t m a x u t j

(5)

식 (6)에서는 이미 방문한 배송지가 다시 선택되는 것을 방지하기 위해, 해당 노드에 대해서는 마스킹을 적용하여 선택 확률을 제거한다.

u t j = - ∞ if node j has been visited

(6)

본 연구에서 디코더는 이전 단계까지 선택된 배송지 정보와 GAT 인코더로부터 생성된 노드 임베딩을 입력으로 받아, 다음 방문지에 대한 확률 분포를 계산한다. 이때 이미 방문한 배송지는 마스킹을 통해 선택되지 않도록 제한함으로써, 실제 배송 경로와 동일한 제약 조건을 모델에 명시적으로 반영하였다. 이러한 구조는 배송지 개수가 사이클마다 달라지는 현실적인 상황에서도 경로 생성을 가능하게 한다.

GAT 인코더와 Pointer Decoder를 결합한 본 모델의 핵심적인 장점은, 배송지 간 관계를 정적으로 정의하지 않고 데이터로부터 학습하면서도, 최종 출력은 명확한 배송 순서라는 해석 가능한 형태로 제공된다는 점이다. GAT는 배송 기사들의 경험이 누적된 과거 경로 데이터로부터 "어떤 배송지가 다음 선택에 더 큰 영향을 미치는지"를 암묵적으로 학습하고, Pointer Decoder는 이러한 정보를 기반으로 단계적인 의사결정을 수행한다. 결과적으로 본 모델은 단순한 최단 거리 기반 경로가 아닌, 실제 배송 현장에서 관찰되는 경험 기반 이동 패턴을 반영한 경로를 생성할 수 있다.

본 연구에서 배송 경로 예측 문제를 해결하기 위한 모델로 GAT 기반 인코더와 Pointer Network 기반 디코더를 학습하기 위한 방법은 다음 절에 소개되어있다.

3.3 사람의 경험적 전략 학습 방법

본 절에서는 배송 경로 생성 과정에서 사람의 경험적 전략을 모델에 활용하기 위해 두 가지 학습 특징에 대한 활용 방법을 설명한다. 실제 배송 기사들은 단순히 거리만을 기준으로 경로를 구성하지 않고, 과거에 반복적으로 사용된 이동 패턴, 공간적으로 인접한 배송지의 묶음 방문, 그리고 경로 내부의 미세한 조정을 통해 효율적인 배송을 수행한다. 이러한 경험적 전략을 학습 기반 모델에 효과적으로 반영하기 위해, 본 연구에서는 이동 빈도 기반과 지역 클러스터링 특징을 활용한 학습, 그리고 2-opt 기반 경로 개선 기법을 단계적으로 적용하였다.

각 배송지는 그래프의 노드로 표현되며, 노드에는 배송지의 위치 및 구조적 정보를 반영한 특징들이 부여된다. 표 2에서 확인할 수 있듯 정규화된 위도(lat_norm)와 경도(lon_norm)는 배송지의 절대적인 위치 정보를 제공하여 공간적 관계 학습의 기본 입력으로 사용된다. 또한 출발 허브를 기준으로 계산된 거리 r과 방향성 정보 (sinθ,cosθ)는 배송지가 출발 지점으로부터 어느 방향과 거리상에 위치하는지를 나타내며, 이는 경로의 전반적인 진행 방향을 학습하는데 기여한다. 더불어, 각 노드가 일반 배송지인지, 출발 허브(Start hub)인지, 도착 허브(End hub)인지를 구분하기 위해 허브 유형 정보를 원-핫 인코딩(One-hot encoding) 형태로 포함하였다. 이를 통해 모델은 경로의 시작과 종료 지점을 명확히 인식할 수 있다.

Table 2.

Summary of node and edge features

배송지 간 이동 관계는 엣지로 표현되며, 엣지에는 이동 비용과 방향성을 반영하는 특징들이 포함된다. 현재 배송지에서 후보 배송지까지의 이동 거리는 로그 변환 및 표준화를 거쳐 사용되며, 이를 통해 거리 스케일 차이를 완화하고 가까운 배송지가 우선적으로 선택되도록 유도한다. 또한 현재 이동 방향 대비 후보 배송지로의 상대 각도를 (sinΔ,cosΔ) 형태로 표현하여, 급격한 방향 전환보다는 연속적인 이동이 선호되도록 설계하였다. 마지막으로, 후보 배송지에서 도착 허브까지의 거리를 기반으로 한 특징을 추가하여, 경로 생성 과정의 후반부에서 자연스럽게 도착 지점으로 수렴하도록 유도한다.

경로 생성 과정에서는 Pointer Decoder와 beam search[13]를 적용하여 다수의 후보 경로를 탐색하며, 누적 로그 확률, 이동 거리, 그리고 도착 허브까지의 거리 항을 함께 고려한 목적 함수를 통해 최종 경로를 선택한다. 이때 이미 방문한 노드는 다시 선택되지 않도록 마스킹을 적용하고, 도착 허브는 마지막 단계에서만 선택할 수 있도록 제한함으로써 현실적인 경로 제약을 모델에 반영하였다.

이와 같은 설정을 통해 제안된 모델은 배송지의 공간적 위치, 이동 방향의 연속성, 그리고 경로의 완결성을 종합적으로 고려하여 실제 배송 환경에 부합하는 합리적인 배송 경로를 생성할 수 있으며, 연구에서 제안하는 학습 특징 활용에 대해서는 다음 절에 설명되어있다.

3.3.1 이동 빈도 특징 활용

본 연구에서는 배송 경로 생성 과정에서 과거 배송 기사들의 경험적 이동 패턴을 모델에 반영하기 위하여 이동 빈도 기반 특징 학습 방법을 도입하였다. 이 기법은 단순히 지리적 거리만을 고려하는 경로 생성 방식의 한계를 보완하고, 실제 현장에서 반복적으로 관찰되는 배송 순서를 학습에 반영한다.

구체적으로, 전체 학습 데이터에 포함된 과거 배송 경로를 기반으로 특정 배송지 a에서 다음 배송지 b로 이동한 횟수를 집계하여 전이 빈도 행렬을 구성하였다. 출발 허브(Start hub)에서 시작해서 도착 허브(End hub)까지의 실제 배송 구간에서의 유효한 이동 패턴만을 반영하였다. 집계된 빈도 행렬은 각 배송지 a에 대해 정규화되어 조건부 전이 확률 P(bverta)로 변환되며, 이는 다음과 같이 정의된다.

P b a = c o u n t a → b ∑ j c o u n t a → j

(7)

식 (7)에서 count(a→b)는 배송지 a에서 배송지 b로의 전이가 과거 배송 데이터에서 관측된 횟수를 의미한다.

이렇게 계산된 전이 확률은 디코딩 단계에서 엣지 특성 중 하나로 활용된다. 구체적으로, 현재 노드에서 후보 노드로의 전이 확률에 로그 변환을 적용한 후 표준화(z-score)를 수행하여 모델 입력으로 사용하였다. 이를 통해 특정 배송지 간 이동이 과거에 빈번하게 발생한 경우, 해당 후보 노드가 다음 방문지로 선택될 가능성이 자연스럽게 증가하도록 유도하였다.

빈도 기반 특성은 GAT 인코더 이후 Pointer Decoder의 스코어 계산 단계에서 거리 기반 특성, 방향성 특성(상대 각도), 그리고 종착지까지의 거리 특성과 함께 결합되어 사용된다. 이를 통해 제안된 모델은 단순한 최단 거리 기반 경로 생성에 그치지 않고, 실제 배송 기사들의 경험이 반영된 이동 경향을 종합적으로 고려한 경로 생성을 수행할 수 있다.

이러한 빈도 기반 학습 전략은 특히 동일한 지리적 조건에서도 반복적으로 선택되는 배송 순서를 효과적으로 반영할 수 있으며, 결과적으로 더욱 현실적이고 자연스러운 배송 경로를 생성하는 데 기여한다.

3.3.2 지역 클러스터링 특징 활용

본 연구에서는 배송 경로 생성 시 공간적으로 인접한 배송지를 우선적으로 방문하는 배송 기사의 경험적 전략을 모델에 반영하기 위해 지역 클러스터링 기법을 도입하였다. 실제 배송 환경에서는 배송 기사들이 동일한 지역에 속한 배송지를 연속적으로 처리한 뒤 다른 지역으로 이동하는 경향이 나타나며, 이러한 특성을 고려하지 않으면 비현실적인 경로가 생성될 가능성이 있다.

이를 위해 본 연구에서는 모든 배송 사이클 내 배송지의 위치 좌표를 기반으로 K-means[14] 클러스터링을 수행하여 배송지를 여러 개의 지역 클러스터로 구분하였다. 적절한 공간 클러스터 개수를 결정하기 위해, 실루엣 계수[15], Davies-Bouldin 지수[16], Calinski-Harabasz 지수[17]와 함께 ARI(Adjusted Rand Index)를 활용한 부트스트랩 기반 안정성 분석[18]을 통한 다양한 군집 타당도 지표를 사용하여 여러 k 후보 값에 대한 성능을 체계적으로 평가하였다. 그 결과, k=4는 군집 내 응집도와 군집 간 분리도 측면에서 가장 균형 잡힌 성능을 보였으며, 데이터 재 표집 상황에서도 안정적인 군집 구조를 유지하였다. 따라서 본 연구에서는 최종 지역 클러스터 개수로 k=4를 선택하였다. 각 배송지는 하나의 클러스터 ID를 부여받으며, 출발 허브(Start hub)와 도착 허브(End hub)는 지역적 개념에서 제외하기 위해 별도의 식별 값으로 처리하였다.

클러스터 정보는 노드 특성의 일부로 활용된다. 구체적으로, 각 노드의 기본 위치 기반 특성(위도, 경도, 거리, 방향성, 허브 타입)에 클러스터 임베딩을 결합하여 그래프 신경망 인코더의 입력으로 사용하였다. 이를 통해 모델은 단순한 좌표 정보뿐만 아니라, 배송지가 속한 지역적 맥락을 학습할 수 있도록 설계되었다.

또한 디코딩 과정에서는 동일 지역 우선 선택 전략을 명시적으로 유도하기 위해 클러스터 전환에 대한 소프트 패널티를 도입하였다. 현재 방문 중인 배송지와 동일한 클러스터에 아직 방문하지 않은 배송지가 존재하는 경우, 다른 클러스터에 속한 후보 배송지들의 선택 점수에 패널티를 부여함으로써 동일 지역 내 배송지를 우선적으로 방문하도록 유도한다. 이 패널티는 소프트맥스 연산 이전의 스코어 단계에서 적용되며, 하이퍼파라미터를 통해 그 강도를 조절할 수 있다.

이러한 지역 클러스터링 기반 제약은 강제적인 하드 룰이 아닌 소프트 제약 형태로 적용되므로, 필요에 따라 모델이 자연스럽게 클러스터 간 이동을 선택할 수 있는 유연성을 유지한다. 그 결과, 제안된 모델은 동일 지역 내에서는 밀집된 방문 순서를 생성하면서도, 전체 경로 관점에서는 효율적인 이동 경로를 구성할 수 있다.

종합적으로 지역 클러스터링 기법은 배송 경로 생성 과정에 공간적 연속성과 현실성을 부여하며, 단순 거리 최적화 기반 방법 대비 실제 배송 기사들의 경험적 전략을 보다 효과적으로 반영하는 데 기여한다.

3.4 2-opt 기반 경로 개선

본 연구에서는 그래프 신경망과 Pointer Decoder를 통해 생성된 초기 배송 경로의 품질을 추가적으로 향상시키기 위해, 2-opt 기반 경로 개선 기법을 후처리 단계로 적용하였다. 신경망 기반 모델은 전반적인 경로 구조와 방문 순서를 효과적으로 학습할 수 있으나, 국소적인 거리 최적화 측면에서는 여전히 비효율적인 교차 구간이나 불필요한 우회가 발생할 수 있다. 이러한 문제를 완화하기 위해, 본 연구에서는 전통적인 조합 최적화 기법인 2-opt 알고리즘을 활용하여 예측된 경로를 보정하였다.

2-opt 알고리즘은 경로 내 두 개의 간선을 선택한 뒤, 해당 구간을 반전함으로써 전체 이동 거리를 감소시키는 방식으로 동작한다. 본 연구에서는 배송 경로의 현실적인 제약 조건을 고려하여, 출발 허브(Start Hub)와 도착 허브(End Hub)는 고정한 상태에서 중간 배송지들에 대해서만 2-opt 연산을 적용하였다. 이를 통해 배송의 시작과 종료 지점을 유지하면서도, 경로 내부에 존재하는 불필요한 교차나 비효율적인 이동을 효과적으로 제거할 수 있도록 설계하였다.

구체적으로, Pointer Decoder의 beam search을 통해 생성된 방문 순서를 기반으로 초기 경로를 구성한 후, 경로 내부의 두 지점 i와 k를 선택하여 해당 구간을 반전한 새로운 경로를 생성한다. 이때 선택되는 인덱스는 다음 조건을 만족하도록 제한하였다.

1 ≤ i < k < n - 2

(8)

식 (8)에서 n은 배송 경로에 포함된 전체 노드의 개수를 의미하며, 출발 허브와 도착 허브는 반전 대상에서 제외된다. 생성된 새로운 경로는 기존 경로와 비교하여 총이동 거리가 감소하는 경우에만 수용되며, 이러한 개선 연산은 사전에 정의된 최대 반복 횟수에 도달하거나 더 이상의 거리 개선이 발생하지 않을 때까지 반복된다.

2-opt 기반 경로 개선 기법은 학습 과정에는 관여하지 않고 추론 단계에서만 적용되는 후처리 방법으로, 모델의 학습 안정성이나 추론 속도에 큰 부담을 주지 않으면서도 경로 품질을 효과적으로 향상시킬 수 있다. 특히, 신경망 모델이 학습한 경험 기반 경로 생성 결과를 유지한 채, 거리 측면에서의 국소적인 비효율만을 보완한다는 점에서 실용적인 장점을 가진다.

결과적으로, 제안된 2-opt 기반 경로 개선 기법은 모델이 생성한 경로의 전반적인 구조와 인간 배송 기사의 경험적 전략을 보존하면서도, 총 이동 거리를 추가적으로 단축시켜 보다 효율적이고 현실적인 배송 경로를 생성하는 데 기여한다.

Ⅳ. 실험 결과

본 연구에서는 기계학습을 활용하여 사람의 경험적 전략을 활용한 경로를 생성하기 위해 실제 배송 기사들의 운행 경로 데이터를 수집하였다. 디퓨전 랩에서 총 3명의 배송 기사가 돌아가며 운행한 데이터이며, 2024년 10월부터 2025년 11월까지의 371개의 배송 데이터를 수집하였다. 사용한 배송 데이터는 개별 방문 기록 단위로 구성되어 있으며, 각 기록에는 배송 사이클 식별자, 해당 사이클 내 방문 순서(step_in_cycle), 고객명, 배송 담당자, 위도 및 경도 정보가 포함된다. 하나의 배송 사이클은 출발 허브에서 시작하여 다수의 배송지를 방문한 후 도착 허브에서 종료되는 하나의 완결된 배송 경로를 의미한다. 본 연구에서는 각 배송 사이클을 하나의 그래프 샘플로 변환하였으며, 그래프의 노드는 개별 배송지 및 허브를, 방문 순서는 step_in_cycle을 통해 정의하였다. 이를 통해 실제 배송 기록을 순차적 방문 구조를 갖는 그래프 기반 학습 데이터로 구성하였다.

본 연구에서는 모델의 성능 평가를 위해 학습/테스트 분할 방식을 사용하였다. 전체 배송 데이터로부터 생성된 그래프들을 무작위로 섞은 후, 80%는 학습 데이터로 사용하고 20%는 테스트 데이터로 사용하였다. 데이터 분할은 개별 방문 기록 단위가 아니라 배송 경로 단위인 cycle_id를 기준으로 수행하였다. 이는 동일한 배송 사이클에 속한 노드들이 학습 집합과 테스트 집합에 동시에 포함되는 것을 방지하여 데이터 중복과 정보 누수를 방지하기 위함이다. 따라서 하나의 배송 경로에 포함된 모든 노드는 동일한 데이터 집합에만 속하도록 구성하였다.

실험에 사용되는 주요 하이퍼파라미터는 표 3을 통해 확인할 수 있으며, 여러 후보 값을 대상으로 한 실험적 튜닝을 통해 결정하였다. 구체적으로 beam width, 거리 패널티 계수(λ_dist), 도착 허브 거리 패널티 계수(λ_end), 클러스터 전환 패널티(β_switch) 등의 값은 다양한 조합을 실험적으로 비교하여 경로 생성의 안정성과 이동 거리 감소 효과가 균형을 이루는 값을 최종적으로 선택하였다. 또한 2-opt 알고리즘의 최대 반복 횟수는 경로 개선 효과와 계산 비용을 함께 고려하여 설정하였다.

Table 3.

Hyperparameter settings used in the experiments

본 연구에서는 세 가지 방법이 순차적으로 쌓이며 종합된 결과를 배송 데이터와 비교하여 평가한다. 빈도 기반 학습만 적용된 결과, 지역 클러스터링 방법이 추가된 결과, 마지막으로 2-opt 개선 방법까지 추가된 결과를 각각 배송 데이터와 비교하며, 최종적으로 시간 비교를 통해 얼마나 배송 데이터와 근사하게 경로가 생성되었는지 평가한다. 각 결과에 대한 상세한 설명은 이후 하위 절에서 제시된다.

4.1 빈도 기반 특징을 활용한 학습 결과

본 절에서는 이동 빈도 기반 학습 기법만을 적용한 경로 생성 결과를 실제 배송 경로와 비교하여 분석한다. 그림 2는 두 개의 배송 사이클에 대해 실제 배송 경로(Label)와 빈도 기반 학습 결과(Pred)를 시각적으로 비교한 예시를 보여준다.

Fig. 2.

Results of using frequency-based feature

먼저, 빈도 기반 학습을 적용한 결과, 모델은 과거 배송 데이터에서 반복적으로 관찰된 이동 순서를 일정 부분 효과적으로 재현하는 경향을 보였다. 특히 동일한 배송지 집합 내에서 자주 사용되었던 이동 방향이나 순서가 예측 경로에서도 반영되었으며, 이는 단순 거리 기반 접근법과 달리 과거 배송 기사들의 경험이 누적된 이동 패턴을 학습하고 있음을 보여준다. 이러한 결과는 빈도 정보가 다음 방문지 선택에 유의미한 단서로 작용함을 보여준다.

그러나 빈도 기반 학습만ㅋ을 적용한 경우, 경로의 전반적인 구조적 일관성 측면에서는 한계가 관찰되었다. 그림 2에서 확인할 수 있듯이, 일부 예측 경로에서는 실제 배송 경로와 달리 불필요한 장거리 이동이나 비연속적인 점프가 발생하는 사례가 나타났다. 이는 특정 배송지 간 전이 빈도가 높게 관측되었더라도, 해당 이동이 전체 경로 맥락이나 공간적 연속성을 충분히 고려하지 못한 채 선택될 수 있음을 의미한다.

이러한 비연속적인 점프와 장거리 이동을 해결하기 위해서 모든 노드를 두고 클러스터링을 진행하여 노드 사이의 관계를 추가하여 같은 지역의 노드이면 최대한 한꺼번에 배송하고 넘어갈 수 있는 경로를 생성할 수 있게 유도하고자 하였다.

4.2 지역 클러스터링 학습 결과

본 절에서는 이동 빈도 기반 학습에 더해 지역 클러스터링 기법을 적용한 경로 생성 결과를 실제 배송 경로와 비교하여 분석한다. 그림 3은 두 개의 배송 사이클에 대해 실제 배송 경로(Label)와 빈도 및 지역 클러스터링을 함께 적용한 예측 경로(Pred)를 시각적으로 비교한 결과를 보여준다.

Fig. 3.

Results of adding clustering features

지역 클러스터링을 추가적으로 적용한 결과, 빈도 기반 학습만을 사용했을 때 관찰되었던 비연속적인 이동이나 장거리 점프 현상이 상당 부분 완화됨을 확인할 수 있다. 특히 공간적으로 인접한 배송지들이 동일한 클러스터로 묶이면서, 예측 경로에서도 실제 배송 경로와 유사하게 한 지역 내 배송지를 연속적으로 방문한 후 다른 지역으로 이동하는 패턴이 더욱 명확하게 나타났다. 이는 배송 기사들이 실제로 사용하는 지역 단위 방문 전략이 모델에 효과적으로 반영되었음을 의미한다.

또한, 클러스터링 기반 학습은 경로의 전반적인 구조적 일관성을 향상시키는 데 기여하였다. 그림 3에서 확인할 수 있듯이, 배송지 간 이동이 특정 지역 내부에서는 상대적으로 짧고 밀집된 형태로 구성되며, 클러스터 간 이동은 제한적인 횟수로 발생한다. 이러한 특성은 실제 배송 경로에서 관찰되는 공간적 연속성과 잘 부합하며, 빈도 정보만으로는 충분히 반영하기 어려웠던 지역적 맥락을 효과적으로 보완한다.

그러나 지역 클러스터링을 적용하였음에도 불구하고, 일부 경로에서는 여전히 국소적으로 비효율적인 이동이나 교차 구간이 발생하는 사례가 관찰된다. 이는 클러스터 단위의 방문 순서는 안정화되었으나, 클러스터 내부에서의 세부 방문 순서가 항상 최단 거리 관점에서 최적이라고 보장되지는 않기 때문이다. 이러한 한계는 이후 2-opt 기반 경로 개선 기법을 통해 추가적으로 보완한다.

4.3 2-opt 개선 결과

본 절에서는 이동 빈도 기반 학습과 지역 클러스터링을 통해 생성된 배송 경로에 2-opt 기반 경로 개선 기법을 추가로 적용한 결과를 분석한다. 그림 4는 두 개의 배송 사이클에 대해 실제 배송 경로(Label)와 2-opt 개선이 적용된 예측 경로(2-opt)를 시각적으로 비교한 예시를 보여준다.

Fig. 4.

Route improvement using 2-opt

2-opt 기반 경로 개선을 적용한 결과, 예측 경로에 포함되어 있던 불필요한 교차 구간과 국소적인 장거리 우회가 효과적으로 제거됨을 확인할 수 있다. 특히 클러스터 내부 또는 클러스터 간 경계 부근에서 발생하던 비효율적인 연결이 개선되면서, 전체 경로의 이동 거리 측면에서 추가적인 감소 효과가 나타났다. 이러한 결과는 2-opt 기법이 경로 내부의 국소적인 비효율을 보정하는 데 효과적인 후처리 방법임을 보여준다.

중요한 점은 2-opt 개선이 경로의 전반적인 구조나 방문 순서를 근본적으로 변경하지 않는다는 점이다. 그림 4에서 확인할 수 있듯이, 2-opt 적용 이후에도 배송지의 지역적 묶음과 방문 흐름은 유지되며, 빈도 기반 학습과 지역 클러스터링을 통해 형성된 경험 기반 경로 구조가 보존된다. 즉, 2-opt는 신경망 모델이 학습한 사람의 경험적 전략을 훼손하지 않으면서, 거리 관점에서의 미세한 비효율만을 보완한다.

또한 본 연구에서는 실제 배송 환경의 제약을 고려하여, 출발 허브(Start hub)와 도착 허브(End hub)를 고정한 상태에서 중간 배송지들에 대해서만 2-opt 연산을 적용하였다. 이를 통해 경로의 시작과 종료 조건을 유지하면서도, 내부 경로 품질을 안정적으로 개선할 수 있도록 설계하였다.

종합적으로, 2-opt 기반 경로 개선 기법은 학습 단계에 영향을 주지 않는 후처리 방식임에도 불구하고, 예측 경로의 총이동 거리를 추가적으로 감소시키고 경로의 시각적 및 구조적 품질을 향상시키는 데 기여한다. 이는 빈도 기반 학습 → 지역 클러스터링 → 2-opt 개선이라는 단계적 구성 방식을 통해, 사람의 경험적 전략을 반영하면서도 효율적인 배송 경로를 생성할 수 있음을 보여준다.

방법론을 단계적으로 중첩하여 적용할수록 보다 효율적인 배송 경로가 생성된다는 점은 표 4을 통해 확인할 수 있다. 학습에 사용되지 않은 70개의 테스트 그래프로 네이버 지도의 길 찾기 기능을 통해 label과 model의 소요 시간을 측정하였고, 도로의 상황이 똑같다는 가정을 위해 배송 시작 시간을 오전 9시로 가정한 시뮬레이션 기반 평가를 수행하였다. 구체적으로, 동일한 출발 시각 조건에서 각 배송 경로에 대해 네이버 지도 API가 제공하는 예상 이동 시간을 산출하여 경로 간 이동 시간을 비교하였다. 빈도 기반 특징만을 활용한 경우 label과 평균 소요 시간의 차이는 약 12분으로 나타났으며 Label이 더 짧은 소요 시간으로 측정됐다. 지역 클러스터링 특징을 추가한 결과 평균 소요 시간의 차이가 약 10분으로 감소하였으며, 이는 공간적으로 인접한 배송지를 우선적으로 방문하도록 유도함으로써 불필요한 장거리 이동이 줄어든 결과로 해석할 수 있다.

Table 4.

Travel time evaluation using a navigation application

나아가 빈도 기반 학습과 지역 클러스터링에 2-opt 기반 경로 개선 기법을 추가로 적용한 경우, 평균 소요 시간의 차이는 약 5분으로 크게 감소하여 label과 가장 근사했다. 이는 2-opt 후처리를 통해 경로 내부의 국소적인 비효율과 교차 구간이 효과적으로 제거되었음을 보여주었다. 세 가지 시간 비교에 대해서 대응 표본 검정을 진행하였고 전부 p값이 0.01 미만으로 유의미한 비교라는 것을 확인할 수 있었다.

이러한 결과는 제안된 방법론이 단순한 거리 기반 최적화가 아닌, 배송 기사들의 경험적 전략과 공간적 연속성을 단계적으로 반영함으로써 실질적인 배송 효율 향상을 달성할 수 있음을 보여준다.

4.4 생성된 경로 평가

생성된 경로에 대한 평가는 step-wise Top-k accuracy를 통해 수행하였다. Step-wise Top-k accuracy는 디코딩 과정의 각 단계에서 모델이 선택 가능한 후보 노드들 중 정답 다음 노드를 얼마나 높은 순위로 배치하는지를 평가하는 지표로, 전역 경로 길이나 최종 경로 일치 여부와 같은 단일 경로 수준의 지표와 달리 순차 의사결정 과정 전반의 선택 품질을 세밀하게 분석할 수 있다.

k-민감도 분석 결과, 표 5를 보면 step-wise Top-1 정확도는 0.851로 나타나 모델이 관측된 경로 생성 정책을 높은 수준으로 모사하고 있음을 확인하였다. 특히 Top-2에서 0.949까지 큰 폭으로 증가하여 대부분의 오차가 근본적으로 잘못된 선택이 아니라 소수 후보 간의 미세한 순위 차이에서 기인함을 확인하였다. 반면 k=4 이후에는 정확도 증가 폭이 1% 미만으로 급격히 감소하며 성능 포화 현상이 관찰되었다.

Table 5.

Step wise Top-k accuracy results

이러한 결과는 제안된 모델이 전반적으로 라벨 경로의 순차적 의사결정 구조를 정확히 학습하고 있으며, 실제 의사결정 지원 상황에서도 3개 또는 4개의 소수의 후보 집합만으로 충분한 경로 선택 신뢰도를 확보할 수 있음을 시사한다.

Ⅴ. 결 론

본 연구에서는 사람의 경험적 전략을 반영하여 배송 경로를 생성하는 모델을 제안하였다. 이는 사람이 직접 배송 경로를 작성하지 않더라도 경험이 쌓인 데이터와 방법론을 활용하여 앞으로의 배송 요청에 대한 경로 생성을 지원한다. 실험 결과 사람의 경험적 전략인 빈도 기반 방법, 지역 클러스터링 방법, 2-opt 개선 방법을 통합한 모델이 라벨 경로와 배송 소요 시간 측면에서 평균적으로 약 5분밖에 차이가 나지 않는 근사함을 보여 더 나은 경로 생성의 실현 가능성을 확인하였다.

그러나 본 연구에서 사용한 데이터는 약 1년 동안 수집된 371개의 배송 사이클과 3명의 배송 기사 데이터로 구성되어 있어, 다양한 지역적 특성이나 배송 패턴을 충분히 반영하기에는 규모 측면에서 제한이 있을 수 있다. 따라서 본 연구의 결과만으로 모델의 일반화 성능을 완전히 검증했다고 보기는 어렵다.

향후 연구에서는 더 많은 배송 기사와 다양한 지역에서 수집된 대규모 배송 데이터를 활용하여 모델의 일반화 성능을 보다 체계적으로 검증할 필요가 있다. 특히 기사별 배송 패턴 차이를 고려한 교차 검증 또는 지역별 데이터 분할을 통한 평가 등을 수행함으로써, 경험 기반 배송 경로 생성 모델의 강건성과 실제 물류 환경에서의 적용 가능성을 보다 종합적으로 분석할 계획이다.

Acknowledgments

본 논문은 2025년도 교육부 및 충청북도의 재원으로 충북RISE센터의 지원을 받아 수행된 지역혁신중심 대학지원체계(RISE)(2025-RISE-11-014-03) 및 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받아 수행된 지역지능화혁신인재양성사업(IITP-2026-RS-2020-II201462)의 결과입니다.

References

P. Toth and D. Vigo, "The vehicle routing problem", SIAM, pp. 1-367, Jan. 2002. [https://doi.org/10.1137/1.9780898718515]
D. L. Applegate, R. E. Bixby, V. Chvátal, and W. J. Cook, "The traveling salesman problem: A computational study", Princeton University Press, pp. 1-608, Jan. 2011.
A. Konovalenko, L. M. Hvattum, and K. A. H. Iversen, "Predicting last-mile delivery route deviations using machine learning", Expert Systems with Applications, Vol. 298, pp. 1-12, Jan. 2026. [https://doi.org/10.1016/j.eswa.2025.129921]
J. Sui, S. Ding, X. Huang, Y. Yu, R. Liu, B. Xia, Z. Ding, L. Xu, H. Zhang, and C. Yu, "A survey on deep learning-based algorithms for the traveling salesman problem", Frontiers of Computer Science, Vol. 19, No. 6, pp. 1-15, Jun. 2025. [https://doi.org/10.1007/s11704-024-40490-y]
S. Moons, K. Ramaekers, A. Caris, and Y. Arda, "Integrating production scheduling and vehicle routing decisions at the operational decision level: A review and discussion", Computers & Industrial Engineering, Vol. 104, pp. 224-245, Jan. 2017. [https://doi.org/10.1016/j.cie.2016.12.010]
P. Veličković, G. Cucurull, A. Casanova, A. Romero, P. Liò, and Y. Bengio, "Graph attention networks", Proc. International Conference on Learning Representations (ICLR), Vancouver, Canada, pp. 1-12, Apr. 2018.
O. Vinyals, M. Fortunato, and N. Jaitly, "Pointer networks", Proc. Advances in Neural Information Processing Systems (NeurIPS), Montréal, Canada, pp. 2692-2700, Dec. 2015.
K. Helsgaun, "An effective implementation of the Lin–Kernighan traveling salesman heuristic", European Journal of Operational Research, Vol. 126, No. 1, pp. 106-130, Oct. 2000. [https://doi.org/10.1016/S0377-2217(99)00284-2]
J. Ochelska-Mierzejewska, A. Poniszewska-Marańda, and W. Marańda, "Selected genetic algorithms for vehicle routing problem solving", Electronics, Vol. 10, No. 24, pp. 1-15, Dec. 2021. [https://doi.org/10.3390/electronics10243147]
W.-C. Hu, H.-T. Wu, H.-H. Cho, and F.-H. Tseng, "Optimal route planning system for logistics vehicles based on artificial intelligence", Journal of Internet Technology, Vol. 21, No. 3, pp. 757-764, May 2020. [https://doi.org/10.3966/160792642020052103013]
B. Mo, Q. Wang, X. Guo, M. Winkenbach, and J. Zhao, "Predicting drivers’ route trajectories in last-mile delivery using a pair-wise attention-based pointer neural network", Transportation Research Part E: Logistics and Transportation Review, Vol. 175, pp. 1-13, Jul. 2023. [https://doi.org/10.1016/j.tre.2023.103168]
T. N. Kipf and M. Welling, "Semi-supervised classification with graph convolutional networks", arXiv preprint arXiv:1609.02907, , pp. 1-14, Sep. 2016. [https://doi.org/10.48550/arXiv.1609.02907]
I. Sutskever, O. Vinyals, and Q. V. Le, "Sequence to sequence learning with neural networks", Advances in Neural Information Processing Systems, Vol. 27, pp. 3104-3112, Dec. 2014.
S. Lloyd, "Least squares quantization in PCM", IEEE Transactions on Information Theory, Vol. 28, No. 2, pp. 129-137, Mar. 1982. [https://doi.org/10.1109/TIT.1982.1056489]
P. J. Rousseeuw, "Silhouettes: A graphical aid to the interpretation and validation of cluster analysis", Journal of Computational and Applied Mathematics, Vol. 20, pp. 53-65, Nov. 1987. [https://doi.org/10.1016/0377-0427(87)90125-7]
D. L. Davies and D. W. Bouldin, "A cluster separation measure", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-1, No. 2, pp. 224-227, Apr. 1979. [https://doi.org/10.1109/TPAMI.1979.4766909]
T. Calinski and J. Harabasz, "A dendrite method for cluster analysis", Communications in Statistics, Vol. 3, No. 1, pp. 1-27, Jun. 1974. [https://doi.org/10.1080/03610927408827101]
C. Hennig, "Cluster-wise assessment of cluster stability", Computational Statistics & Data Analysis, Vol. 52, pp. 258-271, Dec. 2007. [https://doi.org/10.1016/j.csda.2006.11.025]

저자소개

서 한 빛 (Hanbit Seo)

2025년 8월 : 충북대학교 소프트웨어학과(공학사)

2025년 8월 ~ 현재 : 충북대학교 컴퓨터과학과 석사과정

관심분야 : 빅데이터 분석, 인공지능 응용

오 홍 석 (Hongseok Oh)

2022년 2월 : 충북대학교 소프트웨어학과(공학사)

2022년 3월 ~ 현재 : 충북대학교 컴퓨터과학과 석박사통합과정

관심분야 : IoT, 빅데이터 분석

서 영 덕 (Young-Duk Seo)

2012년 2월 : 고려대학교 컴퓨터전파 통신공학과(공학사)

2018년 2월 : 고려대학교 컴퓨터공학과(공학박사)

2020년 9월 ~ 현재 : 인하대학교 컴퓨터공학과 조교수

관심분야 : 추천 시스템, 사물인터넷, 텍스트 마이닝

한 병 엽 (ByungYup Han)

2010년 2월 : 충남대학교 컴퓨터공학과(공학석사수료)

2024년 2월 : 충북대학교 산업인공지능학과(공학석사)

2017년 12월 ~ 현재 : 디퓨전랩(주) 대표이사

관심분야 : AI, 데이터 분석, DX, AX

이 의 종 (Euijong Lee)

2012년 2월 : 고려대학교 컴퓨터정보학과(이학사)

2018년 8월 : 고려대학교 컴퓨터공학과(공학박사)

2020년 9월 ~ 현재 : 충북대학교 소프트웨어학부 부교수

관심분야 : 소프트웨어공학, 사물인터넷, 인공지능응용, 자가-적응소프트웨어

Author	Year	Model & Algorithm	Metrics	Result
Hu et al.[10]	2020	MLP-based traffic prediction + speed-based Dijkstra routing	Prediction accuracy	~95% traffic prediction accuracy ~88% overall system accuracy
Ochelska-Mierzejewska et al.[9]	2021	Genetic Algorithm(GA) with modified genetic operators	Distance gap to optimal solution (%)	~12–13% improvement over the optimal solution
Mo et al.[11]	2023	Pair-wise attention-based pointer neural network	Disparity score, prediction accuracy	Disparity score 0.0369, ~15% reduction in route deviation
Proposed	2026	GAT + Pointer network based decoder	Step-wise accuracy	Step-wise Top 3 accuracy : 0.97

Type	Feature		Description
Node	additional	Cluster	Localization of delivery points via clustering
	base	lat_norm	Normalized latitude values
		lon_norm	Normalized longitude values
		r	Distance from starting hub
		sinθ,cosθ	Angular orientation from the starting hub
		Hub	One-hot encoded node type (Delivery / Start_Hub / End_Hub)
edge	additional	P_a→b	Conditional transition probability
	base	dist_ij	Distance between node i and j
		sinΔ,cosΔ	Relative heading change to candidate delivery node
		$d i s t j e n d$	Distance from candidate node j to destination hub

Hyperparameter	Value
beam width	8
distance penalty(λ_dist)	0.25
end-hub distance penalty(λ_end)	0.60
cluster switch penalty(β_switch)	2.0
Maximum number of 2-opt iterations	80

Route generation	Travel time(mean)	SD(vs Label)
* F : Frequency, C : Clustering
Model(F)	137 minute	±13 minute
Model(F+C)	135 minute	±13 minute
Model(Proposed)	130 minute	±10 minute
Label	125 minute

K	Accuracy
1	0.851
2	0.948
3	0.970
4	0.984
5	0.993
6	0.995
7	0.996
8	0.997