Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 23, No. 12, pp.21-37
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Dec 2025
Received 20 Aug 2025 Revised 03 Nov 2025 Accepted 06 Nov 2025
DOI: https://doi.org/10.14801/jkiit.2025.23.12.21

머신러닝 기반 가중합산기법을 활용한 지역소멸 위기 대응 방안: 경남 지역 관광 역량 진단 및 축제 활성화 분석

이세연* ; 박지홍* ; 김주영* ; 김건우**
*경상국립대학교 컴퓨터공학부
**경상국립대학교 컴퓨터공학과 교수(교신저자)
A Machine Learning-based Weighted Aggregation Approach for Addressing Regional Depopulation: An Analysis of Tourism Capacity and Festival Revitalization in Gyeongsangnam-do
Se-Yeon Lee* ; Ji-Hong Park* ; Ju-Young Kim* ; Gun-Woo Kim**

Correspondence to: Gun-Woo Kim Dept. of ComputerScience and Engineering, College of IT Engineering, Gyeongsang National University, Jinju, Korea Tel.: +82-55-772-3323, Email: gunwoo.kim@gnu.ac.kr

초록

지역 축제는 지역 정체성을 알리고 지역 경제를 활성화하는 핵심 수단이다. 그러나 기존 연구는 주로 만족도 조사나 개별 사례 분석 등 정성적 접근에 머물러 지역 간 비교와 구조적 개선 방향 도출에 한계가 있었다. 이러한 한계를 극복하기 위해 본 연구는 지역 축제 성과를 정량적 지표로 체계화하고 비교·분석하는 데 목적을 두었다. 이를 위해 경상남도 18개 시·군을 대상으로 접근성·소비력·기반 시설·사회문화 4대 분야 정량 지표를 구축하고 머신러닝 기반 가중치 분석과 공간·군집 분석을 수행하였다. 이를 소멸위험지역과 비교해 관광 인프라 취약 지역의 한계를 진단하고, 맞춤형 축제 개선 및 관광 활성화 방안을 제시한다.

Abstract

Regional festivals serve as crucial means to promote local identity and stimulate regional economies. However, previous studies have mainly relied on satisfaction surveys or single case analyses, which limited cross-regional comparison and the identification of structural improvements. To address these gaps, this study systematizes regional festival performance into quantitative indicators and conducts comparative analysis across 18 cities and counties in Gyeongsangnam-do. Four key domains—accessibility, purchasing power, infrastructure, and sociocultural factors—were established, and machine learning–based weighting, spatial, and cluster analyses were applied. By comparing results with population-declining areas, the study diagnoses weaknesses in tourism infrastructure and proposes tailored strategies for festival enhancement and regional tourism revitalization.

Keywords:

machine learning, tourism revitalization, regional festivals, quantitative indicators

Ⅰ. 서 론

지역 축제는 단순한 문화행사를 넘어 지역 고유의 정체성을 대내외에 널리 알리고, 지역 주민들에게 공동체적 소속감을 제공하는 동시에 외부 관광객을 유입하여 지역 경제를 활성화하는 핵심 수단으로 기능하고 있다. 축제는 지역의 고유한 문화 자원을 가시화하고, 관광객에게 차별화된 경험을 제공함으로써 지역의 브랜드 가치를 제고한다. 동시에 외래 관광객의 소비 활동은 숙박, 교통, 음식, 상거래 등 다양한 분야로 확산되어 지역 경제 전반에 파급 효과를 미친다. 나아가 축제는 주민 참여를 기반으로 한 사회적 연대감을 강화하고, 세대 간·지역 간 교류를 촉진하여 사회문화적 자본을 축적하는 장으로서 역할을 수행한다. 이러한 이유로 지방자치단체들은 축제를 통해 도시 브랜드를 제고하고 관광 수요를 창출하기 위한 다양한 노력을 기울이고 있으며, 이는 지역 발전의 중요한 전략으로 확고히 자리 잡고 있다(관광진흥법 제48조의2(지역축제 등))[1].

본 연구의 분석 결과, 경상남도는 다양한 자연 및 문화 자원을 바탕으로 다채로운 지역 축제를 운영하고 있음에도 불구하고, 실제 성과 면에서는 지역 간 기획·운영 역량과 기반 인프라 수준에서 뚜렷한 격차가 나타났다. 이러한 사실은 지역 축제를 정량적이고 구조적인 지표로 진단할 필요성을 강하게 제기한다. 축제의 성과는 콘텐츠나 기획력만으로 결정되지 않으며, 접근성, 소비력, 기반시설, 사회·문화 자원 등 다양한 외부 요인이 복합적으로 작용하여 실질적인 효과를 좌우한다. 그럼에도 불구하고 지금까지의 연구는 주로 만족도 조사나 개별 사례 분석 등 정성적 접근에 집중되어왔으며, 이는 지역 간 비교나 구조적 개선 방향 도출에 한계를 드러낸다[2][3].

따라서 본 연구의 궁극적인 목적은 지역 축제의 성과에 영향을 미치는 다양한 관광 요소를 정량적으로 분석하고, 이를 바탕으로 각 지역의 여건과 특성에 부합하는 축제 활성화 전략을 제시함으로써, 지역 간 균형 발전과 지속 가능한 관광 기반에 기여하는 데 있다. 이에 따라 본 연구는 다음과 같은 네 가지 세부 목표를 설정하였다.

첫째, 접근성, 소비력, 기반시설, 사회·문화 자원 등 지역 축제에 영향을 미치는 주요 관광 요소를 체계화하고, 이를 바탕으로 가중치 기반의 평가 지표를 개발한다. 둘째, 정량 모델을 통해 산출된 지역별 관광 역량 점수를 QGIS를 활용해 시각화함으로써 공간적 격차를 진단한다. 셋째, 산출된 관광 점수와 축제 관련 지표 간의 통계적 상관관계를 분석하여 성과에 영향을 미치는 요인을 규명한다. 넷째, 관광 점수가 낮게 나타난 지역을 중심으로 부족한 요소를 보완하고 강점을 반영한 축제 개선 전략을 제시함으로써 정책적 실효성을 확보하고자 한다.


Ⅱ. 관련 연구

2.1 한국 지방소멸 요인과 극복 방안에 관한 연구: 머신러닝 방법을 통한 탐색

대한민국은 수도권 인구의 과밀화와 지방 인구의 지속적인 유출로 인해 이른바 ‘지방소멸’ 위기에 직면하고 있다. 유한별 외(2021)는 이러한 문제의식에 기반하여, 한국 시군구 단위 지방자치단체(이하 지자체)의 소멸위험 수준과 이에 영향을 미치는 지역 요인을 탐색적으로 분석하였다[2]. 이 연구는 기존의 ‘지방소멸위험지수’가 주로 출생률과 사망률 같은 자연적 인구 증감 요인에 집중되어 있어, 일자리, 교육 등 사회적 요인에 따른 인구 이동을 충분히 반영하지 못한다는 한계를 지적하였다. 이에 따라 연구진은 자연 증가뿐 아니라 전입·전출 인구 비율을 함께 고려한 개선된 소멸위험지수를 제안하였으며, 해당 지수는 식 (1)과 같이 정의된다.

IER=ER2+logPin Pout (1) 

여기서 IER(Improved Extinction Risk)은 개선된 소멸위험지수를 의미하며, 기존의 소멸위험지수인 ER(Extinction Risk)을 제곱한 값에 전입 인구와 전출 인구의 비율의 자연로그를 더한 형태로 구성된다. P_in과 P_out은 해당 지역에서 각각 전입, 전출한 인구수를 나타낸다. 해당 연구는 제안된 지수를 기반으로 Gradient Boosting Machine, Random Forest, XGBoost 등 총 7개의 머신러닝 분류 모델을 활용하여 지방소멸에 영향을 미치는 변수들을 학습하였으며, 그 결과 평균 연령, 광업 사업체 수, 유치원 수, 노인여가복지시설 수 등 총 14개의 변수가 주요 영향 요인으로 도출되었다. 다만, 변수 중요도 산출 과정에서 단일 모델의 가중치를 기준으로 해석하였기 때문에 결과가 특정 알고리즘에 편향되었을 가능성이 있으며, 제안된 지수의 이론적 타당성 또한 추가적인 실증적 검증이 필요하다. 또한 인접 지역 간 상호작용과 정책 개입 효과를 통계적으로 고려하지 못한 점 역시 한계로 지적될 수 있다.

2.2 2023 지역관광발전지수 동향 분석

문화체육관광부(2024)는 지역 관광의 활성화를 위한 정책 성과를 진단하고, 지방소멸 대응 및 지속 가능한 지역 관광 발전을 위해 객관적인 평가 체계를 구축하고자 ‘2023 지역관광발전지수 동향분석’ 연구를 수행하였다[3]. 이 연구에서는 정부 승인 통계, 지자체 조사자료, 국민 설문조사 등 다양한 출처의 데이터를 수집하였고, 지역 간 규모 차이를 고려하여 인구, 예산 등의 항목에 대해 정규화 및 표준화 과정을 거쳐 총 43개 지표를 선정하였다. 지표 간 단위 차이를 제거하고 동일 기준에서 비교하기 위해 각 변수에 대해 Z-점수를 산출하였으며, 이는 평균 0, 표준편차 1을 기준으로 원자료를 정규화한 차원 없는 값으로, 특정 지표가 전체 분포 내에서 어느 위치에 있는지를 나타낸다.

Z-점수의 해석력과 가독성을 높이기 위해 평균 100, 표준편차 20의 T-점수로 변환하고, 발전 수준을 강조하기 위해 T-점수를 기반으로 한 D-점수를 도출하였다. D-점수는 효과 크기 0.8(Z=0.8, T=116)을 기준으로 변환된 값으로, 관광 발전 수준의 상대적 위치를 판단하는 데 활용된다. 지표 가중치는 대분류(3개)–중분류(7개)–소분류(21개)로 구성된 계층 구조를 바탕으로 전문가 설문을 통해 추정하였으며, 최종 가중치는 각 단계 가중치의 곱으로 산출하였다. 산출된 D-점수와 최종 가중치를 곱하고, 모든 지표를 통합하여 지역관광발전지수를 계산하였다. 이를 기반으로 각 지자체는 관광수용력, 소비력, 정책역량 등의 세부 항목별 성과를 종합적으로 평가받았다. 다만, 본 논문에서 가중치 산정 과정은 전문가의 주관적 판단에 기반하므로 특정 집단의 성향에 따라 결과가 달라질 수 있고, 대분류를 3개로 한정함에 따라 세부 영역 구분이 다소 포괄적으로 이루어졌다. 특히 ‘사회·문화 자원’ 요소를 독립된 축으로 반영하지 않은 점은 관광 발전 수준을 보다 세밀하게 진단하는 데 한계로 작용할 수 있다.

2.3 기존 연구와의 차별성

본 연구는 기존 문헌과 다음 두 측면에서 차별성을 갖는다.

첫째, 경상남도 지방의 소도시를 중심으로, 기존 연구에서 상대적으로 간과되었던 관광 및 축제 관련 데이터를 통해 지역별 문제점을 실증적으로 분석하였다. 이는 수도권 과밀화 및 지방 인구 유출이라는 구조적 문제에 대응하기 위해 관광 및 축제를 외부 인구 유입의 전략적 수단으로 활용하고자 하는 실용적 접근이다. 관광 소비 매출, 방문자 수 등 관광 및 축제와 직접적 관련이 있는 지표들을 중심으로 데이터를 수집·정제하였으며, 이를 바탕으로 지역별 점수를 산출하고, 이를 통해 상대적으로 소극적인 지역을 도출한 후 그 원인을 분석하고자 하였다.

둘째, 기존 지역관광발전지수 연구는 전문가의 정성적 판단에 기반한 계층분석과정에 의존해 요인별 가중치를 산정하였으나, 본 연구는 동일한 계층 구조를 유지하면서도 머신러닝 학습 결과를 활용해 가중치를 산출하였다. 이를 통해 편향을 최소화하고, 정량적·재현 가능한 지표를 마련하여 정책 활용 가능성을 높이고자 하였다.


Ⅲ. 연구 방법

3.1 분석 대상 및 범위 설정

본 연구는 데이터 수집과 전처리, 지표 설정, 가중치 산정, 관광 점수 산출, 클러스터링 및 관계 분석까지 단계별 과정을 체계적으로 구성하였다. 그림 1에서 제시된 각 단계를 따라 본 장에서는 분석 대상과 범위(3.1), 가중치 산정 및 관광 점수 산출 방법(3.2), 자료 수집 및 정리(3.3)을 구체적으로 설명한다.

Fig. 1.

Analytical framework for evaluating local festival performance

본 연구에서는 일본 마스다 히로야(2014)의 ‘마스다 보고서’에서 제안된 소멸위험 개념을 적용하였으며, 해당 보고서는 2014년 발표 당시 현 추세가 지속될 경우 일본 지자체의 절반에 해당하는 896곳이 2040년까지 소멸 위험에 처할 것이라고 경고하였다[4]. 이를 바탕으로, 본 연구에서는 행정안전부(2023년 5월 기준)가 산출한 ‘지방소멸위험지수’를 활용하였다. 이는 한 지역 내 20~39세 여성 인구 수를 65세 이상 고령 인구 수로 나눈 값으로, 일반적으로 0.5 미만은 ‘소멸위험지역’, 1.0 미만은 ‘소멸주의지역’으로 분류되며, 지수가 낮을수록 장기적인 지역 유지 가능성이 낮음을 의미한다. 그림 2는 위에 따라 산출한 경남 지역의 인구소멸위험지수를 시각화한 것이다.

Fig. 2.

Population decline risk index

분석 대상은 경상남도 시·군의 2023년 1월부터 2025년 4월까지 개최된 축제를 분석하여 관광 활성화 요인을 도출하였다. 경상남도는 시·군별 인구 구조와 소멸위험 수준의 편차가 커 지역별 비교·분석에 적합한 사례지역이다. 이러한 특성은 축제와 관광 요인 간의 관계를 다각도로 살펴보고, 지역 특성에 따른 맞춤형 활성화 전략을 제시하는 데 유용하다. 축제 관련 자료는 해당 기간 동안의 개최 현황을 체계적으로 수집하였으며, 이에 대한 세부 내용은 표 1에 정리하였다.

Regional festival information

3.2 가중치 산정 및 관광 점수 산출 방법

본 연구에서는 각 지표의 가중치를 산정하기 위해 머신러닝 기반 특성 중요도(Feature importance) 분석을 활용하였으며, 트리 기반 앙상블 모델인 XGBoost, CatBoost, Gradient Boosting Machine, Random Forest를 사용하였다. XGBoost는 결측값 처리와 변수 중요도 도출에 강점을 지녀, 결측치와 이질적 변수가 존재하는 본 연구 데이터 특성에 적합하다. CatBoost는 범주형 변수 처리에 강점이 있어 지역별 지표 반영에 적합하다고 판단해 채택하였다. Gradient Boosting은 약한 학습기를 순차적으로 결합해 성능을 향상시키고 과적합을 방지하며, 표본 규모가 제한적인 본 연구 데이터셋에서 안정적인 성능 확보에 유리하다. Random Forest는 배깅 방식으로 다수의 트리를 학습하며, 변수별 영향력 해석이 용이해 관광 요소의 상대적 기여도를 직관적으로 파악할 수 있다. 네 가지 모델을 병행함으로써 알고리즘 편향과 데이터 한계를 최소화하고, 다양한 관점의 변수 중요도를 반영하여 가중치 산정의 객관성과 타당성을 높였다.

각 모델에서 산출된 feature importance 값을 기반으로 소분류 지표의 중요도를 도출하고, 이를 모델 간 평균하여 최종 가중치를 설정하였다. 이렇게 산정된 가중치는 중분류와 대분류로 단계적으로 통합되어, 계층별로 상대적 중요도를 반영하는 구조를 갖추었다. 이러한 절차는 특정 단일 모델에 의존하지 않고 다양한 알고리즘의 시각을 반영함으로써, 보다 객관적이고 신뢰성 있는 가중치 체계를 마련하는 데 기여한다. 최종적으로 산출된 가중치는 표 2에 제시하였다

Weights by hierarchical level

MCDM(Multi-Criteria Decision Making)은 여러 평가 기준을 동시에 고려하여 대상을 종합적으로 평가하는 방법론으로, 관광·지역 분석과 같이 다양한 요인이 복합적으로 작용하는 문제에 널리 활용된다. 대표적 기법으로는 AHP(Analytic Hierarchy Process)와 WSM(Weighted Sum Model)이 있으며, 각각 계층적 구조 반영과 가중합 계산을 통해 의사결정을 지원한다[5][6].

본 연구에서는 이러한 접근을 반영하여 최종 관광 점수를 산출하였다. 구체적으로 대분류(A), 중분류(B), 소분류(C)의 가중치를 단계적으로 곱한 뒤 각 지역의 표준화 점수를 반영하였으며(식 (2)), 이는 AHP의 계층적 가중합성과 WSM의 가중합 집계 원리를 동시에 적용함으로써 결과의 논리적 타당성을 확보하였다.

Score=A×B×C×Si(2) 

3.3 데이터 수집 및 정리

본 연구에서는 지역 축제의 활성화 수준을 다면적으로 평가하기 위해, 관광객 유입의 전제조건인 접근성, 현장 소비 잠재력을 나타내는 소비력, 체류와 이용을 지원하는 기반시설, 지역 고유의 매력과 수용 역량을 반영하는 사회·문화의 4대 분류에 따라 지표를 설정하였다. 기존 연구들은 주로 경제성이나 접근성 등 일부 영역에 편중되거나, 사회·문화적 요인을 독립적으로 다루지 않아 축제 성과에 영향을 미치는 다양한 요인을 균형 있게 반영하지 못한 한계가 있었다[7]. 이에 본 연구에서는 네 가지 범주로 구분함으로써 각 요소 간 중복을 최소화하고, 지역별 특성을 종합적으로 진단할 수 있도록 하였다.

각 분류별로 다수의 정량적 데이터를 수집하였으며, 경남 빅데이터 허브 플랫폼, 공공데이터포털, 시·군청 홈페이지 등 공신력 있는 공공 데이터 소스를 활용하였다. 세부 항목은 표 3에 제시하였다. 접근성 지표는 버스 정류장, 주차장, 렌터카 대여소, 소비력 지표는 체류일수, 숙박률, 관광객 지출액으로 구성하였다. 기반시설 지표에는 숙박시설, 음식점, 공중화장실, 관광안내소가, 사회·문화 지표에는 축제 건수, 관광 예산, 문화유산 및 생태 자원이 포함되었다.

Collected data of Gyeongsangnam-do for tourism score calculation and analy

수집된 지표들은 수치의 범위와 분포 특성이 서로 달라 직접적인 비교 및 해석이 어렵다. 본 연구에서는 이를 비교 가능하게 만들기 위해 표준화 점수 변환 방식을 적용하였다. 표준화 점수는 각 지표 값을 평균과 표준편차를 기준으로 환산해 서로 다른 단위를 동일한 척도로 변환하는 방식이다. [3]의 절차를 참고하여 평균 50, 표준편차 10을 기준으로 산출하였으며, 이는 지표 간 단위 차이를 제거하고 상대적 수준을 직관적으로 비교하기 위함이다. 해당 수식은 다음과 같다.

S=50+10×Xi-X-S(3) 

여기서 Xi는 특정 지역의 해당 지표 값, X-는 전체 평균, 𝑆는 표준편차를 의미한다. 이러한 표준화 과정을 통해 도출된 표준화 점수는 이후 관광 점수 산정 및 축제 활성화 수준 평가의 기초 지표로 활용된다.


Ⅳ. 실험 및 결과 분석

4.1 모델별 예측 성능 비교 결과

본 연구의 예측 목표(Y)는 두 가지로 설정하였다. 첫째, 경상남도 지역에서의 관광소비 지출 규모를 기반으로 한 관광소비지출 표준화 점수로, 이는 2023년 1월부터 2025년 4월까지의 월별 자료를 활용하였다. 둘째, 실제 관광객 수를 반영하여 산출한 표준화 점수로, 해당 데이터는 행정·통계적 집계 특성상 2023년 11월부터 2025년 4월까지의 기간을 대상으로 한다. 두 지표를 동시에 예측 대상으로 삼은 이유는 관광지 성과를 단일 지표로 평가하는 데 한계가 있으며, 소비와 수요를 함께 고려해야 지역 관광의 종합적인 특성을 설명할 수 있기 때문이다. 독립변수(X)는 접근성, 소비력, 인프라, 사회·문화적 요인의 네 가지 범주로 구분하였다.

본 연구에서는 모델의 예측 성능을 검증하기 위해 평가 지표로 MSE(Mean Squared Error), MAE (Mean Absolute Error), RMSE(Root Mean Squared Error)를 활용하였다. 추가적으로, 데이터는 train/validation/test로 분할하여 모델의 일반화 성능을 검증하였으며, 입력과 출력 모두에 StandardScaler를 적용하여 정규화하였다. 또한 모든 실험에서 랜덤 시드(random_state=42)를 고정하여 재현성을 확보하였다.

분석 결과, 관광소비지출을 종속변수로 한 경우 대분류 A에서는 RandomForest가 가장 낮은 오차(MSE=0.0099, MAE=0.0824, RMSE=0.0994)를 기록하여 가장 우수한 성능을 보였다. 분류 B와 C의 경우에는 각 세부 범주의 결과를 종합하여 평균값을 산출하였는데, 중분류 B에서는 GradientBoosting이 MSE(0.2539), MAE(0.3122), RMSE=0.5039로 최적 성능을 나타냈으며, 소분류 C에서는 RandomForest가 MSE(0.5028), MAE(0.4666), RMSE=0.7091을 기록하였다(표 4 참조).

Model performance in predicting standardized tourism expenditure (category A, category B, category C)

방문자 표준화 점수를 종속변수로 한 경우에도 유사한 경향이 확인되었다. 대분류 A에서는 RandomForest가 가장 낮은 오차를 보였고, 중분류 B와 소분류 C에서도 RandomForest가 안정적으로 가장 우수한 성능을 기록하였다(표 5 참조). 전체적으로 중분류 B와 소분류 C는 데이터가 세분화되면서 오차가 증가하였으나, RMSE가 전반적으로 1 미만의 범위에서 유지되었으며, MSE와 MAE 또한 안정적인 수준을 기록하였다. 따라서 본 연구에서 활용된 머신러닝 모델들은 전반적으로 양호한 예측 성능을 확보한 것으로 판단되며, 이는 최종 관광점수에 있어 논리적인 근거로 기능할 수 있다.

Model performance in predicting standardized visitor scores (category A, category B, category C)

대분류 A, 중분류 B, 소분류 C 단위별 학습 결과를 통합적으로 제시하기 위해, Iteration별 RMSE 값에 표준편차(±std)를 반영하여 범주 간 변동성을 고려한 종합 RMSE 곡선을 그림 3에 제시하였다. 이를 통해 단일 범주 결과만으로는 파악하기 어려운 전반적 경향성을 확인할 수 있으며, 학습 과정의 안정성을 평가하는 데 중요한 근거를 제공한다.

Fig. 3.

Comparison of train–validation RMSE across iterations (± standard deviation)

분석 결과, 학습 데이터와 검증 데이터 간 RMSE 곡선의 격차가 크지 않아 과적합 현상은 뚜렷하게 나타나지 않았다. 이는 앞서 제시한 성능 지표 결과와도 일관된 양상을 보인다. 한편, Random Forest는 개별 트리를 병렬적으로 학습하기 때문에 명확한 iteration 기반 RMSE 곡선을 도출하기 어렵다. 따라서 본 연구에서는 해당 모델의 경우 성능 지표를 중심으로 결과를 보고하였다.

또한, 본 연구에서는 데이터의 편향 가능성을 최소화하기 위해 5-fold 교차검증을 실시하였다. 그 결과, 표 6에 제시된 바와 같이 RandomForest, XGBoost, GradientBoosting, CatBoost의 예측 성능 지표가 fold 간 비교적 안정적으로 유지되는 것을 확인할 수 있었다. 특히 모든 모델에서 평균과 표준편차가 안정적으로 나타났으며, 이는 경상남도 지역 데이터가 특정 시·군이나 개별 특성치에 편중되지 않고 비교적 균형적으로 분포하고 있음을 의미한다. 따라서 본 연구에서 활용한 데이터셋은 5-fold 검증 결과, 분할 방식에 상관없이 성능이 안정적으로 유지되어 특정 집단이나 변수에 치우친 편향이 크지 않은 것으로 판단된다.

Comparison of model performance stability based on 5-fold cross-validation (Mean ± standard deviation)

4.2 계층별 요인 가중치 및 관광 점수 분석

산출된 가중치를 계층별로 분석한 결과, 대분류에서는 접근성, 기반시설, 소비력, 사회문화의 순으로 중요도가 높게 나타났다. 이를 통해 관광 점수에 가장 큰 영향을 미치는 요소는 접근성임을 확인할 수 있었다. 이러한 결과는 다른 연구에서도 유사한 경향이 보고된 바 있다[8][9].

접근성 분류 내에서는 대중교통 인프라, 개인 교통 인프라, 광역 교통 인프라의 순으로 중요도가 도출되었으며, 대중교통 인프라(0.5038)는 개인 교통 인프라(0.4417)보다 약 14.06%(0.0621) 더 높은 가중치를 보였다. 또한 대중교통 인프라는 광역 교통 인프라 대비 약 90.02%(0.4535) 더 중요하게 나타났으나, 광역 교통은 공항과 철도역 등 일정 지역에 집중된 인프라를 기준으로 산정되었기 때문에 편차가 크게 발생할 수 있어 해석 시 주의가 요구된다.

이러한 분석 결과는 교통 접근성 향상이 실제 관광 활성화와 지역경제 성과로 이어질 수 있음을 시사한다. 예를 들어, 강릉시를 대상으로 한 연구에서는 KTX 강릉선 개통 이후 대중교통 이용행태 변화와 함께 일반음식점·휴게음식점·숙박업소가 강릉역 인근을 중심으로 증가한 것으로 나타났으며, 이는 교통 인프라 개선이 관광객 유입과 상권 활성화를 촉진한 대표적인 사례로 평가된다[10]. 따라서 지방 소도시의 경우에도 단순한 교통 인프라 확충을 넘어, 노선 최적화와 운행 간격 개선 등 실질적인 접근성 향상 전략이 필요하다.

기반시설 분류에서는 관광 수용 기반(0.5592)의 중요도가 관광 편의 서비스(0.1878)보다 약 197.76%(0.3714) 높게 나타났다. 이는 숙박시설과 휴게음식점과 같은 상업 시설이 관광객 소비와 직접적으로 연결되는 요소라는 점에서 비교적 예측 가능한 결과이다. 특히 소분류에서 휴게음식점(0.5994)의 가중치는 숙박시설(0.4006)보다 약 49.63% 높아, 관광 성과에 더 큰 영향을 미치는 것으로 분석되었다.

한편, 본 연구에서는 사회문화 요인이 가장 높은 중요도를 가질 것으로 예상하였으나, 실제 분석에서는 대분류 중 가장 낮은 가중치로 도출되었다. 이는 경남 지역 내 관광지와 축제가 양적으로 충분하더라도 실질적인 관광객 유입이나 축제 성공으로 이어지지 못하고 있음을 시사한다. 선행연구에서도 지역축제의 사회적·문화적 효과가 지역주민의 애착도와 협력 의사에는 기여하였으나, 이러한 효과가 관광 성과 증대로 직결되지는 않는다는 점이 보고된 바 있다[11]. 더불어, 전통문화 축제를 대상으로 한 연구에서는 유희성과 환대가 재방문의도와 추천의도에 가장 큰 영향을 미치는 요인으로 확인되어[12], 사회문화 인프라의 양적 확충보다 방문객 체험과 정서적 교감을 강화할 수 있는 프로그램·콘텐츠 개발이 필요함을 시사한다.

시·군별 최종 관광 점수 결과를 담은 표 7에 따르면 최상위 3개 지역은 창원시(76.59점), 김해시(57.96점), 진주시(55.23점) 순으로 나타났으며, 하위 3개 지역은 산청군(40.23점), 고성군(44.00점), 함양군(44.11점)으로 나타났다. 전체 지역의 관광 점수 평균은 약 48.94점, 표준편차는 8.05점으로, 지역 간 관광 인프라와 축제 활성화 수준에서 뚜렷한 격차가 확인되었다. 이는 접근성, 기반 시설, 소비력, 사회문화 자원 등 관광 요소의 복합 작용에 따라 성과가 크게 달라질 수 있음을 보여준다. 특히 상위권에 속한 지역들은 대중교통망과 상업 인프라가 잘 구축되어 있어 외부 관광객의 접근성이 높고, 이에 따른 방문객 유입과 관광 성과가 상대적으로 우수하게 나타났다.

Final tourism scores by city and county

4.3 관광 점수 기반 지역 클러스터 분석

본 연구에서는 지역별 관광 점수를 군집화하기 위해 다양한 군집화 기법 가운데 K-Means를 선택하였다. K-Means는 각 데이터와 군집 중심 간의 유클리드 거리를 기반으로 군집 내 분산을 최소화하는 방식으로, 계산 과정이 단순하고 결과 해석이 직관적이라는 장점을 가진다. 본 연구의 데이터는 연속형 변수로 구성되어 있어 거리 계산과 중심 산출이 용이하므로 K-Means 적용에 적합하다고 판단하였다. 아울러 관광 및 지역 분석 분야에서 K-Means가 널리 활용되고 있어, 본 연구 결과의 비교 가능성 또한 확보할 수 있다[13][14]. 클러스터 개수는 2에서 10까지 변화시키며 실험을 진행하였고, 최적의 군집 수를 설정하기 위해 엘보우 방법과 실루엣 점수를 활용하였다. 그림 4는 클러스터 수에 따른 엘보우 곡선과 실루엣 점수를 제시한다. 이를 종합적으로 검토한 결과, 최적의 군집 개수는 3으로 결정하였다.

Fig. 4.

(Left) Elbow method, (Right) Silhouette score analysis

표 8표 7의 최종 관광 점수를 기반으로 K-Means 클러스터링을 수행한 결과이며, 총 세 개의 군집(k=3)으로 분류되었다. High 그룹에는 창원시가 포함되었는데, 관광 점수(76.59점)가 전체 평균(48.94점)을 크게 상회하고 주요 인프라 규모가 도내에서 가장 높아 광역 중심지로 기능하고 있음을 보여준다. Middle 그룹은 김해·진주·거제·양산으로, 관광 점수는 50~58점 수준으로 평균보다 높으나, 주요 인프라 규모 규모는 창원에 비해 적은 것으로 나타났다. 반면 Low 그룹에는 통영, 밀양, 사천을 비롯한 다수 지역이 포함되었으며, 관광 점수가 40점대에 머물고 주요 인프라가 상대적으로 취약하여 전반적 관광 경쟁력이 낮은 것으로 분석되었다.

Cluster analysis results of tourism scores by city and county

Low 그룹의 하위 세 지역인 산청군, 고성군, 함양군은 그림 2의 인구소멸위험지수와 비교한 결과, 모두 소멸 고위험 지역으로 분류되었으며, 이는 지방소멸이 심각하게 진행되고 있는 지역임을 시사한다. 따라서 외부 인구의 유입을 촉진하기 위한 전략적 대응이 필요한 지역으로, 지역 축제 및 관광 자원의 활성화가 실질적인 해결 방안이 될 수 있을 것으로 판단된다. 이에 대한 구체적인 지역소멸 위기 대응 방안은 4.4절에서 제시하였으며, 이는 지방소멸 완화 및 지역 균형 발전을 위한 정책의 방향성을 제시한다.

4.4 관광 점수 기반 소멸위기지역 비교 분석

본 절에서는 산정된 관광 점수를 바탕으로 경상남도 내 18개 시·군을 비교하고, 특히 소멸위험지역을 중심으로 관광 경쟁력 및 기반 요소를 다각도로 분석하였다.

그림 5에 따르면 접근성에서 산청군, 고성군, 함양군은 버스정류장, 시티투어버스, 렌터카 등 교통 인프라가 전반적으로 취약하였다. 렌터카 업체 수는 산청군 0개, 고성군 8개, 함양군 5개로, 창원시(90개), 김해시(55개), 진주시(50개)에 비해 현저히 부족했다. 이는 외부 관광객의 자율 이동성을 저해한다. 반면 산청군은 공영주차장이 199개로 창원시에 이어 2위였는데, 이는 자차 이용 관광객의 편의성을 높일 수 있는 강점으로 평가된다.

Fig. 5.

Accessibility indicators in Gyeongsangnam-do: bus stop, city tour bus, rental car, parking lot, airport, train station

그림 6에 따르면 관광 기반시설에서 산청군, 고성군, 함양군은 김해시·진주시(약 47개)와 유사한 숙박 시설 수를 보였으나, 창원시(228개)와는 큰 격차가 있었다. 숙박 비율 표준화 점수도 창원시가 78.39로 가장 높고 산청군은 50.16에 그쳤다. 김흥식·박상우(2010)는 숙박 공급이 체류 기간과 1인당 소비액을 결정하는 핵심 인프라라고 지적한 바 있으며[15], 이러한 관점에서 볼 때 세 지역은 장기 체류 관광을 유도하기 위한 숙박 인프라가 부족한 실정이다. 숙박 인프라가 취약한 지역은 관광객이 당일 방문에 그칠 가능성이 높아, 체류형 관광 활성화를 위한 전략적 개선이 요구된다.

Fig. 6.

Infrastructure indicators in Gyeongsangnam-do: accommodation, restaurants & cafés, public restroom, tourist center, crime safety index, health services

그림 9에 따르면 소비력에서 내국인 관광소비 지출 누적액은 창원시가 1,328,452백만 원으로 가장 높았고, 산청군(33,205백만 원), 고성군(57,843백만 원), 함양군(26,572백만 원)은 현저히 낮음을 보였다. 권미영 외(2017)는 음식관광 활동이 관광객의 전체 만족도와 행동 의도에 유의한 영향을 미치며, 특히 음식 관련 다양한 경험이 관광지 체류 연장과 재방문 의향을 높이는 핵심 요인이라고 보고하였다[16]. 그러나 휴게음식점 수를 보면 창원시(4,540개)에 비해 산청군(138개), 고성군(209개), 함양군(134개)이 크게 부족해, 관광객이 체류 중 다양한 음식 경험을 하기 어려운 여건임을 알 수 있다.

그림 6에 따르면 기타 관광 인프라 측면에서 산청군은 공중화장실 112개로 양호했으나, 관광안내소는 고성군 2개, 함양군 3개에 불과해 전반적인 정보 접근성과 관광 편의성이 상대적으로 떨어졌다. 범죄 안전 지수는 진주시, 김해시가 ‘5’로 위험도가 높았던 반면, 의령군은 ‘1’로 낮아, 이러한 안전 인식이 지역 선택과 관광활동 전반에 영향을 미칠 수 있음을 시사한다. 실제로 G. Giusti and J.-M. Raya[17]는 범죄에 대한 부정적 인식이 관광객의 방문 의향을 감소시킨다고 보고하였다. 의료시설은 창원시가 816개, 고성군은 41개로 의료 인프라 규모가 상대적으로 작아 전반적인 의료 서비스 접근성에서 불리할 수 있다.

자연 생태자원(그림 7 참고) 측면에서 산청군은 38개를 보유해 상위권에 속하며, 이는 생태·경관 자원을 활용한 관광 개발 잠재력이 크다는 것을 의미한다. 반면 역사문화자원은 32개로 양산시(68개)에 비해 부족해, 문화·역사 콘텐츠 발굴과 상품화가 필요한 것으로 보인다.

Fig. 7.

Socio-cultural indicators in Gyeongsangnam-do: natural resources, historical heritage, tourist facilities, trending keywords, social media search, and tourist complexes.

축제 관련 (그림 8 참고) 부문에서 창원시는 예산 105,856백만 원으로 가장 높았고, 산청군은 9,178백만 원으로 재정 투입이 제한적이었다. 축제 수 역시 고성군이 32개, 산청군은 9개에 그쳐 프로그램 다양성과 흡인력이 낮았다. 이러한 상황은 산청군이 축제를 통한 관광객 유치와 지역경제 활성화에서 경쟁력이 낮음을 보여준다. 특히 지역 문화축제는 관광 수요 창출과 지역사회 유대 강화에 중요한 역할을 하므로, 기획력과 운영 역량 강화를 통해 지속 가능한 관광 자원으로 발전시킬 필요가 있다.

Fig. 8.

Socio-cultural indicators in Gyeongsangnam-do: tourism festival, local specialty festival, symbol festival, tourism budget, festival budgetcial media search, tourist complex

Fig. 9.

Spending power indicators in Gyeongsangnam-do: tourism consumption grade (Men), tourism consumption grade (Women), overnight stays, occupancy rate

4.5 지역 소멸 위기 대응 방안

군집 분석을 통해 다수의 지역이 Low 그룹으로 분류되었다. 그러나 본 연구에서는 사례 분석의 심층성을 확보하고 지역 유형별 대표성을 반영하기 위해 산청군, 고성군, 함양군을 중심으로 논의를 전개하였다. 이들 지역은 관광자원은 풍부하나 성과 지표가 낮고 동시에 인구소멸위험지수에서 고위험 지역으로 분류되어, 지방소멸 대응 전략을 논의하기 위한 적절한 사례로 판단된다.

산청군은 치유와 생태 중심의 자원이 풍부함에도 불구하고 소비와 체류 기반이 미약하고 접근성 또한 낮다. 관광객 대부분이 당일 방문에 그치고 있어 숙박 수요가 창출되지 못하고 있으며, 이는 지역 경제 파급효과를 제약하는 요인으로 작용한다. 이에 따라 자가용 중심의 드라이브 코스 개발, 렌터카 확충, 버스 노선 개선과 같은 교통 인프라 보강이 필요하다. 교통 접근성은 관광객의 체류 기간과 소비 패턴에 직접적인 영향을 미치는 핵심 요소로[15], 산청군의 교통 인프라 개선 전략은 장기 체류형 관광 활성화와 지역 경제 확산 효과를 높이는 기반이 될 수 있다. 나아가 지역 간 접근성 격차를 완화하고 외부 인구 유입을 촉진하는 정책적 수단으로 작용함으로써 지방소멸 대응 전략과도 연결된다.

고성군은 도내에서 가장 많은 축제를 개최하고 있으나, 프로그램의 분산적 운영으로 인해 개별 축제의 파급력이 약화되고 있다. 이러한 한계를 극복하기 위해서는 고성의 핵심 콘텐츠인 공룡 테마를 중심으로 주요 축제를 통합하여 축제의 지역 브랜드 이미지를 강화할 필요가 있다. 이는 축제 간 연계성을 강화하여 관광객의 재방문율을 높이는 기반이 될 것이다. 지역 브랜드 이미지는 소비자 행동을 유도할 수 있기 때문에[18] 고성군의 공룡 테마 통합 전략은 지역 브랜드 정체성을 확립하고 관광 수요를 증대시키는 전략적 수단으로 작용할 수 있다. 즉, 공룡 테마 통합은 단일 행사의 개선책이 아니라, 고성군을 대표하는 관광 브랜드를 육성하여 장기적으로 지역경제와 인구 유지에 기여하는 정책적 전략이라 할 수 있다.

함양군은 유교문화와 선비문화라는 강점을 보유하고 있으나, 이를 현대 관광 트렌드에 맞게 재해석하고 상품화하는 노력이 부족하다. 전통문화 자원을 경쟁력 있는 관광 브랜드로 발전시키기 위해서는 단순 보존을 넘어 체험·참여형 콘텐츠 확대, 지역사회 협력, 장기 체류형 전략이 필요하다. 이와 관련하여, 전통문화 기반 도시는 전통과 현대를 결합한 혼합콘텐츠 전략을 통해 부가가치를 창출하고 지역경제와 연계된 관광 상품화를 추진해야 한다는 연구 결과도 제시된 바 있다[19]. 이러한 전략은 전통문화의 보존과 현대적 활용을 조화시켜 문화유산의 가치를 높이는 동시에 지역경제 활성화로 이어질 수 있다. 더불어 교육·체험형 관광 확대는 인구 유입과 정주 여건 개선을 유도하여 지방소멸 대응 정책과도 직접적으로 연결된다.

따라서 산청군, 고성군, 함양군은 각각의 특성과 취약 요인에 대응하는 맞춤형 전략을 통해 지역 소멸 위기를 완화할 수 있으며, 이러한 대응 방안의 핵심 내용은 표 9에 요약하여 제시하였다.

Summary of regional strategies for coping with population decline


Ⅴ. 결론 및 향후 연구 방향

본 연구는 경상남도 내 지방 소멸 위험에 대응하기 위해 지역 관광 및 축제를 진단하고 개선 방향을 제시하였다. 접근성·소비력·기반 시설·사회문화의 4대 분야로 구성된 다층 지표 체계를 구축하고, 공공 데이터 기반의 정량 분석과 머신러닝 Feature Importance를 통해 지표 가중치를 산정하였다. 이를 토대로 관광 점수를 산출하고 K-Means 클러스터링으로 지역 간 관광 역량을 유형화한 결과, 창원·김해·진주에 비해 산청·고성·함양은 관광 점수와 소멸위험지수 모두 열위로 나타났다. 이는 해당 지역의 관광 활성화가 지방 소멸 대응의 핵심 전략이 될 수 있음을 시사한다.

다만, 본 연구는 분석 지표를 제한된 공공 데이터에 기반하여 구성하였으며, 계절·이벤트 등 단기 변동 요인과 주민·관광객의 정성적 평가를 충분히 반영하지 못했다는 한계가 있다. 향후 연구에서는 분석 지표를 다양화하고 현장 조사를 병행하여 지역 특성을 정밀하게 반영할 계획이다. 또한 본 연구의 분석 프레임을 타 광역·기초지자체에도 적용하여 지역 관광 역량 진단과 정책 수립에 활용할 수 있는 실용적 모델로 확장하고자 한다.

Acknowledgments

본 논문은 교육부와 경상남도의 재원으로 지원을 받아 수행된 경상남도 지역혁신중심 대학지원체계(RISE) 연구결과 및 2025년도 산업통상자원부 및 한국산업기술기획평가원(KEIT)의 연구비 지원(RS-2025-02633048)에 의한 연구결과임

References

  • Republic of Korea, Tourism Promotion Act, Article 48-2 (Local Festivals, etc.), National Law Information Center, Dec. 18, 2018.
  • H. B. Yoo, K. J. Tak, and J. S. Moon, "A Study on the Factors and Solutions for Local Extinction in Korea", The Korean Journal of Local Government Studies, Vol. 24, No. 4, pp. 443-476, Feb. 2021. [https://doi.org/10.18398/kjlg.2021.24.4.443]
  • Ministry of Culture, Sports and Tourism, "2023 Regional Tourism Development Index Trend Analysis", Ministry of Culture, Sports and Tourism, Sejong, Korea, Apr. 2025.
  • H. Masuda, "Regional Cities Will Disappear by 2040: A Polarized Society Will Emerge", Japan Policy Council Subcommittee Report, May 2014.
  • L. C. Ho, "Combining AHP and TOPSIS for sustainable tourism development: A case study", Journal of Environmental Management, Vol. 295, 2021. [https://doi.org/10.1016/j.jenvman.2021.113138]
  • L. C. Ho, "Combining AHP and TOPSIS for sustainable tourism development: A case study", Journal of Environmental Management, Vol. 295, 2021. [https://doi.org/10.1016/j.jenvman.2021.113138]
  • A. L. Negruşa, A. Toader, A. Sofică, A. Tutunea, and C. Rus, "Study of Perceptions on Cultural Events’ Sustainability: Case Study of Transilvania International Film Festival (TIFF)", Sustainability, Vol. 8, No. 12, pp. 1269, Dec. 2016. [https://doi.org/10.3390/su8121269]
  • J.-S. Kim and J.-H. Jee, "A Study on Factors Affecting the Choice of Tourist Destinations", Korean Journal of Foodservice Management, Vol. 16, No. 4, pp. 123-133, Dec. 2020. [https://doi.org/10.22509/kfsa.2020.16.4.011]
  • S.-H. Kang and K.-M. Lee, "The Roles of Festival Quality Affecting Relation Quality and Visitors’ Behavioral Intention", Korean Journal of Local Government & Administration Studies, Vol. 24, No. 2, pp. 281-300, 2010. [https://doi.org/10.18398/kjlgas.2010.24.2.281]
  • I.-G. Lee, S.-M. Yoo, J. Lee, and D.-I. Kim, "Analysis of the Effect of Improving Metropolitan Public Transportation Accessibility on Tourism and Regional Economic Activation: Focusing on Changes in Self-Employed Businesses after the Opening of the KTX Gangneung Line", Smart Media Journal, Vol. 12, No. 8, pp. 26-36, Sep. 2023. [https://doi.org/10.30693/SMJ.2023.12.8.26]
  • H.-S. Ko, "The Effects of Perceived Benefits of Local Festivals on Community Attachment and Willingness to Collaborate", Journal of Regional Industries, Vol. 35, No. 2, pp. 265-284, Jun. 2013.
  • K.-S. Kim and G.-W. Seo, "A Comparison of the Influences of Festival Success Factors According to the Types of Community-based Festivals", Journal of Korea Design Trend Society, No. 29, pp. 147-158, Jan. 2010. [https://doi.org/10.21326/ksdt.2010..29.013]
  • C. Agiropoulos, J. M. Chen, G. Galanos, and T. Poufinas, "Exploring Regional Determinants of Tourism Success in the Eurozone: An Unsupervised Machine Learning Approach", Proc. of the 10th International Conference on Time Series and Forecasting, Gran Canaria, Spain, Vol. 68, No. 1, pp. 53, Jul. 2024. [https://doi.org/10.3390/proceedings2024068053]
  • A. S. I. Crisostomo and B. A. Dhuhli, "Investigation on Tourism Trends Using K-means Clustering and Regression Analysis", Sustainable Development Research, Vol. 7, No. 2, pp. 35, May 2025. [https://doi.org/10.30560/sdr.v7n2p35]
  • H.-S. Kim and S.-W. Park, "Gyeonggi-do Tourism Accommodation Expansion Measures", Gyeonggi Research Institute, Policy Brief No. 34, 2010.
  • K.-M. Kwon, et al., "The Effects of Food Tourism Activities on Tourist Satisfaction and Behavioral Intentions", Regional Industry Review, Vol. 36, No. 1, pp. 143-161, May 2017.
  • G. Giusti and J.-M. Raya, "The effect of crime perception and information format on tourists’ willingness/intention to travel", Journal of Destination Marketing & Management, Vol. 11, No. 3, pp. 101-107, Mar. 2019. [https://doi.org/10.1016/j.jdmm.2018.10.003]
  • K.-J. Kwon and W.-S. Choe, "Empirical Study on Effective Factors of City Brand Identity Formation by City Image Type", Brand Design Studies, Vol. 10, No. 4, pp. 15-26, Dec. 2012. [https://doi.org/10.18852/bdak.2012.10.4.15]
  • X. Zhao, J. Wei, and J. Chen, "Research on brand operation strategy of integrating traditional culture into the modern tourism industry based on big data analysis", Applied Mathematics and Nonlinear Sciences, Vol. 9, No. 1, pp. 214, Aug. 2023. [https://doi.org/10.2478/amns.2023.2.00214]
저자소개
이 세 연 (Se-Yeon Lee)

2023년 3월 ~ 현재 : 경상국립대학교 컴퓨터공학과 학사과정

관심분야 : 인공지능, 컴퓨터비전, 이미지 생성, 대규모 언어모델

박 지 홍 (Ji-Hong Park)

2025년 2월 : 경상국립대학교 컴퓨터공학부(공학사), 융합전공(USG융합학사)

2025년 3월 ~ 현재 : 경상국립대학교 컴퓨터공학과 석사과정

관심분야 : 인공지능, 데이터분석, 컴퓨터 비전, 자연어 처리

김 주 영 (Ju-Young Kim)

2025년 2월 : 경상국립대학교 컴퓨터공학부(공학사), 융합전공(USG융합학사)

2025년 3월 ~ 현재 : 경상국립대학교 컴퓨터공학과 석사과정

관심분야 : 인공지능, 컴퓨터 비전, 이미지 생성, 온디바이스 AI

김 건 우 (Gun-Woo Kim)

2006년 12월 : 호주뉴캐슬대학교 컴퓨터공학과(공학사)

2007년 9월 : 호주뉴캐슬대학교 정보공학과(공학석사)

2017년 8월 : 한양대학교 컴퓨터공학과(공학박사)

2021년 9월 ~ 현재 : 경상국립대학교 컴퓨터공학과 부교수

관심분야 : 인공지능, 시멘틱 헬스케어, 데이터마이닝

Fig. 1.

Fig. 1.
Analytical framework for evaluating local festival performance

Fig. 2.

Fig. 2.
Population decline risk index

Fig. 3.

Fig. 3.
Comparison of train–validation RMSE across iterations (± standard deviation)

Fig. 4.

Fig. 4.
(Left) Elbow method, (Right) Silhouette score analysis

Fig. 5.

Fig. 5.
Accessibility indicators in Gyeongsangnam-do: bus stop, city tour bus, rental car, parking lot, airport, train station

Fig. 6.

Fig. 6.
Infrastructure indicators in Gyeongsangnam-do: accommodation, restaurants & cafés, public restroom, tourist center, crime safety index, health services

Fig. 7.

Fig. 7.
Socio-cultural indicators in Gyeongsangnam-do: natural resources, historical heritage, tourist facilities, trending keywords, social media search, and tourist complexes.

Fig. 8.

Fig. 8.
Socio-cultural indicators in Gyeongsangnam-do: tourism festival, local specialty festival, symbol festival, tourism budget, festival budgetcial media search, tourist complex

Fig. 9.

Fig. 9.
Spending power indicators in Gyeongsangnam-do: tourism consumption grade (Men), tourism consumption grade (Women), overnight stays, occupancy rate

Table 1.

Regional festival information

Region Festivals Total
Changwon Export Festa, etc. 26
Jinju Nongae Festival, etc. 18
Gimhae Yulha Festival, etc. 19
Yangshan Chrysanthemum Festival, etc. 19
Geoje Okpo Battle Festival, etc. 17
Tongyeong Hansan Battle Festival, etc. 17
Sacheon Waryong Cultural Festival, etc. 19
Milyang Arirang Festival, etc. 26
Uiryeong Watermelon Festival, etc. 15
Haman Ara Gaya Cultural, etc. 20
Changning Rape Festival, etc. 12
Goseong Dinosaur World Expo, etc. 32
Namhae Garlic Hanwoo Festival, etc. 11
Hadong Hwagae Market Festival, etc. 13
Sancheong Dried Persimmon Festival, etc. 9
Hamyang Omija Festival, etc. 17
Geochang Spring Festival, etc. 16
Hapcheon Azalea Festival, etc 13

Table 2.

Weights by hierarchical level

Major weight (A) Middle weight (B) Subcategory weight (C) Final weight (A×B×C)
Accessibility 0.4753 Public transport 0.5038 Bus stop 0.8744 0.2093
City tour bus 0.1256 0.0300
Private transport 0.4417 Rental car 0.6010 0.1261
Parking lot 0.3990 0.0837
Regional transport 0.0503 Airport 0.0093 0.0002
Train station 0.9907 0.0236
Spending power 0.1650 Tourist stay 0.5683 Stay duration 0.5839 0.0547
Lodging rate 0.4161 0.0390
Tourist spending 0.4317 Tourist spending
(Young male)
0.3058 0.0217
Tourist spending
(Young female)
0.3554 0.0253
Tourist spending
(Middle male)
0.0867 0.0061
Tourist spending
(Middle female)
0.1341 0.0095
Tourist spending
(Senior male)
0.0766 0.0054
Tourist spending
(Senior female)
0.0414 0.0029
Infrastructure 0.2324 tourism acceptance 0.5592 Accommodation 0.4006 0.0520
Restaurants 0.5994 0.0778
Tourist convenience 0.1878 Public restroom 0.9037 0.0394
Tourist information center 0.0963 0.0042
Safety & health infrastructure 0.2530 Public safety 0.0489 0.0021
Health services 0.9511 0.0559
Socio-Cultural factors 0.1264 Tourism resources 0.0802 Natural resources 0.6177 0.0062
Cultural heritage 0.3823 0.0038
Destination popularity 0.0737 Trend mentions 0.2456 0.0022
SNS search volume 0.7544 0.0070
Tourism infrastructure 0.1788 Tourism facilities 0.9199 0.0207
Tourism complex 0.0801 0.0018
Tourism budget & support 0.5950 Tourism budget 0.0916 0.0068
Festival budget 0.9084 0.0683
Festival management 0.0723 Number of tourism festivals 0.4131 0.0037
Local product-based festival 0.2688 0.0024
Symbol-themed festival 0.3181 0.0002

Table 3.

Collected data of Gyeongsangnam-do for tourism score calculation and analy

Category Data name Description Source
Accessibility Tour buses Number of city tour buses Gyeongnam big data hub platform
Bus stops Bus stop locations by area Public data portal
Airports Airport locations Kakao API
Stations Train station locations Public data portal
Parking lots Parking lot locations Kakao API, Municipal government website
Car rentals Rental car locations Gyeongnam big data hub platform. kakao API
Spending power Tourism stats Visitor stats & stay duration Korea tourism data lab
Tourist numbers Annual tourist numbers Public data portal
Infrastructure Rest restaurants Restaurant & store locations Public data portal
Lodging Accommodation locations Public data portal, kakao API
Crime zones Crime safety index Ministry of the interior and safety
Medical facilities Medical facility locations Public data portal, kakao API
Public toilets Public restroom locations Municipal government website, kakao API
Info centers Tourist info center locations Public data portal, kakao API
Socio-cultural factors Tourism info Natural & cultural resources Gyeongnam big data hub platform
Attractions Tourism facilities & zones Ministry of culture, sports and tourism
Tourism & festival budget Tourism & festival budget Local finance 365
Festivals Festival overview Gyeongnam festival damoa

Table 4.

Model performance in predicting standardized tourism expenditure (category A, category B, category C)

XGBoost CatBoost Gradient boosting Random forest
A_MAE 0.0809 0.1633 0.1639 0.0824
A_MSE 0.0714 0.0349 0.0318 0.0098
A_RMSE 0.2673 0.1870 0.1783 0.0994
B_MAE 0.4982 0.3887 0.3122 0.3433
B_MSE 0.5092 0.3434 0.2539 0.2655
B_RMSE 0.7136 0.5860 0.5039 0.5153
C_MAE 0.5123 0.4262 0.4479 0.4206
C_MSE 0.5041 0.4351 0.4609 0.4121
C_RMSE 0.7100 0.6597 0.6791 0.6420

Table 5.

Model performance in predicting standardized visitor scores (category A, category B, category C)

XGBoost CatBoost Gradient boosting Random forest
A_MAE 0.0809 0.1633 0.1639 0.0824
A_MSE 0.0715 0.0350 0.0318 0.0099
A_RMSE 0.2673 0.1870 0.1784 0.0994
B_MAE 0.5123 0.4262 0.4479 0.4206
B_MSE 0.5041 0.4351 0.4609 0.4121
B_RMSE 0.8391 0.7315 0.7489 0.6420
C_MAE 0.5605 0.4804 0.4978 0.4666
C_MSE 0.5946 0.5562 0.5235 0.5028
C_RMSE 0.7713 0.7465 0.7235 0.7091

Table 6.

Comparison of model performance stability based on 5-fold cross-validation (Mean ± standard deviation)

MAE MSE RMSE
XGBoost 0.299±0.119 0.121±0.107 0.348±0.186
CatBoost 0.309±0.204 0.323±0.203 0.568±0.167
Gradient boosting 0.248±0.176 0.375±0.187 0.612±0.343
Random forest 0.269±0.140 0.032±0.023 0.179±0.094

Table 7.

Final tourism scores by city and county

Region Score Region Score
Changwon 76.59 Namhae 44.9
Gimhae 57.96 Changning 44.75
Jinju 55.23 Geochang 44.65
Geoje 53.17 Hadong 44.63
Yangshan 52.77 Uiryeong 44.54
Tongyeong 48.28 Haman 44.15
Milyang 47.23 Hamyang 44.11
Sacheon 47.13 Goseong 44
Hapcheon 46.6 Sancheong 40.23

Table 8.

Cluster analysis results of tourism scores by city and county

Region Grade Region Grade
Changwon High Namhae Low
Gimhae Middle Changning Low
Jinju Middle Geochang Low
Geoje Middle Hadong Low
Yangshan Middle Uiryeong Low
Tongyeong Low Haman Low
Milyang Low Hamyang Low
Sacheon Low Goseong Low
Hapcheon Low Sancheong Low

Table 9.

Summary of regional strategies for coping with population decline

Region Strengths Weaknesses Countermeasures
Sancheong Healing, ecology Low accessibility, short stay Improve transport, expand rental cars, bus routes
Goseong dinosaur theme Dispersed event Integrate festivals, strengthen brand image
Hamyang Confucian/senbi culture Lack of modernization Expand experiential content, educational tourism