Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 23, No. 3, pp.67-76
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Mar 2025
Received 09 Jan 2025 Revised 18 Feb 2025 Accepted 21 Feb 2025
DOI: https://doi.org/10.14801/jkiit.2025.23.3.67

머신러닝 기반 소규모 외식업체 소모품 발주 예측 시스템

조규찬* ; 정경창** ; 한병엽*** ; 김대인**** ; 이의종*
*충북대학교 소프트웨어학부
**충북대학교 컴퓨터과학과
***㈜디퓨전랩
****㈜코넥트
*충북대학교 소프트웨어학부(교신저자)
A Machine Learning-based Supply Order Prediction System for Small Restaurants
Gyuchan Jo* ; Kyungchang Jeong** ; ByungYup Han*** ; Daein Kim**** ; Euijong Lee*

Correspondence to: Euijong Lee School of Computer Science, Chungbuk National University, Republic of Korea Tel.: +82-43-261-3133, Email: kongjjagae@cbnu.ac.kr

초록

최근 외식업계에서는 POS(Point of Sales) 시스템과 키오스크의 도입으로 다양한 데이터가 실시간으로 축적되고 있으며 이를 기반으로 데이터 기반의 운영이 가능해졌다. 본 연구에서는 머신러닝 기법을 활용하여 매장의 매출 데이터와 발주 데이터를 분석하고 이를 통해 소모품의 사용량을 예측하여 최적의 발주 시점을 도출하는 시스템을 제안한다. 11개월간의 실제 매장 운영 데이터를 수집 및 분석하였으며 제안한 방법을 다양한 머신러닝 모델에 적용시켜 우수한 예측 성능을 확인했다. 머신러닝으로 예측된 발주일과 실제 발주일과 평균 1.14일의 오차를 보여 실제 소규모 외식업 환경에서 적용이 가능한 수준의 정확도를 달성하였다. 해당 시스템은 데이터 기반의 자동화된 발주 관리 시스템 구축을 통해 소규모 외식업체의 운영 효율성에 기여할 수 있을 것으로 보인다.

Abstract

Recently, while the restaurant industry has been accumulating various data in real-time through the introduction of POS systems and kiosks, this data has not been effectively utilized. This study proposes a system that predicts the consumption of supplies and determines optimal order timing by analyzing sales and order data using machine learning techniques. We collected 11 months of actual store operation data, and experimental results showed that the proposed approach demonstrated reasonable prediction performance. Also, predicting order timing from the proposed approach achieved an average error of 1.14 days from actual order dates. These results demonstrated sufficient accuracy for practical application in small restaurant environments. This system is expected to contribute to operational efficiency through the implementation of a data-driven automated order management system.

Keywords:

machine learning, POS data, supply prediction, order management

Ⅰ. 서 론

최근 POS 시스템과 키오스크의 보급으로 외식업체의 운영 데이터가 실시간으로 수집되면서 데이터 기반의 체계적인 관리가 가능해졌다. 이러한 디지털 환경에서 효율적인 재고 관리는 외식업체의 수익성과 운영 효율성에 직접적인 영향을 미치는 핵심 요소이다[1]-[3]. 특히 매장 단위의 재고 관리는 제한된 보관 공간, 식자재의 유통기한, 수요의 변동성 등 복잡한 요인들이 복합적으로 작용하여 더욱 어려운 과제로 인식되고 있다[4]. 부적절한 재고 관리는 과다 재고로 인한 보관 비용 증가와 재고 부족으로 인한 고객 서비스 저하라는 두 가지 위험을 동시에 수반하기 때문에 최적의 재고 수준을 유지하는 것이 매우 중요하다[5].

현재 대부분의 소규모 외식업체들은 영업장에서 발생하는 실시간 재고 현황을 정확히 파악하지 못한 채 점주나 매니저의 경험과 직관에 의존하여 재고를 관리하고 있다[5]. 매장 운영 시 소모품의 발주 시기와 수량 역시 체계적인 기준 없이 재고가 부족해 보일 때 즉흥적으로 결정되는 경우가 많으며 이러한 즉각적인 대응 방식은 때로는 필요 이상의 과다 발주나 재고 부족으로 인한 고객 서비스 저하로 이어진다[6]. 특히 POS(Point of Sales)[7] 시스템의 도입으로 시간대별 매출, 메뉴별 주문량, 판매 추이 등 매장의 상세한 운영 데이터가 자동으로 수집되고 있음에도 불구하고 대다수의 소규모 외식업체들은 이러한 데이터를 일상적인 재고 관리에 효과적으로 활용하지 못하고 있는 실정이다.

본 연구에서는 외식업체의 효율적인 재고 관리를 위해 머신러닝 기반의 소모품 사용량 예측 및 발주 시점 예측 시스템을 제안한다. 매장의 실제 운영 데이터를 분석하여 매출 패턴과 재고 소비 간의 관계를 파악하고 이를 바탕으로 최적의 발주 시점을 도출하는 것을 목표로 한다. 특히 다양한 머신러닝 모델의 성능을 비교 분석하여 가장 효과적인 예측 모델을 선정하고 실제 매장 환경에서의 적용 가능성을 검증하였다.

본 논문의 구성은 다음과 같다. 2장에서는 재고 관리 최적화와 관련된 선행 연구들을 살펴본다. 3장에서는 제안하는 시스템의 전체적인 구조와 각 구성 요소에 대해 설명한다. 4장에서는 실험 설계 및 성능 평가 결과를 제시하며 이를 통해 제안된 시스템의 효과성을 검증한다. 5장에서는 결론과 한계점에 따른 향후 과제를 통해 데이터 기반의 재고 관리 시스템 구축을 통해 소규모 외식업체의 운영 효율성을 재고할 수 있는 실질적인 방안을 제시할 것으로 기대된다.


Ⅱ. 관련 연구

재고 관리 최적화를 위한 머신러닝 기법의 활용에 관한 연구는 다양한 관점에서 진행되어왔다. 표 1은 본 연구와 관련된 주요 선행 연구들을 목적이 되는 대상, 사용된 모델, 성능 지표 및 결과를 기준으로 비교 분석한 것이다.

Related work table

선행 연구들은 각각 재고 수요 예측, 품절 확률 예측, 공급망 활동 분석 등 서로 다른 목표를 가지고 있으며, 다양한 머신러닝 기법을 활용하여 의미 있는 성과를 도출했다.

공급망 관리(SCM, Supply Chain Management)[17][18]란 원자재의 조달부터 최종 소비자에 이르기까지의 모든 프로세스를 통합적으로 관리하는 경영 기법이다. Tirkolaee et al.[8]의 연구에서는 SCM에서 발생하는 대규모 데이터를 효과적으로 분석하기 위한 머신러닝 기법의 활용 방안을 제시했다. 기존의 방법들이 대용량 데이터 처리에 한계를 보이면서, 이를 분석하고 해석할 수 있는 고성능의 방법론 개발이 요구되었으며 이에 인공지능 기술 중 하나인 머신러닝을 SCM에 적용하여 공급업체 선정 및 세분화, 공급망 리스크 예측, 수요 및 판매 예측, 생산, 재고 관리, 운송 및 유통, 지속 가능한 발전, 순환 경제 등 다양한 영역에서의 활용 가능성을 개념적 프레임워크를 통해 제시했다.

Ntakolia et al.[9]의 연구에서는 효과적인 재고 관리를 위한 머신러닝 기반의 품절 예측 모델을 제안했다. 기존의 확률적 접근 방식과 달리 대규모 과거 데이터에서 정보를 추출하여 예측 모델을 개발하는 방식을 채택했다. 다양한 모델(Random Forest, XGBoost, LightGBM, Bayesian Boosting)을 비교 분석한 결과, 모든 모델이 0.95의 AUC 점수를 달성했으며, Isotonic Regression[19] 방법으로 보정된 LightGBM 모델이 가장 우수한 성능을 보였다. SHAP(SHapley Additive exPlanations)[20] 모델을 통한 설명 가능성 분석 결과, 제품의 재고량, 배송 가능 물량, 즉각적인 수요(판매량), 미래 수요의 정확한 예측이 품절 예측에 중요한 요인으로 작용함을 확인했다.

Deng et al.[10]의 연구에서는 IoT 환경에서의 공급망 관리에 초점을 맞추어 딥러닝 기반의 재고 관리 방법을 제안했다. 물류 비용 최소화와 수익 최대화를 동시에 고려한 수학적 모델을 수립하고 LSTM 모델을 적용하여 시계열 문제를 지도 학습으로 변환하였다. 실험 결과 평균 80% 이상의 재고 수요 예측 정확도를 달성하였으며 기존 방법들과 비교하여 재고 비용을 약 25% 절감할 수 있음을 입증했다.

본 연구는 기존 연구들과 달리 외식업체의 소모품 사용량을 통해 발주 시점을 동시에 예측하는 것을 목표로 하며 실제 외식업체 운영에 실질적 도움을 주고자 함에서 차별점을 둔다.


Ⅲ. 소모품 발주 예측 시스템

3.1 시스템 구조

본 연구는 소규모 외식업체의 효율적인 소모품 재고 관리를 위해 데이터 기반의 발주 시점 예측 시스템을 제안한다. 그림 1은 제안하는 시스템의 전체적인 구조를 보여준다. 시스템은 크게 데이터 수집, 사용량 예측, 주문 시점 예측의 세 단계로 구성되며 최종적으로 적절한 발주 시점의 도출을 목적으로 한다.

Fig. 1.

Overview of order timing prediction system

데이터 수집 단계에서는 매장의 POS 시스템과 키오스크를 통해 실시간으로 발생하는 매출 데이터와 소모품 발주 이력을 수집한다. 이러한 데이터들은 분석이 용이하도록 구조화된 테이블 형태로 저장된다. 사용량 예측 단계에서는 수집된 데이터를 활용하여 과거의 일별 소모품 사용량을 산정하고 이를 학습 데이터로 활용하여 머신러닝 모델을 통해 향후 사용량을 예측한다.

주문 시점 예측 단계에서는 예측된 사용량을 바탕으로 매일의 재고 수준을 추산하고 재고가 위험 수준에 도달하는 시점을 파악하여 이를 적정 주문 시기로 제안한다. 이러한 구조의 시스템은 적절한 발주 시기를 제안하고 매장에서 효율적인 재고 관리가 가능하도록 한다.

3.2 소모품 예측을 위한 데이터 수집

시스템에서 발주 예측을 위해 수집되는 데이터는 소규모 외식업체에 설치된 POS기기와 키오스크에서 발생하는 영수증 출력용 IRPs(I/O Request Packets)[21] 데이터를 실시간으로 수집할 수 있다. 이러한 원시 데이터는 복잡한 패킷 형태로 존재하기 때문에, 데이터 전처리 과정을 통해 분석 가능한 구조화된 테이블 형태로 변환이 필요하다[22].

표 2에서 제시된 매출 데이터셋은 각 주문의 상세 정보(주문 일시, 주문 유형, 메뉴명, 주문 수량, 단가, 매출액)를 Sales 유형으로 포함하고 있으며, 발주 데이터셋은 실제 소모품 발주 정보(발주 일시, 발주 수량, 공급품 종류)를 Supply 유형으로 포함하고 있다. 이러한 데이터들은 시간에 따른 매장의 운영 현황과 소모품의 실제 사용량을 보여주는 지표로써 매장의 운영 패턴과 소모품 사용량 간의 관계를 분석하는데 활용된다.

Dataset description

3.3 소모품 사용량 예측

소규모 외식업체의 적절한 발주 시점을 예측하기 위해서는 소모품의 일별 사용량 예측이 선행되어야 하며 사용량 예측은 매출 데이터와 발주 데이터에 기반 한 사용량 산정 후 머신러닝 모델의 학습을 통해 진행된다. 일별 사용량을 산정하기 위해 식 (1)과 같이 발주량을 일별 매출 비중에 따라 할당하는 방식을 사용하였다. 이는 특정 기간 동안의 총 발주량을 해당 기간의 일별 매출 비율에 따라 배분함으로써 직접적인 측정이 어려운 일별 소모품 사용량을 추정하기 위해 고안되었다.

Ut=Q×C×Sti=1nSi(1) 

여기서, Ut = t일의 사용량, Q = 발주 수량, C = 발주 횟수, S = 매출을 각각 의미한다.

3.4 주문 시기 예측

발주 시점 예측을 위해 추산되는 재고 수준은 식 (2)와 같이 표현할 수 있으며 전일재고량(It-1)에 당일 입고량(St)을 더하고 예측된 사용량(Ut)을 차감하는 방식으로 계산된다. 이렇게 계산된 재고 수준을 기반으로 주문 시점을 결정하기 위해 위험재고수준을 식 (3)과 같이 정의한다.

여기서 위험재고수준(R)은 발주 재고량(Q)에 재고 위험 임계율(α)을 곱한 값으로 설정된다. 임계율은 소모품의 재고가 얼마나 남았는지를 결정하는 지표로 0.1이면 소모품이 10%남은 것을 의미한다. 예측된 재고 수준이 이 위험재고수준에 도달하는 시점을 적정 주문시기로 판단한다.

It=It-1+St-Ut(2) 
R=αQ(3) 

여기서, It = t일의 재고수준, St = t일의 입고량, R = 위험재고수준, α = 재고 위험 임계치를 각각 의미한다.

3.5 소모품 사용량 예측을 위한 머신러닝 모델 학습

앞서 설명한 수집된 데이터, 사용량 예측, 주문시기 예측 등의 데이터는 소모품 사용량 예측을 위한 머신러닝 모델 학습에 사용된다. 학습에 사용되는 입력 데이터는 매출 데이터에서 추출한 일별 주문 건수 매출액 메뉴별 판매량과 같은 매장 운영 특성과 요일, 월과 같은 시간적 특성을 사용한다. 머신러닝 모델의 출력값은 해당 일자의 예상 소모품 사용량으로 이는 앞서 설명한 사용량 산정 방식을 통해 계산된 과거 데이터를 기반으로 한다.

본 연구에서는 머신러닝 모델 학습을 위해 Linear Regression, Random Forest, XGBoost, LightGBM, DNN과 같은 다양한 머신러닝 모델이 사용되었다. Linear Regression은 입력 변수와 출력 변수 간의 선형적 관계를 모델링 하는 기본적인 방법으로 매출과 사용량 간의 기본적인 상관관계를 파악에 활용되었다. Random Forest는 다수의 의사결정 트리를 생성하여 각 트리의 예측을 종합하는 방식으로 비선형적인 패턴을 포착하는데 효과적이다. XGBoost와 LightGBM은 모두 그래디언트 부스팅 기반의 앙상블 모델로 순차인 모델을 개선을 진행하는 것이 특징이다. DNN은 다층 신경망 구조를 통해 데이터의 복잡한 패턴을 학습하여 비선형적 관계를 모델링 한다.


Ⅳ. 실험 설계 및 성능 분석

4.1 실험 설계

실험 데이터 구성을 위해 매장 내 식사, 포장, 배달 서비스를 제공하는 소규모 외식업체의 11개월(271일) 간의 운영 데이터를 분석했다. 매장에서 사용되는 여러 소모품 중 메뉴 포장에 사용되는 단일 유형의 포장용기를 분석 대상으로 선정하였다. 해당 포장용기는 데이터 수집이 진행되는 소규모 외식업체 매장 대부분의 메뉴 포장에 사용되며 메뉴 1인분 당 한 개의 용기를 사용하기 때문에 적절한 예측 대상이라고 판단했다.

분석 기간 동안 총 38회의 발주가 이루어졌다. 포장용기는 뚜껑과 몸체로 구분되며 항상 같은 일자에 발주가 이루어졌다. 발주시 수량은 항상 500개로 구성된다. 발주는 평균적으로 7-10일 간격으로 진행되었으며 수집된 발주 데이터를 통해 매장의 재고 관리 주기와 패턴을 파악할 수 있었다.

각 머신러닝 모델의 학습은 수집된 전체 데이터의 80%를 훈련 데이터로 20%를 테스트 데이터로 분할하여 활용했다. 데이터의 시계열적 특성을 고려하여 시간 순서를 유지한 분할을 수행했으며 모든 특성은 StandardScaler[23]를 통해 정규화했다.

모델의 성능을 최적화하기 위해 파이썬의 Hyperopt[24] 라이브러리를 사용하여 하이퍼파라미터 튜닝을 수행하였다. Hyperopt는 베이지안 최적화 기법[25]을 활용하여 주어진 탐색 공간에서 최적의 하이퍼파라미터 조합을 찾아낸다. 이는 이전 시도들의 결과를 학습하여 더 유망한 파라미터 영역을 중점적으로 탐색하는 지능적인 최적화 방식이다. 본 실험에서는 각 모델 별로 50회의 반복 최적화를 수행하였으며 이를 통해 각 모델의 특성에 가장 적합한 하이퍼파라미터를 도출했다.

표 3은 각 모델의 주요 하이퍼파라미터 설정을 보여준다. Linear Regression은 기본 설정을 사용하여 선형 관계를 모델링 했다. Random Forest는 앙상블을 구성하는 트리의 개수를 200개로 설정하고 각 트리가 데이터를 충분히 학습할 수 있도록 깊이 제한을 두지 않았으며(max_depth=None) 트리의 각 노드를 분할할 때 필요한 최소 샘플 수는 2로 설정하여 세밀한 패턴 학습이 가능하도록 했다. XGBoost는 400개의 트리를 사용하고 과적합 방지를 위해 각 트리의 최대 깊이를 8로 제한했다. 또한 모델의 학습 속도와 안정성을 조절하는 학습률은 0.3으로 각 학습 단계에서 사용할 데이터의 비율을 결정하는 서브샘플링 비율은 0.63으로 설정했다. LightGBM은 500개의 트리를 사용하고 max_depth를 -1로 설정하여 트리의 깊이를 제한하는 대신 리프 노드 수를 기준으로 트리 성장을 제어했다. 학습률은 0.3으로 설정했으며 하나의 트리가 가질 수 있는 최대 리프 노드 수를 100개로 제한하여 모델의 복잡도를 조절했다.

Models and hyperparameter

심층 신경망(DNN) 모델은 PyTorch 프레임워크[26]를 활용하여 구현되었으며 구조는 표 4와 같다. DNN 모델은 3개의 은닉층을 가진 구조로 설계되었으며 각 층의 유닛의 수는 128개에서 시작하여 감소하는 형태를 취했다. 모든 은닉층에는 ReLU[27] 활성화 함수를 사용하여 비선형성을 추가했다. 학습은 Adam[28] 최적화 알고리즘을 사용하였으며 학습률은 0.001로 설정했다. 배치 크기는 32로 설정하여 메모리 효율성과 일반화 성능 간의 균형을 맞추었다.

DNN model structure

4.2 성능분석

사용량 예측 모델의 성능을 평가하기 위해 MAE(Mean Absolute Error) 지표를 사용했다. 앞서 설명한 사용량 산정 방식을 발주 주기(Cycle)별로 적용하여 비교하였는데, 여기서 발주 주기란 연속된 발주 횟수를 의미하며 1회부터 5회까지 각각의 경우에 대해 성능을 분석하였다. 표 5그림 2는 발주 주기에 따른 각 모델의 MAE 값을 보여준다. 분석 결과 모든 모델에서 4회의 연속된 발주를 하나의 주기로 보고 산정한 사용량에서 가장 낮은 MAE 값을 보였으며 특히 XGBoost와 Linear Regression이 각각 7.44와 7.91로 가장 우수한 성능을 나타냈다. Random Forest와 DNN도 각각 8.40과 8.33으로 비교적 좋은 성능을 보였으며 LightGBM은 MAE 9.46으로 다른 모델들에 비해 상대적으로 높은 오차를 보였다. 이러한 결과는 4번의 발주 주기 패턴이 사용량 예측에 가장 적합하며 선형 모델과 앙상블 기반의 트리 모델이 모두 효과적으로 작동함을 보여준다.

MAE of each models

Fig. 2.

Comparison of MAE by order cycle

사용량 예측을 통해 추론되는 주문 시기 예측의 정확성은 표 6그림 3을 통해 확인할 수 있다. 예측된 발주일은 실제 발주일과 매우 근사한 결과를 보여주었다. 특히 첫 두 예측(2024/08/29, 2024/09/03)은 실제 발주일과 정확히 일치하였으며 나머지 예측들도 최대 2일의 차이만을 보였다. 예측된 발주일과 실제 발주일 간의 평균 오차는 1.14일로 실제 업무에 적용하기에 충분히 신뢰할 만한 수준의 정확도를 보여주었다. 이러한 결과는 개발된 모델이 재고 관리와 발주 계획 수립에 실질적으로 도움을 줄 수 있음을 보여준다.

Compare order dates

Fig. 3.

Compare order dates and inventory trends


Ⅴ. 결론 및 향후 과제

본 연구에서는 외식업체의 효율적인 재고 관리를 위해 매장의 매출 데이터와 발주 데이터를 활용한 소모품 사용량 예측 및 발주 시점 예측 시스템을 제안하였다. 분석 결과 4주기의 발주 패턴에서 모델들이 가장 우수한 성능을 보였으며 XGBoost 모델이 가장 높은 예측 정확도를 달성했다. 발주 시점 예측에서는 위험재고수준을 기준으로 한 판단이 실제 발주일과 평균 1.14일의 오차를 보여 실무 적용이 가능한 수준의 정확도를 보여준다.

실제 외식업 환경에서 POS 시스템으로 수집되는 매장의 운영 데이터를 재고 관리에 실제로 활용할 수 있는 방법론을 제시하였다는 점에서 의의를 두며 특히 직접적인 측정이 어려운 소모품의 일별 사용량을 매출 데이터를 통해 추정하고 위험재고수준을 기반으로 한 발주 시점 예측 방식을 통해 실제 영업 환경에 적용이 가능하도록 했다. 이는 소규모 외식업체들이 데이터 기반의 체계적인 재고 관리를 실현하는데 실질적인 도움이 될 것으로 기대된다.

본 연구는 POS 시스템과 발주 기록으로부터 얻을 수 있는 매장 내부 데이터만을 활용하기 때문에 소모품 공급망에서 발생하는 재고 현황, 생산 단위(lot size), 제조 일정과 같은 외부 데이터를 반영하지 못하는 한계가 있다. 이러한 한계를 극복하기 위해 공급업체와의 협력을 통해 외부 데이터를 추가로 확보하고 재고 부족으로 인한 판매 기회 손실, 과잉 재고로 인한 자금 부담, 고객 서비스 만족도 등 실질적인 경영 성과 지표에 대한 연구를 진행해 모델의 예측력과 실용성을 높일 계획이다. 또한 현재 데이터 수집에서 발주일 예측까지 이어지는 프로세스를 소모품이 아닌 매장 내 식자재 및 다른 재고 관리에도 적용할 수 있도록 연구 범위를 확장하고자 한다. 이러한 연구의 확장은 다양한 타겟에 대한 예측 정확도를 향상시켜 시스템의 전반적인 성능 개선으로 이어질 것으로 기대된다.

Acknowledgments

본 논문은 교육부와 한국연구재단의 재원으로 지원을 받아 수행된 3단계 산학연협력 선도대학 육성사업 (LINC3.0)의 연구결과입니다

References

  • E. A. Silver, D. F. Pyke, and R. Peterson, "Inventory management and production planning and scheduling", Journal of Manufacturing Systems, Vol. 18, No. 5, pp. 381, 1999. [https://doi.org/10.1016/S0278-6125(99)90116-4]
  • S. Minner, "Multiple-supplier inventory models in supply chain management: A review", International journal of production economics, Vol. 81-82, pp. 265-279, Jan. 2003. [https://doi.org/10.1016/S0925-5273(02)00288-8]
  • N. Agrawal and S. A. Smith, "Optimal inventory management for a retail chain with diverse store demands", European Journal of Operational Research, Vol 225, No 3, pp. 393-403, Mar. 2013. [https://doi.org/10.1016/j.ejor.2012.10.006]
  • G. Michalski, "Inventory management optimization as part of operational risk management", Economic computation and economic cybernetics studies and research, Vol. 4, No. 4, pp. 213-222, Apr. 2009.
  • L. N. Baylen, "Analysis of inventory management systems of selected small-sized restaurants in Quezon province: Basis for an inventory system manual", Journal of Business and Management Studies, Vol. 2, No. 3, pp. 9-18, Dec. 2020.
  • M. Bertolini, G. Ferretti, G. Vignali, and A. Volpi, "Reducing out of stock, shrinkage and overstock through RFID in the fresh food supply chain: Evidence from an Italian retail pilot", International Journal of RF Technologies, Vol. 4, No. 2, pp. 107-125, Jan. 2013. [https://doi.org/10.3233/RFT-120040]
  • M. Cavusoglu, "An analysis of technology applications in the restaurant industry", Journal of Hospitality and Tourism Technology, Vol. 10, No. 1, pp. 45-72, Jan. 2019. [https://doi.org/10.1108/JHTT-12-2017-0141]
  • E. B. Tirkolaee, S. Sadeghi, F. M. Mooseloo, H. R. Vandchali, and S. Aeini, "Application of machine learning in supply chain management: a comprehensive overview of the main areas", Mathematical problems in engineering, Vol. 2021, No. 1, pp. 1476043, Jun. 2021. [https://doi.org/10.1155/2021/1476043]
  • C. Ntakolia, C. Kokkotis, P. Karlsson, and S. Moustakidis, "An explainable machine learning model for material backorder prediction in inventory management", Sensors, Vol. 21, No. 23, pp. 7926, Nov. 2021. [https://doi.org/10.3390/s21237926]
  • C. Deng and Y. Liu, "A Deep Learning-Based Inventory Management and Demand Prediction Optimization Method for Anomaly Detection", Wireless Communications and Mobile Computing, Vol. 2021, No. 1, pp. 9969357, Oct. 2021. [https://doi.org/10.1155/2021/9969357]
  • L. Breiman, "Random forests", Machine learning, Vol. 45, pp. 5-32, Oct. 2001. [https://doi.org/10.1023/A:1010933404324]
  • T. Chen and C. Guestrin, "Xgboost: A scalable tree boosting system", Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco California, pp. 785-794, Aug. 2016. [https://doi.org/10.1145/2939672.2939785]
  • G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma, Q. Ye, and T.-Y. Liu, "Lightgbm: A highly efficient gradient boosting decision tree", NIPS'17: Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach California USA, pp. 3149-3157, Dec. 2017.
  • V. Sze, Y.-H. Chen, T.-J. Yang, and J. S. Emer, "Efficient processing of deep neural networks: A tutorial and survey", Proceedings of the IEEE, Vol. 105, No. 12, pp. 2295-2329, Dec. 2017. [https://doi.org/10.1109/JPROC.2017.2761740]
  • J. Błaszczyński and J. Stefanowski, "Actively balanced bagging for imbalanced data", Foundations of Intelligent Systems(ISMIS 2017), Vol. 10352, pp. 271-281, Jun 2017. [https://doi.org/10.1007/978-3-319-60438-1_27]
  • S. Hochreiter, "Long Short-term Memory", Neural Computation MIT-Press, 1997. [https://doi.org/10.1162/neco.1997.9.8.1735]
  • D. Power, "Supply chain management integration and implementation: a literature review", Supply chain management:an International journal, Vol. 10, No. 4, pp. 252-263, Sep. 2005. [https://doi.org/10.1108/13598540510612721]
  • Y. Jung and C. Yoon, "A Study on Forecasting Order Quantity from Manufacturing Supply Chain Data using XAI", Journal of KIIT, Vol. 22, No. 8, pp. 41-53, Aug. 2024. [https://doi.org/10.14801/jkiit.2024.22.8.41]
  • X. Jiang, M. Osl, J. Kim, and L. Ohno-Machado, "Smooth isotonic regression: a new method to calibrate predictive models", AMIA Summits on Translational Science Proceedings, Vol. 2011, pp. 16-20, Mar. 2011.
  • S. M. Lundberg and S.-I. Lee, "A Unified Approach to Interpreting Model Predictions", NIPS'17: Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach California USA, pp. 4768-4777, Dec. 2017.
  • W. Oney, "Programming the Microsoft Windows driver model", Microsoft Press, 2002.
  • B. Y. Han and J. Yoo, "Entity Name Recognition Model in Receipt using BERT", Korean Contents Society ICCC 2023, pp. 487-488, Dec. 2023
  • M. Ahsan, M. A. P. Mahmud, P. K. Saha, K. D. Gupta, and Z. Siddique, "Effect of data scaling methods on machine learning algorithms and model performance", Technologies, Vol. 9, No. 3, pp. 52, Jul. 2021. [https://doi.org/10.3390/technologies9030052]
  • B. Shahriari, K. Swersky, Z. Wang, R. P. Adams, and N. D. Freitas, "Taking the human out of the loop: A review of Bayesian optimization", Proceedings of the IEEE, Vol. 104, No. 1, pp. 148-175, Jan. 2016. [https://doi.org/10.1109/JPROC.2015.2494218]
  • J. Bergstra, D. Yamins, and D. D. Cox, "Hyperopt: A Python Library for Optimizing the Hyperparameters of Machine Learning Algorithms", SciPy, Vol. 13, pp. 20, Jun. 2013. [https://doi.org/10.25080/Majora-8b375195-003]
  • A. Paszke, S. Gross, F. Massa, A. Lerer, J. Bradbury, G. Chanan, T. Killeen, Z. Lin, N. Gimelshein, and L. Antiga, "Pytorch: An imperative style, high-performance deep learning library", Proceedings of the 33rd International Conference on Neural Information Processing Systems, Vancouver BC Canada, pp. 8026-8037, Dec. 2019.
  • J. Schmidt-Hieber, "Nonparametric regression using deep neural networks with ReLU activation function", The Annals of Statistics, Vol. 48, No. 4, pp. 1875-1897, Aug. 2020. [https://doi.org/10.1214/19-AOS1875]
  • D. P. Kingma and J. Ba, "Adam: A method for stochastic optimization", arXiv preprint arXiv:1412.6980, , Dec. 2014.
저자소개
조 규 찬 (Gyuchan Jo)

2025년 2월 : 충북대학교 소프트웨어학과(공학사)

2025년 3월 ~ 현재 : 충북대학교 컴퓨터과학과 석사과정

관심분야 : 빅데이터 분석, 데이터 마이닝

정 경 창 (Kyungchang Jeong)

2022년 2월 : 충북대학교 소프트웨어학과(공학사)

2022년 3월 ~ 현재 : 충북대학교 컴퓨터과학과 석박사통합과정

관심분야 : 빅데이터 분석, 데이터 기반 시스템

한 병 엽 (ByungYup Han)

2010년 2월 : 충남대학교 컴퓨터공학과(공학석사수료)

2024년 2월 : 충북대학교 산업인공지능학과(공학석사)

2017년 12월 ~ 현재 : ㈜디퓨전랩 대표이사

관심분야 : AI, 데이터 분석, DX, AX

김 대 인 (Daein Kim)

2017년 8월 : 충북대학교 국제경영학과(학사)

2024년 8월 : 충북대학교 MOT(석사수료)

2015년 11월 ~ 현재 : ㈜코넥트 대표이사

관심분야 : 기술사업화, SW, SaaS, DX, AX, 그로스해킹, UI/UX 기반 시스템

이 의 종 (Euijong Lee)

2012년 2월 : 고려대학교 컴퓨터정보학과(이학사)

2018년 8월 : 고려대학교 컴퓨터공학과(공학박사)

2020년 9월 ~ 현재 : 충북대학교 소프트웨어학부 부교수

관심분야 : 소프트웨어 공학, 사물인터넷, 빅데이터 분석, 인공지능 응용

Fig. 1.

Fig. 1.
Overview of order timing prediction system

Fig. 2.

Fig. 2.
Comparison of MAE by order cycle

Fig. 3.

Fig. 3.
Compare order dates and inventory trends

Table 1.

Related work table

Author Year Target Model Metrics Result
Proposed 2025 Usage amount & order timing Linear Regression, Random Forest [11], XGBoost [12], LightGBM [13], DNN [14] MAE, Date Diff MAE : 6.87
Date Diff : ±2 days
Tirkolaee et al. [8] 2021 Supply chain activities - - -
Ntakolia et al. [9] 2021 Backorder probability Random Forest, XGBoost, LightGBM, Bayesian Boosting [15] AUC 0.95
Deng et al. [10] 2021 Inventory demand LSTM
(Long-Short Term Memory) [16]
Accuracy 80%

Table 2.

Dataset description

Feature name Type Description Data type
order date datetime Date of the order (YYYYMMDD) Sales
order type string Type of order
menu name string Name of the menu item
menu quantity integer Quantity of the menu item ordered
menu price integer Unit price of the menu item
menu sales amount integer Total sales amount for the menu item (quantity× price)
supply date datetime Date of the supply order (YYYYMMDD) Supply
supply quantity integer Quantity of the supply item ordered
supply item type string Type of supply item

Table 3.

Models and hyperparameter

Model Hyperparameter
Linear Regression -
Random Forest n estimators : 200, max depth : None, min samples split : 2, min samples leaf : 1
XGBoost n estimators : 400, max depth : 8, learning rate : 0.3, subsample : 0.63
LightGBM n estimators : 500, max depth : -1, learning rate : 0.3, num leaves : 100

Table 4.

DNN model structure

Type Content
Input size 50
Hidden Layers 3 layers (128 → 64 → 32 units)
Activation function ReLU
Loss function Mean Squared Error (MSE)
Optimizer Adam (learning rate: 0.001)
Batch size 32

Table 5.

MAE of each models

Cycle 1 2 3 4 5
Model
XGBoost 18.96 18.95 13.13 7.44 10.31
Linear Regression 20.2 15.85 13.43 7.91 11.5
DNN 20.06 14.64 13.48 8.33 10.59
Random Forest 17.61 14.32 11.76 8.4 9.73
LightGBM 18.16 18.55 12.09 9.46 11.87

Table 6.

Compare order dates

Index Actual order Predict order difference
1 2024/08/29 2024/08/29 0
2 2024/09/03 2024/09/03 0
3 2024/09/10 2024/09/12 2
4 2024/09/18 2024/09/20 2
5 2024/09/30 2024/09/29 1
6 2024/10/17 2024/10/15 2
7 2024/10/25 2024/10/24 1