
특징벡터를 이용한 낙상감지 경량 머신러닝 모델
초록
본 연구는 고령화 사회와 산업 현장에서 빈번히 발생하는 낙상 문제를 해결하기 위해, 데이터 품질 관리와 경량 머신러닝을 결합한 낙상 감지 방법을 제안한다. 기존의 CNN·LSTM 기반 연구는 정확도는 높았지만, 실시간성과 저전력 요구를 충족하기 어려웠다. 이에 본 연구는 마할라노비스 거리 기반 이상치 제거와 앙상블 신뢰도 기반 저신뢰 샘플 제거를 결합한 이중 단계 데이터 정제(Double-stage data cleansing) 절차를 새롭게 설계하였다. 이를 통해 89,953개 중 57,638개의 고품질 샘플을 확보하고, 복잡한 딥러닝 없이도 MLP, XGBoost, RandomForest, SVM 등의 경량 모델로 Accuracy 94~96%, F1-Score 96%를 달성하였다. 특히 XGBoost 모델은 평균 추론 지연 0.3157 ms(≈3,168 Hz)로, IMU 센서 주파수(100–41Hz)를 초과함으로써 실시간 처리 가능성과 높은 실용성을 입증하였다.
Abstract
This study proposes a fall detection method combining data quality management and lightweight machine learning to address the frequent problem of falls in an aging society and industrial environments. While existing CNN·LSTM-based research achieved high accuracy, it struggled to meet real-time processing and low-power requirements. Therefore, this study newly designed a Double-stage Data Cleansing procedure that combines Mahalanobis distance-based outlier removal and ensemble confidence-based low-confidence sample removal. Through this process, 57,638 high-quality samples were secured from an initial 89,953. This enabled lightweight models such as MLP, XGBoost, RandomForest, and SVM to achieve 94-96% Accuracy and an F1-score of 96% without relying on complex deep learning. In particular, the XGBoost model achieved an average inference latency of 0.3157 ms (≈3,168 Hz), which exceeds IMU sensor frequencies (100–41Hz), thus demonstrating its capability for real-time processing and high practicality.
Keywords:
fall detection, on-device inference, lightweight machine learning, XGBoost, data qality management, real-time processingⅠ. 서 론
전 세계적으로 고령화가 급속히 진행되면서 낙상(Fall)은 노인들에게 주요한 부상 및 사망 원인으로 부각되고 있다. 세계보건기구(WHO)와 미국 질병통제예방센터(CDC)의 보고에 따르면, 매년 수백만 명의 노인이 낙상으로 인해 병원 치료를 받고 있으며, 이에 따른 의료비 지출과 사회·경제적 비용은 지속적으로 증가하고 있다[1][2]. 특히 노인의 낙상은 단순한 골절이나 타박상에 그치지 않고 장기적인 재활 및 요양으로 이어져, 삶의 질 저하를 가속화하는 주요 요인으로 지적된다[2]. 또한, 건설업 및 제조업 등 산업 현장에서도 낙상은 가장 빈번하게 발생하는 산업재해 유형으로 보고되며, 이는 장기 결근, 생산성 저하, 법적 분쟁 등 심각한 문제를 초래한다 [3][4]. 따라서, 낙상을 사전에 감지하거나 발생 직후 신속하게 대응할 수 있는 기술 개발은 의료 및 산업 분야 전반에서 긴급한 과제로 인식되고 있다.
그동안 낙상 감지 연구는 다양한 접근을 통해 활발히 진행되어 왔으며, 크게 센서 기반, 비전 기반, 그리고 하이브리드 방식으로 구분된다[5][7]. 비전 기반 접근은 Skeleton Keypoint 추출과 LSTM 모델을 활용하여 높은 정확도를 달성하였으나, 개인 프라이버시 침해 가능성과 카메라 설치·운용의 제약으로 인해 실제 일상 환경에서의 상용화에는 한계가 존재한다[5]. 한편 Wi-Fi CSI, FMCW 레이더, 압력 센서 등을 활용한 하이브리드 기법은 환경 의존성이 크거나 비용 부담이 높아 실효성이 낮다[6]-[8]. 센서 기반 연구 역시 IMU 신호를 활용하여 다양한 성과를 거두었으나, 기존 접근은 CNN이나 LSTM과 같은 복잡한 딥러닝 구조, 혹은 멀티 모달 센서 융합을 요구하는 경우가 많아 온 디바이스 환경에서 실시간성과 저전력 요구를 충족하기 어렵다[9]-[12].
이러한 한계점들을 고려할 때, 낙상 감지 시스템은 응급 대응을 위해 실시간성과 경량성을 동시에 만족해야 하며, 이는 모델의 복잡도를 최소화하는 동시에 데이터 품질을 극대화하는 방향으로 나아가야 함을 시사한다. 그러나 기존 연구들은 주로 모델 구조의 복잡성에 초점을 맞추었고, 데이터 품질 관리와 전처리 과정이 학습 안정성과 일반화 성능에 미치는 영향을 분석한 사례는 드물다.
이에 본 연구는 특징 추출과, 데이터 품질 관리 중심의 새로운 접근을 제안한다. 구체적으로, 스마트폰 내장 가속도·자이로 신호를 기반으로 슬라이딩 윈도우 특징 엔지니어링과 이중 단계 데이터 정제(Double-stage data cleansing) 절차를 적용하였다. 1차 단계에서는 마할라노비스 거리(Mahalanobis distance) 기반 이상치 제거를 수행하였으며, 2차 단계에서는 앙상블 예측 신뢰도 기반(Low-confidence ensemble filtering) 샘플 제거를 통해 노이즈와 불확실성을 최소화하였다. 이 과정을 통해 전체 89,953개 중 57,638개의 고품질 샘플을 확보하고, 20차원 특징 벡터를 구성하였다.
정제 전후 비교 결과, 데이터 품질 향상은 대용량 MLP 학습을 통해 데이터 셋이 안정적이라는 것을 실험적으로 보였으며, 경량 XGBoost 모델(318.57 KB)은 Validation Accuracy 96.12%, F1-score 95.76%, 평균 추론 지연 0.3157 ms (≈3,168 Hz)로, 플래그십 스마트폰 기준 IMU 센서 주파수 (100–415 Hz)를 크게 상회하는 실시간 성능을 달성하였다.
따라서, 본 연구의 핵심 기여는 (1) 마할라노비스 거리와 앙상블 신뢰도 기반의 이중 단계 데이터 정제 절차 제안, (2) 데이터 품질이 학습 안정성과 성능 향상에 미치는 영향의 실증적 검증, (3) 복잡한 딥러닝 없이 실시간성이 확보 가능한 경량 낙상 감지 모델의 제시에 있다.
결과적으로, 본 연구는 모델 설계가 아닌 데이터 품질 관리 중심 접근만으로도 고성능과 실시간성을 달성할 수 있음을 실험적으로 입증하며, 의료 및 산업 현장의 온 디바이스 응용 가능성을 제시한다.
Ⅱ. 관련 연구
노인을 대상으로 한 낙상 감지에서 기존의 되플러 기반 속도 특징만을 사용하는 방식이 일상 동작(예: 머리 손질, 기상 동작 등)에서 빈번한 오검출을 유발할 수 있음을 지적하였다.
이를 해결하기 위해 FMCW 레이더를 이용해 range – velocity 맵과 range – acceleration 맵을 구성하고, centroid range 및 range width라는 융합 특징을 제안하였다. 해당 접근은 단순 속도·가속도 기반 특징 대비 낙상과 일상 동작 간 차이를 뚜렷하게 구분할 수 있었다는 점에서 의의가 있으나, 레이더 구축 비용과 설치 제약이 크다고 보이며, 보고된 F1-score(0.743)가 실제 의료 현장에서 요구되는 수준에는 미치지 못한다는 한계를 지닌다[6].
Wi-Fi CSI 데이터를 기반으로 LSTM-Attention 모델을 제안하여 97.6%의 정확도와 0.976의 F1-score를 달성하였다. 이는 CSI 진폭 정보를 활용해 환경 변화에 강인한 성능을 확보했다는 점에서 의의가 있으나, Wi-Fi AP 배치 및 채널 환경에 성능이 크게 의존하여 실제 적용 시 장소 제약이 따른다는 한계가 있음을 시사한다[7].
손목 착용형 웨어러블 밴드를 활용하여 기존 허리·가슴 고정 센서 기반 방식의 불편함을 개선하고, 3축 가속도 기반 SVM과 기압 센서 기반 고도 데이터를 복합적으로 적용해 약 94.5%의 정확도와 2%의 낮은 오탐율을 달성함으로써 상용화 가능성을 제시하였다. 그러나 데이터 수집이 성인 남성 3명에 한정되어 있어 고령층 적용에 한계가 있으며, 낙상 인지 방식이 임계값과 SVM 조합에 의존해 복잡한 생활 환경이나 노이즈 상황에서는 성능 저하 가능성이 존재한다는 점에서 일반화와 확장성을 확보하기 위한 후속 연구가 필요하다[8].
IMU 원신호를 활용하여 충격 직전의 낙상 방향을 분류함으로써 보호 장치 작동 가능성을 제시하였다. 그러나 이러한 접근은 충격 직전이라는 제한된 시간 구간에 국한되며, 전용 IMU 센서와 같은 추가 장치가 필요하다는 한계가 있다[9]. 본 연구에서는 이를 보완하기 위해 스마트폰 내장 IMU 기반 초경량 모델을 적용, 낙상 여부를 실시간으로 감지할 수 있음을 데이터 실험을 통해 확인하여 일상적 활용 가능성을 제시한다.
스마트폰 내장 센서를 활용한 FallDroid 시스템을 제안하여 Recall 99.5%, 하루 평균 59시간당 1회라는 낮은 오탐률을 기록하였다. 이는 상용화 가능성을 보여준다는 점에서 의의가 있으나, 스마트폰을 허리나 허벅지에 지속적으로 부착해야 한다는 비현실적인 가정에 기반한다는 한계가 있다[10].
CNN-BiLSTM 기반 CB-LSTM 아키텍처를 제안하여 정확도 98.83%, 재현율 99.18%를 기록하였다. 공간·시간적 특징을 동시에 학습한 점은 주목할 만하나, 도플러 레이더가 사용자의 동작을 지속적으로 추적해야 하므로 프라이버시 침해 가능성이 있으며, 실제 생활 환경에서의 전파 간섭 상황에 대한 검증이 부족하다는 한계를 지닌다[11].
웨어러블 IMU 장치를 활용해 CNN, LSTM, CNN-LSTM 모델을 비교하였으며, LSTM이 가장 우수한 재현율을 보였다. 이는 웨어러블 기반 접근이 높은 민감도를 제공한다는 점에서 의미가 있으나, 고령자의 생활 환경에서는 장치 착용 지속성이 낮아 상용화 가능성이 떨어진다는 한계를 지닌다[12].
PoseNet으로 추출한 skeleton keypoint와 GRU를 결합하여 최대 99.8%의 정확도를 기록하였다. 이는 센서를 착용하지 않고도 저가 2D RGB 카메라만으로 안정적인 낙상 감지가 가능하다는 점에서 의의가 있다[13].
지하공동구 CCTV와 YOLO 기반 객체 검출을 통해 낙상을 탐지하였으나, 고성능 연산 자원과 전용 인프라가 요구된다는 한계가 있다. 반면 본 연구는 범용 스마트폰 IMU를 활용하여 초경량 모델 기반으로 ms 단위 실시간 추론을 달성하였기 때문에, 별도의 고비용 장치 없이도 낙상 감지가 가능하다. 이는 "낙상 감지를 위해 반드시 CCTV와 딥러닝 객체 검출이 필요한가?"라는 근본적인 질문을 제기하며, 스마트폰만으로도 충분히 상용화 가능한 대안을 제시한다[14].
sEMG 기반 베이지안 기법으로 낙상을 조기 예측하는 가능성을 보였으나, 착용형 센서의 한계와 데이터 규모 제약이 있었다. 반면 본 연구는 별도의 장비 없이 스마트폰 내장 IMU 만으로 높은 정확도와 실시간성을 확보함으로써, 상용화와 보급 가능성 측면에서 차별적인 가치를 가진다[15].
스마트폰은 내장된 가속도계, 자이로스코프, GPS 등 다중 센서를 통해 활동을 모니터링할 수 있어 헬스케어와 낙상 감지에 활용된다. Straczkiewicz 등은 스마트폰 기반 활동 인식에 대한 체계적 문헌 조사를 통해, 전통적 머신러닝에서 CNN · LSTM 등 심층 신경망 기반 모델로의 전환, 데이터 품질·센서 위치의 중요성, 그리고 온 디바이스 최적화의 필요성을 강조하였다[16].
이처럼 기존 연구들은 다양한 센서·비전·하이브리드 접근을 통해 낙상 감지 성능을 향상시켰으나, 프라이버시 침해, 착용 지속성, 환경 의존성, 고비용 인프라, 복잡한 모델 구조 의존 등으로 인해 실제 온 디바이스 환경에서의 실시간 적용에는 여전히 제약이 존재한다. 이러한 한계를 극복하기 위해 본 연구는 데이터 품질 관리와 경량 모델 기반 접근에 초점을 맞추어, 복잡한 아키텍처 없이도 안정적이고 실용적인 낙상 감지 성능을 달성할 수 있음을 보이고자 한다.
본 연구에서는 다단계 데이터 정제 과정을 통해 89,953개의 윈도우 샘플 중 57,638개의 정제된 윈도우 샘플을 확보하여 노이즈와 불확실성을 제거한 고품질 데이터 셋을 마련하였다. 이후 파라미터 수를 100만 개 이상으로 넉넉히 설정한 MLP를 학습시켜 의도적으로 학습 난이도를 높였고, 학습 정확도와 검증 정확도 기준으로 과적합이 아님을 확인하였다. 이는 벡터 기반 피처 엔지니어링을 거친 데이터 셋조차 쉽지 않다는 점을 보여준다.
이어 트리 기반 앙상블 모델을 적용한 결과에서도 충분히 안정적인 성능을 보였다. 이는 곧 정제된 데이터 셋에서는 복잡한 구조가 아니라도 단순 모델이 효과적으로 학습할 수 있음을 입증한 사례라 할 수 있다. 본 연구의 핵심 기여는 복잡한 모델 설계가 아니라 데이터 품질 관리가 성능 향상의 직접적 요인이 될 수 있음을 대규모 MLP와 경량 트리 기반 모델 실험을 통해 증명한 데 있다.
Ⅲ. 설계 및 구현
본 연구에서 사용된 데이터 셋은 실제 생활 환경을 충실히 반영하도록 설계되었다. 스마트폰은 특정 위치에 고정하지 않고, 사용자가 일상적으로 휴대하거나 자연스럽게 배치하는 상황을 그대로 반영하여 데이터를 수집하였다. 실생활을 상정하고 수집한 데이터이다 보니 상당한 노이즈가 존재하였고, 이를 개선하기 위해 총 세 단계의 정제 절차를 적용하였다. 그 결과로 전체 89,953개의 윈도우 데이터 중 57,638개의 정제된 샘플을 최종 확보하였다.
3.1 데이터 셋
표 1은 젊은 참가자들은 실제 낙상 모사를 위해 다양한 동작을 수행한 것을 나타낸 표이다. 먼저 앞으로 넘어짐(F01~F05)에는 무게 중심을 잘못 옮기거나, 걷다가 걸려 넘어지거나, 방향 전환 중 회전하며 쓰러지는 경우, 그리고 앉은 상태에서 기절·졸음으로 인한 낙상이 포함된다.
이어서 뒤로 넘어짐(F06~F09)은 걷다가 미끄러져 벽에 기대앉는 듯한 상황, 앉으려다 뒤로 넘어지는 경우, 또는 앉은 상태에서 기절로 인해 뒤로 쓰러지는 상황을 포함한다. 옆으로 넘어짐(F10~F12)은 왼쪽이나 오른쪽으로 쓰러져 눕는 경우, 혹은 앉은 상태에서 기절하거나 졸아 옆으로 쓰러지는 경우로 정의된다. 마지막으로 수직 낙하(F13a, F13b)는 실신이나 의식 상실과 같이 갑작스럽게 쓰러지는 상황을 나타낸다. 표 2는 고령자 참가자들이 수행한 일상생활 동작(ADL) 및 낙상 유사 활동을 정리한 것이다. 여기에는 걷기(F1)와 조깅(F2)처럼 기본적인 보행 동작, 제자리에서 뛰기(F3), 계단 오르내리기(F4)와 같은 활동이 포함된다. 또한, 서있다가 무릎을 굽히거나 굽히지 않고 일어서기(F5), 낮은 의자에 앉아 일정 시간 머문 뒤 일어서기(F6), 소파에서 앉았다 일어서기(F8), 바닥에서 앉았다 일어서기(F9) 등 다양한 앉기·일어서기 동작도 수행되었다.

List of adl (activities of daily living) and fall-like activities performed by older adult participants
더불어 잠시 앉았다가 일어서려다 의자에 다시 쓰러져 앉기(F7), 바닥에 앉아 눕고 다시 앉기(F10), 바로 누운 상태에서 옆으로 돌아눕고 다시 바로 눕기(F11)와 같이 낙상과 유사하게 오인될 수 있는 활동도 포함되었다. 마지막으로 넘어지지 않고 가볍게 점프하기(F12), 자동차에 타서 일정 시간 앉아 있다가 다시 내리기(F13a) 등의 활동이 추가되어, 실제 생활 속에서 발생할 수 있는 다양한 상황을 반영하였다. 60세 이상 고령자 14명(여성 9명, 남성 5명; 평균 연령: 72세; 평균 키: 158.07cm; 평균 체중: 59.57kg)이 모집되었으며, 모든 참가자는 60세 이상이었다. 각 활동(표 2에 나열됨)에 대해 여러 번의 실험이 기록되었다. 네 대의 LG G900N 스마트폰(SP)이 사용되었으며, 각각 흔히 스마트폰을 휴대하는 위치(손에 쥠, 바지 주머니, 허리 파우치, 어깨 가방)에 배치되었다.
3.2 정제 절차
첫째, 윈도잉 및 피처 엔지니어링 단계에서는 원시 IMU 데이터(accx, accy, accz, gyrox, gyroy, gyroz)를 128프레임 단위로 분할 후, 각 윈도우는 다시 32프레임씩 4개의 서브윈도우로 나누었으며, 각 서브윈도우마다 다섯 가지 특징을 추출하였다. 추출된 특징은, 가속도 크기의 평균, 가속도 크기의 분산, jerk RMS, 에너지 비율 acc²/gyro, peak-to-peak(최댓값–최솟값)이다. 이를 통해 서브 윈도우당 5차원 벡터가 생성되었고, 네 개의 서브윈도우를 결합하여 최종적으로 20차원의 특징 벡터를 구성하였다. 이 과정을 통해 총 89,953개의 윈도우 샘플이 생성되었다. 둘째, 1차 정제 단계에서는 낙상 샘플 분포를 기반으로 Empirical Covariance를 학습한 뒤, 비낙상 샘플에 대한 마할라노비스 거리를 계산하였다[17].
이후 비낙상 분포의 하위 10% 구간을 그림 임곗값으로 설정하여, 낙상 데이터와 지나치게 가까운 낙상 샘플을 제거함으로써 클래스 간 경계를 보다 명확히 하고자 하였다. 셋째, 2차 정제 단계에서는 앙상블 기반의 저신뢰 샘플 제거를 수행하였다. 실험은 PyTorch 환경에서 seed를 42로 고정한 상태에서 진행되었고, XGBoost, GatedMLP, SimpleMLP 세 가지 모델을 학습시켜 각 샘플의 예측 확률을 계산하였다. 다음은 정제 단계에서 사용된 모델들의 상세 정보이다.
1) GatedMLP (게이트 기반 구조) 입력 특징을 단순곱 게이트(gate)를 통해 선택적으로 반영하는 구조로, 중요한 신호는 강조하고 불필요한 신호는 억제할 수 있다. 단순 MLP에 비해 특징 선택성이 강화된다는 점에서 차별화된다.
2) SimpleMLP (순차적 변환 구조) 입력 차원 20을 받아 두 개의 은닉층(각 64차원)과 ReLU 활성화를 거쳐 출력으로 이어지는 전형적인 다층 퍼셉트론 구조이다. 게이트 없이 모든 입력을 동일하게 처리한다는 점에서 GatedMLP와 다르며, 신경망 계열이라는 점에서 XGBoost와 구별된다.
3) XGBoost (트리 기반 구조) 트리 앙상블을 기반으로 입력 특징을 분할하며 학습하는 구조이다. 신경망 계열 모델과 달리 결정 경로(decision path)를 따라가며 불확실성을 평가하기 때문에 다른 관점에서 노이즈를 검출할 수 있다. 자세한 방법으로는 비낙상 샘플 중에서 예측 확률이 [0.4–0.5], [0.3–0.6], [0.2–0.7], [0.1–0.9] 구간에 위치하는 경우를 저 신뢰 구간으로 정의하였다.
이후 두 개 이상이 동일하게 저 신뢰 로 분류한 샘플을 제거 대상으로 확정하였다. 이처럼 게이트 기반·순차적 변환·트리 기반이라는 서로 다른 처리 방식을 가진 모델들을 단일하게 사용하는 경우에는 특정 잡음 패턴을 놓치거나 오판할 위험이 있다고 판단하였다. 따라서 세 모델의 출력을 앙상블 하여 상호 보완적으로 활용함으로써, 단일 모델만으로는 걸러내기 어려운 불확실 샘플까지 보다 정밀하게 정제할 수 있었다.
3.3 대용량 MLP 학습을 통한 데이터 셋 검증
대용량 MLP 학습 실험은 2차 정제 단계의 유효성을 검증하기 위해 적용되었으며, 실제로 설정된 구간 기준이 데이터 품질 향상에 기여하는지를 학습 과정을 통해 평가하고자 하였다. 주요 평가 지표로는 학습 정확도와 검증 정확도를 사용하였다. 본 실험의 목적은 일반화 성능 자체의 비교가 아니라 데이터 품질 검증에 초점을 두었기 때문에, 모델이 충분히 정제된 데이터 셋에서 안정적으로 학습이 가능하다면 이는 곧 데이터 셋이 안정적인 학습을 지원할 수 있음을 의미한다고 가정한다.
3.4 경량 머신러닝 학습 실험
동일한 데이터 정제 및 피처 엔지니어링이 적용된 정제 데이터 셋을 활용하여, 신경망 기반 모델 이외의 경량 머신러닝 분류기 모델들의 학습 가능성을 검증하였다. 이를 위해 SVM(RBF 커널), Random Forest(RF), XGBoost를 대상으로 하이퍼 파라미터 탐색을 수행하였다. 모든 모델은 Stratified K-Fold 교차 검증 기반의 GridSearchCV를 통해 파라미터 최적화를 진행하였다. 그 결과 SVM(RBF)은 정규화 계수 C와 커널 폭 γ에 대해 {0.1, 1, 10}, {"scale", 0.01, 0.001} 범위를 설정하고 탐색을 수행하여 다음과 같은 최적 조합을 도출하였다.
RF: 트리 수(n_estimators) {100, 200}, 최대 깊이(max_depth) {4, 6, 8}, 최소 분할 샘플 수(min_samples_split) {2, 5}를 탐색한 결과, n_estimators=200, max_depth=8, min_samples_split=2 조합이 최적값으로 확정되었다.
XGBoost: 학습률(learning_rate) {0.01, 0.1, 0.2}, 트리 수(n_estimators) {100, 200}, 최대 깊이(max_depth) {4, 6, 8}, 부분 샘플링 비율(subsample) {0.8, 1.0}을 탐색하였으며, 최종적으로 learning_rate=0.2, n_estimators=200, max_depth=4, subsample=1.0이 최적 조합으로 도출되었다. 추가적으로 모델의 언더피팅 가능성도 알아보기 위해 최종 도출된 XGboost의 2배 크기인 Large-XGboost 모델도 준비하였다.
본 실험은 복잡한 신경망 구조가 아닌 경량 트리 기반 및 커널 기반 분류기 또한 정제된 데이터 셋 위에서 충분히 실질적인 학습 성능을 발휘할 수 있음을 검증하는 데 목적을 두었으며, 지표로는 Accuracy(Acc.), F1-score(F1), Recall(Rec.), precision(Prec.)를 사용하였다.
3.5 경량 머신러닝 추론 속도 검증
본 연구에서는 제안된 경량 머신러닝 분류기가 실제 온 디바이스 환경에서 저 지연 동작이 가능한지를 검증하기 위하여 추론 속도 측정 실험을 수행였다. 앞선 학습 실험은 주로 데이터 품질 관리와 학습 안정성 확보에 초점을 두었으나, 낙상 감지 시스템과 같은 응용에서는 실시간 응답성이 필수적이므로 추론 지연에 대한 검증 또한 필요하다.
실험은 동일한 정제 데이터 셋을 입력으로 사용하여 진행되었으며, 초기 실행 단계에서 발생할 수 있는 캐싱 및 메모리 로딩 지연의 영향을 최소화하기 위해 10회 워밍업 과정을 선행한 뒤 본격적인 추론 속도를 측정하였다. 또한, 저장 용량을 함께 고려하여 성능을 평가함으로써 추론 지연뿐 아니라 메모리 효율성까지 종합적으로 분석하였다.
Ⅳ. 실 험
그림 1을 보면 먼저, 낙상 및 비낙상 신호를 입력으로 받아 128프레임 단위의 윈도잉과 서브윈도우 분할 과정을 거쳐 20차원 특징 벡터(총 89,953개 샘플)를 생성하였다. 이후 마할라노비스 거리를 활용한 1차 데이터 정제를 수행하여 87,068개의 샘플을 확보하였다. 이어서 XGBoost, GatedMLP, SimpleMLP의 예측 확률을 다수결로 앙상블 하여 저 신뢰 샘플을 제거하는 2차 정제를 진행하였으며, 최종적으로 57,638개의 정제 샘플이 도출되었다.
정제된 데이터 셋은 두 가지 실험에 활용되었다. 첫째, 대용량 MLP 학습을 통해 데이터 품질이 학습 안정성과 수렴성에 기여함을 검증하였다. 둘째, 경량 머신러닝 분류기(SVM, Random Forest, XGBoost)를 학습시켜 Accuracy, Precision, Recall, F1-score 성능을 비교하였다. 마지막으로, 실제 온 디바이스 환경 적용 가능성을 평가하기 위해 각 모델의 추론 속도(ms 단위)와 파일 크기(KB/MB 단위)를 측정하였다. 이 흐름은 데이터 정제 → 학습 검증 → 모델 효율성 분석으로 이어지는 일련의 절차를 체계적으로 보여주며, 본 연구에서 제안한 데이터 품질 관리와 경량 모델 설계 접근법의 핵심적인 기여 과정을 직관적으로 설명한다.
4.1 데이터 정제 이전
그림 2는 데이터 정제 이전 PCA(Principal Component Analysis) 시각화 자료이다. 이는 데이터 상태에서 클래스 간 경계가 불명확하다는 것을 의미하며, 모델이 학습 과정에서 혼동을 일으킬 가능성을 높인다.
4.2 1차 데이터 정제 결과
그림 3은 마할라노비스 거리를 통한 거리를 이용한 데이터 클렌징 결과이다[17]. 데이터 정제 이후의 시각화 자료이다. 우선 낙상 클래스(낙상 데이터)를 대상으로 공분산을 구한 뒤, 이를 기준으로 각 샘플이 비낙상 분포에서 얼마나 떨어져 있는지를 마할라노비스 거리로 계산하였다.
이어서 낙상 데이터의 거리 분포를 확인하여, 하위 10% 지점에 해당하는 값을 임곗값으로 설정하였다. 그 결과, 이 임곗값보다 더 가까운 영역에 위치한 비낙상 샘플들은 낙상 데이터와 지나치게 유사한 특성을 지닌 샘플로 간주하고, 이는 곧 잠재적 잡음 혹은 라벨 오류일 가능성이 높다고 판단하였다. 해당 낙상 샘플들을 제거하였고, 그 결과 87,068개의 정제된 샘플을 확보할 수 있었다.
4.3 머신러닝/딥러닝 기반 정제 결과
추가적인 데이터 정제 단계에서는 세 가지 모델(XGBoost, GatedMLP, SimpleMLP)을 활용하여 샘플의 신뢰도를 교차 검증하였다. 먼저 동일한 정제 데이터 셋을 세 모델에 학습시킨 후, 각 샘플의 예측 확률을 산출하였다. 이때 비낙상 클래스임에도 불구하고 예측 확률이 [0.4–0.5], [0.3–0.6], [0.2–0.7], [0.1–0.9] 구간에 위치하는 경우를 저 신뢰 샘플로 정의하였다. 이러한 샘플은 모델이 클래스 경계를 명확히 구분하지 못한다는 의미로, 잠재적인 잡음 데이터 또는 라벨 불확실성을 포함할 가능성이 높다고 판단하였다.
세 모델 각각에서 도출된 저 신뢰 샘플의 인덱스를 비교한 뒤, 세 모델 중 두 개 이상이 동일하게 저 신뢰 로 판정한 샘플을 제거 대상으로 확정하였다. 즉, 다수결 방식을 통해 단일 모델의 편향에 의한 과잉 제거를 방지하면서, 동시에 비일관적이거나 불확실한 비낙상 샘플을 효과적으로 제거할 수 있었다.
표 3은 데이터 정제 임계 구간에 따른 대용량 MLP 모델의 학습 및 검증 정확도 변화를 비교한 결과를 나타낸다. 정제 과정이 적용되지 않은 필터링 이전 조건에서는 학습 정확도 82.38%, 검증 정확도 81.38%로 상대적으로 낮은 성능을 보였다.
반면, 필터링을 적용한 경우 임계 구간이 좁은 [0.4–0.5]와 [0.3–0.6]에서는 데이터 선별 효과가 제한적이었으며, 각각 학습/검증 정확도가 81.83%/82.52%, 84.77%/86.95% 수준에 머물렀다.
임계 구간을 확장한 [0.2–0.7]에서는 데이터 품질 향상 효과가 뚜렷하게 나타나 학습 정확도 90.24%, 검증 정확도 91.31%로 크게 개선되었다. 가장 넓은 구간인 [0.1–0.9] 조건에서는 학습 정확도 96.16%, 검증 정확도 96.54%를 기록하며, 모든 구간 중 가장 우수한 성능을 달성하였다.
이는 임계 구간이 지나치게 좁을 경우 일부 불확실 샘플만 제거되어 데이터 품질 개선 효과가 제한적인 반면, 구간을 충분히 늘려 확장할수록 노이즈 샘플이 효과적으로 제거되어 데이터의 분포 안정성과 모델의 일반화 성능이 동시에 향상됨을 의미한다. 따라서 본 연구에서는 학습 및 검증 정확도 모두에서 가장 높은 성능을 보인 [0.1–0.9] 구간을 최적 임계값 범위로 채택하였다. 이는 불필요한 샘플 제거를 통해 데이터 품질이 크게 향상되었음을 보여준다. 아래 그림 4는 이전 실험에서 선택한 최종 구간([0.1–0.9])을 통해 2차 정제 후 PCA로 시각화한 결과이다. 낙상 샘플과 비낙상 샘플의 경계가 명확해지는 것을 볼 수 있다. 최종 구간으로 선택한 PCA의 결과는 다음과 같다.
그림에서 확인할 수 있듯이, 최종 구간을 적용한 최종 데이터 셋은 불확실성이 높은 비낙상 샘플들이 효과적으로 제거되어 클래스 간 분포가 이전보다 명확하게 구분되는 양상을 보인다. 낙상 데이터(빨강)는 여전히 원점 인근에 밀집되어 있으며, 비낙상 데이터(파랑)는 상대적으로 넓게 분포하지만 과도한 중첩은 줄어들어 두 클래스의 경계가 한층 뚜렷해졌다. 이는 다단계 필터링이 데이터 품질 개선에 실질적인 기여를 하였음을 시각적으로 입증하는 결과라 할 수 있다.
4.4 경량 머신러닝 학습 실험
아래의 표 4는 제안된 데이터 정제 절차와 피처 엔지니어링을 거친 전통적 머신러닝 기반 분류기의 학습 결과를 나타낸다.
표 4의 결과를 보면, XGBoost는 Acc 96.12%, Prec 98.43%, Rec 93.24%, F1 95.76%를 기록하여 가장 우수한 성능을 보였으며, 이는 앞선 대용량 MLP 실험과 비교하더라도 손색없는 정확도이다. SVM(RBF) 역시 Accuracy 95.98%, Precision 98.33%, Recall 93.04%, F1-score 95.61%로 안정적인 성능을 보였고, Random Forest는 Accuracy 94.31%를 기록하였으나 Precision 98.54%와 같이 높은 정밀도를 유지하였다.
또한 언더피팅 가능성을 고려해 2배 크기의 Large-XGboost 실험을 추가로 진행 하였으나 본 연구에서 가장 높은 성능을 보인 XGboost와 큰 차이를 보이지 않았다. 이는 모델의 복잡성을 높이지 않고도 데이터 품질 관리만으로 높은 성능을 달성할 수 있음을 시사한다. 특히, 세 모델 모두 경량 구조임에도 불구하고 90% 이상의 균형 잡힌 성능을 달성하였다는 점은, 본 연구에서 제안한 피처 엔지니어링 및 데이터 정제 절차가 특정 딥러닝 구조에 종속되지 않고 다양한 모델군에 걸쳐 범용적으로 적용 가능함을 실험적으로 입증하는 근거라 할 수 있다.
4.5 경량 머신러닝 추론 속도 검증 결과
아래 표 5는 경량 머신러닝 모델의 실제 온 디바이스 활용 가능성을 평가하기 위해, 제안된 XGBoost 모델과 비교 대상인 RandomForest, SVM에 대해 추론 속도와 파일 크기를 동시에 측정하였다. 이를 위해 각 모델은 joblib 기반의 PKL 형식으로 저장되었으며, 단일 입력 샘플에 대해 100회의 반복 추론을 수행하여 평균 지연 시간(Inference Time(ms))을 산출하였다. 또한, 모델 파일 크기(File Size)를 병행 분석함으로써 추론 효율성과 저장 효율성을 함께 검증하였다.
실험 결과를 보면, XGBoost는 평균 추론 지연 시간이 약 0.3157 ms로 가장 안정적이었으며, 이는 실시간 응용에서 충분히 적합한 수준임을 보여준다. 또한 파일 사이즈 측면에서도 XGBoost(pkl)가 318 KB로 가장 작아, 메모리 제약이 큰 엣지 디바이스 환경에서 특히 유리함을 확인할 수 있었다.
반면, RandomForest는 평균 추론 지연 시간이 30.94 ms로 다소 긴 편이었으며, 파일 크기 또한 5.88 MB로 상대적으로 부담이 큰 것으로 나타났다. SVM(RBF)의 경우 추론 지연 시간은 0.51 ms로 양호했으나, 파일 크기가 1.13 MB로 XGBoost 대비 효율성이 떨어졌다. 또한 Large-XGboost가 두 번째로 용량과 가장 두 번째로 큰 추론시간을 보였다.
이러한 결과는 제안된 경량 XGBoost 모델이 높은 정확도뿐 아니라 저 지연·저용량 특성을 동시에 충족시켜, 낙상 감지와 같은 실시간 센서 처리 응용에 최적화된 해법임을 시사한다.
4.6 기존 기법과 제안 기법 비교
기존 낙상 감지 연구에서는 CNN, LSTM, 또는 하이브리드 구조를 통해 높은 정확도를 달성하였으나 [5][7][11], 이러한 접근은 모델 복잡도와 연산량이 커 실시간 적용에 제약이 있었다. 특히, 이들 연구는 실시간성 검증이나 온 디바이스 메모리 적재 가능성에 대한 정량적 평가 없이, 정확도 중심의 성능 비교에 그친 명백한 한계를 보였다.
반면, 본 연구는 데이터 품질 관리와 경량 모델을 결합하여 기존 연구들이 제시하지 못한 추론 지연 시간과 모델 용량을 모두 계량적으로 검증하였다. 그 결과, 제안된 경량 모델은 높은 정확도(96.12%)를 유지하면서도 선정한 기준 대비 약 70배 빠른 추론 속도와 10배 이상의 저장 효율성을 달성함으로써, 기존 접근법들과는 다른 실용적 가치를 실험적으로 입증하였다. 따라서 제안된 접근은 온 디바이스 추론이 가능한 실질적인 낙상 감지 솔루션으로서의 의의를 지닌다.
Ⅴ. 결론 및 향후 과제
본 연구에서는 노인 및 산업 현장에서 빈번히 발생하는 낙상 문제를 해결하기 위해, 데이터 품질 관리와 특징 엔지니어링을 기반으로 한 경량 머신러닝 모델을 제안하였다. 기존 연구들이 복잡한 딥러닝 구조 고도화에 집중한 것과 달리, 본 연구는 이중 단계 데이터 정제 절차를 통해 노이즈와 불확실성을 제거하고, 단순한 모델 구조에서도 안정적 학습이 가능함을 실험적으로 입증하였다. 제안된 XGBoost 모델은 Accuracy 96.12%, F1-score 95.76%, Recall 93.24%, Precision 98.43%를 기록하여, 대용량 MLP 대비 손색없는 성능을 보였다.
특히 평균 추론 시간 0.3157 ms(≈3,168 Hz), 모델 크기 318.57 KB로, 플래그십 스마트폰의 샘플링 주파수(100–415 Hz)를 크게 상회하여 실시간 처리 가능성을 실험적으로 확인하였다. 이 결과는 복잡한 딥러닝 구조 없이도 데이터 품질 관리만으로 고성능과 실시간성을 동시에 확보할 수 있음을 보여준다. 다만, 본 연구는 워크스테이션 환경에서 평가되었기 때문에 실제 엣지 디바이스 기반 검증이 제한적이라는 한계를 지닌다. 향후 연구에서는 첫째, 연산 일정성이 높은 초경량 딥러닝 모델 설계를 통해 실제 온 디바이스 환경에서도 안정적인 성능을 확보하고자 한다.
결론적으로, 본 연구는 ‘데이터 품질 관리’만으로도 경량 모델이 낙상 감지 시스템의 실시간성과 정확도를 모두 만족시킬 수 있음을 실험적으로 입증하였다. 이는 의료 및 산업 현장에서의 경제적·실용적 낙상 감지 솔루션 개발에 기여할 수 있을 것으로 기대된다.
Acknowledgments
이 논문은 2024학년도 조선대학교 학술연구비의 지원을 받아 연구되었음
This study was supported by research fund from Chosun University, 2024
References
- World Health Organization, "Falls", Geneva: World Health Organization, Apr. 2021. https://www.who.int/news-room/fact-sheets/detail/falls
- Centers for Disease Control and Prevention, "Facts about falls", Atlanta: CDC, May 2024. https://www.cdc.gov/falls/data-research/facts-stats/index.html, .
- U.S. Bureau of Labor Statistics, "TED: The Economics Daily", Fatal falls in the construction industry in 2023, Washington, D.C, U.S. Department of Labor, May 2025 https://www.bls.gov/opub/ted/2025/fatal-falls-in-the-construction-industry-in-2023.htm, .
- S. Bak, "Analysis of the effects of occupational accidents on financial statements such as corporate growth and profitability", Korea Occupational Safety and Health Agency, Nov. 2019. https://oshri.kosha.or.kr/oshri/publication/researchReportSearch.do?mode=download&articleNo=411127&attachNo=232361, .
-
H. H. Kang, M. S. So, D. Kibet, and J.-H. Shin, "Fall Detection Model Using LSTM Architecture: A Video Data-Based Approach", Journal of Korean Society of Industrial and Systems Engineering, Vol. 47, No. 4, pp. 110-119, Dec. 2024.
[https://doi.org/10.11627/jksie.2024.47.4.110]
-
J.-Y. Baik and H.-C. Shin, "Fall detection using fmcw radar to reduce detection errors for the elderly", Journal of Electromagnetic Engineering and Science, Vol. 24, No. 1, pp. 78-88, Jan. 2024.
[https://doi.org/10.26866/jees.2024.1.r.207]
-
Y. Seo, K. S. Jang, and Y. Kim, "Study on Fall Detection by Exploiting Wi-Fi CSI and LSTM-Attention Scheme in Indoors", Journal of The Korean Society of Disaster Information, Vol. 20, No. 4, pp. 935-945, Dec. 2024.
[https://doi.org/10.15683/kosdi.2024.12.31.935]
-
S. Hong, S. Lee, and D. Jeong, "Design and Implementation of a Fall Recognition System Based on 3-Axis Acceleration Data and Altitude Data for Improvement of Fall Recognition Accuracy and Convenience", Journal of Korean Institute of Information Technology, Vol. 18, Np. 1, 115-125, Jan. 2020.
[https://doi.org/10.14801/jkiit.2020.18.1.115]
-
H. B. Lee, C. J. Lee, and J. K. Lee, "Classification of Fall Direction Before Impact Using Machine Learning Based on IMU Raw Signals", Journal of Sensor Science and Technology, Vol. 31, No. 2, pp. 96-101, Mar. 2022.
[https://doi.org/10.46670/JSST.2022.31.2.96]
-
A. Shahzad and K. Kim, "Falldroid: An automated smartphone-based fall detection system using multiple kernel learning", IEEE Transactions on Industrial Informatics, Vol. 15, No. 1, pp. 35-44, May 2018.
[https://doi.org/10.1109/TII.2018.2839749]
-
Z. Li, J. Du, B. Zhu, S. E. Greenwald, L. Xu, Y. Yao, and N. Bao, "Doppler Radar Sensor-Based Fall Detection Using a Convolutional Bidirectional Long Short-Term Memory Model", Sensors, Vol. 24, No. 16, pp. 5365, Aug. 2024.
[https://doi.org/10.3390/s24165365]
-
J.-S. Woo, L. Kyenyeneye, S.-J. Jung, and W.-Y. Chung, "Configuration and Application of a deep learning-based fall detection system", Journal of the Institute of Convergence Signal Processing, Vol. 24, No. 4, pp. 213-220, Dec. 2023.
[https://doi.org/10.23087/jkicsp.2023.24.4.006]
-
Y. K. Kang, H. Y. Kang, and D. S. Weon, "Human Skeleton Keypoints based Fall Detection using GRU", Journal of the Korea Academia-Industrial cooperation Society, Vol. 22, No. 2, pp. 127-133, Feb. 2021.
[https://doi.org/10.5762/KAIS.2021.22.2.127]
-
J. Kim, "Comparative Study on Deep-learning Object Detection Based Recognizing Worker Falls in Underground Utility Tunnels", Journal of the Korea Academia-Industrial, Vol. 25, No. 8, pp. 22-28, Aug. 2024.
[https://doi.org/10.5762/KAIS.2024.25.8.22]
-
S. Park and K. Kim, "Bayesian Onset Measure of sEMG for Fall Prediction", Korea Robotics Society, Vol. 19, No. 2, pp. 213-220, May 2024.
[https://doi.org/10.7746/jkros.2024.19.2.213]
-
M. Straczkiewicz, P. James, and J.-P. Onnela, "A systematic review of smartphone-based human activity recognition methods for health research", NPJ Digital Medicine, Vol. 4, No. 1, Oct. 2021.
[https://doi.org/10.1038/s41746-021-00514-4]
-
P. C. Mahalanobis, "On the generalized distance in statistics", Sankhyā: The Indian Journal of Statistics, Series A (2008-), Vol. 80, pp. S1-S7, Mar. 2018.
[https://doi.org/10.1007/s13171-019-00164-5]
2019 4월 ~ 현재 : 조선대학교 컴퓨터공학과 학사과정
관심 분야 : 딥러닝, AI 아키텍처 설계, 경량 머신러닝
2006년 8월 : 전남대학교 컴퓨터공학과(석사)
2022년 6월 ~ 현재 : ㈜부트캠프 대표이사
2024년 3월 ~현재 : 광주대학교 광·정보 통신학과 박사과정
관심분야 : 디지털헬스케어, 임베디드 S/W
2016년 8월 : 경성대학교 전자공학과(석사)
2021년 2월 : 광주과학기술원(GIST) 전기전자컴퓨터공학과(박사)
2023년 3월 ~ 2024년 5월 : 한국에너지공학대학교 에너지 AI 공학과 연구교수
2024년 9월 ~ 현재 : 조선대학교 컴퓨터공학과 조교수
관심분야 : Smart 헬스케어, localization, tracking




