
재난 피해자 대상 머신러닝기반 PTSD 고위험군 분류 방법 제안
초록
본 연구는 머신러닝기반 분석을 통해 재난 피해자 중 PTSD 고위험군을 분류 방법 제안을 목표로 한다. 재난상황을 고려하여 PTSD 신속진단을 위해 임상시험을 통해 검증된 AI심장카메라를 활용한 비접촉 생체신호 측정과 표준화된 심리 설문을 통합하여 객관적인 분류 체계를 제안하였으며, 머신러닝 모델을 활용하여 PTSD 중증도 분류에 적용하였다. 대상자는 지진경험이 있는 66명에 대해 생체신호와 심리 설문 데이터를 수집하였고, 기존 연구 및 데이터 분석기반 가중치를 부여하여 랜텀포레스트 모델에 적용하였다. 제안된 분류 모델은 85%의 정확도를 보였으며, 재난현장에 적용하기 위한 머신러닝 기반 PTSD 조기 위험탐지가 가능함을 확인하였다.
Abstract
This paper proposes a machine learning-based methodology for classifying high-risk groups of post-traumatic stress disorder (PTSD) among disaster victims. By leveraging a clinically validated AI-based cardiac camera under disaster conditions, non-contact biosignal measurements were integrated with standardized psychological surveys to establish an objective classification framework. This framework was applied to categorize PTSD severity levels via a machine learning model. Data were collected from 66 individuals who had experienced an earthquake, comprising both biosignals and psychological survey responses. A Random Forest model was subsequently employed with weighted features derived from previous studies and data analysis. The proposed classification model achieved an accuracy of 85%, demonstrating the feasibility of early PTSD risk detection through machine learning in real-world disaster scenarios.
Keywords:
machine learning, PTSD classification, high-risk group, disaster victims, biosignal analysis, random forestⅠ. 서 론
재난 발생후 외상 후 스트레스 장애(PTSD, Post Traumatic Stress Disorder)는 피해자의 정신적·신체적 건강을 심각하게 훼손하며, 치료 지연 시 우울증, 불안장애등 2차 질환으로의 전이 위험이 높다[1]. 특히 재난 현장에서는 고위험군을 신속하게 식별하는 것이 증상 악화 방지와 사회적 비용 절감을 위한 핵심 과제로 대두되고 있다. 그러나 기존 PTSD 진단 방식은 주관적인 설문에 의존하고 있어 객관성이 부족하며, 재난 유형이나 인구통계학적 특성(연령, 성별 등)을 반영한 맞춤형 분류 체계가 미흡하다[2].
이에 본 연구는 재난현장에서 PTSD 신속진단을 위해 비접촉 생체신호와 심리 설문 데이터를 융합한 과학적 분류 가이드라인을 개발하고, 머신러닝 모델을 통해 그 임상적 유효성을 검증하고자 한다.
생체신호 분석은 PTSD 평가에서 객관성을 확보할 수 있는 핵심 도구로 주목받고 있다. 최근 연구에서는 ECG(Electrocardiogram) 기반 신호 분석이 우울증 및 불안장애 예측에 효과적이라는 결과가 보고되었으며[3], HRV(Heart Rate Variability)는 자율신경계의 균형 상태를 반영하는 지표로 활용된다. PTSD 환자에서는 교감신경계(SNS)의 과활성화와 부교감신경계(PNS) 기능 저하가 자주 관찰된다[4]. 또한, IES-R-K와 PHQ-9 같은 표준화된 심리 설문은 트라우마 강도와 우울 수준을 정량적으로 평가하는 데 유용하다[5]. 해외 연구에 따르면, 재난 유형에 따라 PTSD 발병 위험도가 상이하게 나타나며, 여성과 청소년에서 고위험군 비율이 유의미하게 높은 것으로 보고되었다[6]. HRV가 PTSD 환자에서 유의미하게 낮다는 연구 결과는 자율신경계 불균형이 주요 생체신호로 기능함을 시사한다[7]. 본 연구는 지진경험대상자를 중심으로 측정한 비첩촉 HRV 측정 데이터와 표준설문도구 데이터를 토대로 PTSD 중등도 위험군 분류하였으며, 실증으로 확보된 데이터의 규모를 고려하여 랜덤포레스트 모델을 적용한 결과, 높은 예측 성능을 확인하였다.
Ⅱ. 데이터 수집 및 분석
2.1 대상자 선정 및 데이터 수집
포항지진트라우마센터에 등록된 성인 66명(남성 32명, 여성 34명)을 대상으로 2024년 8월부터 9월까지 5일간 데이터를 수집하였다. 생체신호측정을 위해 메디코아 SA-3000p를 통해 획득한 2,101건의 임상데이터와 검증을 완료한 LSTM(Long Short-Term Memory)기반 AI 심장카메라(그림 1)를 활용하였으며, 3분간의 비접촉 방식으로 HRV(심박변이도), LF/HF 비율, 평균 심박수를 기록하였다. 심리 상태 평가는 PHQ-9(우울), GAD-7(불안), IES-R-K(트라우마), PSS(스트레스) 표준화 설문지를 통해 수행되었다.
2.2 데이터 전처리 및 분석
데이터 정규화를 통한 분석을 위해 모든생체지표를 0~9점 척도로 MinMaxScaler 하였으며, 중등도 점수 산출을 위해 표준화된 생체지표의 평균값을PTSD 중등도 점수로 정의하였다.
AI 심장카메라를 통해 측정된 PPG(Photoplethysmography)값에 대한 HRV 데이터(ANS(Autonomic Nervous System) Activity, PNS Activity, SNS Activity, ANS Balance, HRV Index, Hear Rate, Size Determination Value, Stress Size Determination Value) 지표 데이터 분석와 표준화 설문지 데이터에 대해 PTSD와의 상관관계 분석을 위해 각각의 low data간 Heatmap(그림 2)분석하여 HRV 지표 및 설문지에 대한 가중치를 부여하였다.
표준화 설문지의 경우, 문항수 및 중등도 분류에 따른 10점 척도 기준 통일하고 선행연구결과와 참조하여 가중치 적절성을 검토하였다.
데이터분석 결과, 자율신경계 활성도(ANS activity)와 심박변이도 지수(HRV Index) 간에 높은 양의 상관관계가 확인되었다. 이는 자율신경계 총활동 및 심박변이성이 PTSD 환자의 생리적 상태를 평가하는 데 중요한 역할을 한다는 기존 연구 결과와 일치하는 것으로 나타났다.
또한, 자율신경계 지표(ANS activity, HRV Index)와 PTSD 간의 주요 관계가 기존 연구에서 보고된 바와 동일하게 나타났으며, 스트레스 수치와 교감신경계 활동(SNS activity) 간에도 강한 연관성이 확인되었다. 이러한 결과는 교감신경계 활성화가 PTSD 환자의 스트레스 반응과 밀접하게 연결되어 있음을 시사한다.
아울러, 부교감신경계(PNS)와 교감신경계(SNS) 간의 상호작용 분석을 통해 PTSD 환자에서 자율신경계 균형이 붕괴되는 경향이 관찰되었다. 이는 PTSD가 자율신경계의 조절 기능에 미치는 영향을 반영하는 결과로, PTSD 환자의 생리적 특성을 보다 정밀하게 평가하는 데 있어 ANS 및 HRV 지표의 활용 가능성을 시사한다.
본 연구는 이러한 결과를 바탕으로 자율신경계 및 심박변이도 지표를 PTSD 진단 및 예측 모델에 적용할 필요성을 제시하며, 향후 이를 활용한 PTSD 조기 선별 및 치료 효과 평가 연구가 지속적으로 이루어질 필요가 있음을 강조한다.
Ⅲ. PTSD 고위험군 예측 모델 개발 및 평가
본 연구에서는 임상을 통한 데이터 확보수가 제한적임을 감안하여 랜덤포레스트 모델을 활용하여 PTSD의 중증도를 분류하는 실험을 수행하였으며, 모델의 성능을 평가하였다. 데이터는 train data과 test data을 7:3의 비율로 적용하였으며, 데이터 불균형을 고려하여 Stratified Sampling방법을 적용하였다. 실험 결과, 모델의 전체적인 정확도(Accuracy)는 85%로 양호한 수준을 보였으며, 클래스별 성능 분석 결과 표 1과 같은 특징을 발견할 수 있었다.
경증(Mild) 환자의 경우, Precision(정밀도)은 100%, Recall(재현율)은 86%로 나타나 높은 정확성을 보였으나 일부 사례를 놓치는 경향이 확인되었다. 중등증(Moderate) 환자의 경우, Recall이 100%로 모든 중등증 사례를 감지하였으나, Precision은 77%로 낮게 나타나것으로 분석되었다. 중증(Severe) 환자의 경우, Precision은 100%로 해당 클래스로 예측된 사례는 정확하였으나, Recall이 33%로 나타나 전체 중증 환자 중 33%만 올바르게 감지되는 문제점이 확인되었다.
모델의 Macro 평균 성능을 분석한 결과, Precision(92%)은 높게 나타났으나, Recall(73%)이 상대적으로 낮아 일부 클래스를 놓치는 경향이 확인되었다. 특히 F1-score(76%)는 모델의 전반적인 성능을 평가하는 종합적인 지표로, 평균적으로 보통 수준의 성능을 보였다.
Ⅳ. 결론 및 향후 연구 방향
본 연구의 결과를 바탕으로, 중증(Severe) 환자의 Recall(33%)이 낮아 해당 클래스의 예측 성능 개선이 필요하며, 중등증(Moderate) 환자의 경우 Precision(77%)을 향상시키기 위한 추가적인 특징 선택 및 모델 튜닝이 필요함을 확인할 수 있었다. 이는 좀 더 많은 대상자확보를 통한 정확도 향상 및 코호트 구축을 통한 지속적 데이터 축적을 통한 정밀성 향상이 필요함을 확인할 수 있었다.
본 연구에서 제안한 방법은 비접촉 생체신호 측정을 통해 재난 발생 직후 PTSD 고위험군을 식별할 수 있어 상담 자원의 효율적 배분에 기여할 것으로 기대된다. 예를 들어, 포항지진 사례에서 검증된 모델은 화재, 범죄, 산업재해 등 다양한 재난 유형으로의 확장 적용이 가능하다. 그러나 인적 재난 피해자 및 아동 데이터의 부재로 모델의 일반화 성능에 한계가 존재하며, 향후 해당 집단을 포함한 데이터 수집이 필요하다. 또한 중증 PTSD 환자의 분류 정확도 향상을 위해 축적된 데이터를 활용한 딥러닝 모델의 최적화와 다중 생체신호(뇌파, 호흡 패턴)의 통합 분석 및 비대면에 적합한 비접촉식 생체신호측정방식 적용[8]에 대한 연구를 진행할 계획이다.
Acknowledgments
This work was supported by Korea Planning & Evaluation Institute of Industrial Technology funded by the Ministry of the Interior and Safety (MOIS, Korea) (grant number 20025207)
References
-
J. H. Jhone and S. K. Lee, "A Study on the Typology of Mental Health Issues among Disaster Victims and Their Transferring Influential Factors", Health and Social Welfare Review, Vol. 44, No. 1, pp. 121-140, Mar. 2024.
[https://doi.org/10.15709/hswr.2024.44.1.121]
-
F. Ge, Y. Li, M. Yuan, J. Zhang, and W. Zhang, "Identifying predictors of probable posttraumatic stress disorder in children and adolescents with earthquake exposure: A longitudinal study using a machine learning approach", Journal of Affective Disorders, Vol. 264, pp. 483-493, Jan. 2020.
[https://doi.org/10.1016/j.jad.2019.11.079]
-
R. Sharma and H. K. Meena, "Chapter 5 - Machine learning-based prediction of depression and anxiety using ECG signals", In Signal Processing Driven Machine Learning Techniques for Cardiovascular Data Processing, pp. 65-80, 2024.
[https://doi.org/10.1016/B978-0-44-314141-6.00010-4]
-
A. Chatterjee, M. A. Riegler, and K. Ganesh, "Stress management with HRV following AI, semantic ontology, genetic algorithm and tree explainer", Scientific Reports, Vol. 15, No. 5755, Feb. 2025.
[https://doi.org/10.1038/s41598-025-87510-w]
-
K. Kroenke, R. L. Spitzer, and J. B. Williams, "The PHQ-9: Validity of a brief depression severity measure", Journal of General Internal Medicine, Vol. 16, No. 9, pp. 606-613, Sep. 2001.
[https://doi.org/10.1046/j.1525-1497.2001.016009606.x]
-
Y. Neria, A. Nandi, and S. Galea, "Longitudinal study of PTSD and depression after 9/11", American Journal of Psychiatry, Vol. 167, No. 6, pp. 676-684, 2010.
[https://doi.org/10.1176/appi.ajp.2010.09080896]
-
J. E. Park, J. Y. Lee, S. H. Kang, J. H. Choi, T. Y. Kim, H. S. So, and I.-Y. Yoon, "Heart rate variability of chronic posttraumatic stress disorder in the Korean veterans", Psychiatry Research, Vol. 255, pp. 72-77, May 2017.
[https://doi.org/10.1016/j.psychres.2017.05.011]
- S. Y. An, J. J. Lee, and B. R. Cha, "Draft Design of monitoring system based on UWB sensor for non-contact respiration measurement", Proc. 2023 KIIT Summer Conf., Jeju, Korea, pp. 217-220, Jun. 2023.