
관찰 시간 및 추정 간격에 따른 rPPG 기반 혈압 추정 성능 분석
초록
본 연구는 Leipzig University Hospital에서 구축한 영상 기반 rPPG–혈압 데이터셋을 이용해, 영상에서 얻은 맥파 신호만으로 혈압을 추정하는 방법을 평가한다. rPPG 원신호와 그 1차 및 2차 미분으로부터 파형과 시간 구조를 요약하는 52개 특징을 추출하고 정규화한 뒤, 연속된 rPPG를 일정 시간 길이의 관찰 구간으로 묶어 순환신경망의 입력으로 사용한다. 이때 한 번의 혈압 값을 산출할 때 포함되는 관찰 시간과 혈압 추정 주기를 체계적으로 변화시키면서 추정 성능을 비교한다. 실험 결과, 관찰 시간이 충분히 길고 추정 주기가 지나치게 짧지 않을 때 평균 절대 오차가 감소하고 실제 혈압과의 상관계수가 증가하며, 관찰 시간과 추정 간격의 설계만으로도 rPPG 기반 추정과 접촉식 PPG 기반 추정 사이의 성능 차이를 의미 있게 줄일 수 있음을 확인한다.
Abstract
This study evaluates blood pressure estimation using an rPPG–blood pressure dataset collected at Leipzig University Hospital. We derive 52 features capturing waveform shape and temporal structure from the raw rPPG signal and its first and second derivatives. After normalization, the features are organized into fixed-length observation windows that serve as inputs to a recurrent neural network. By systematically varying the observation window length and the interval between successive blood pressure estimates, we examine how this temporal design affects performance. The results show that sufficiently long windows and not overly frequent update intervals yield lower MAE and higher correlation with reference blood pressure. They also indicate that tuning these temporal settings alone can substantially reduce the performance gap between rPPG-based and contact PPG-based estimation.
Keywords:
remote photoplethysmography, blood pressure, long short-term memory, time step, strideⅠ. 서 론
혈압은 심혈관계 질환의 조기 발견과 만성 질환 관리를 위한 핵심 지표다[1]. 현재 임상 표준인 커프 기반 측정은 간헐적이며 수동적인 절차에 의존해, 착용 불편과 활동 제약 탓에 수면, 운동, 일상 활동에서 연속 관측이 어렵다. 이에 따라 비접촉 방식으로 연속적인 혈압 추정이 가능하면서 일상 환경에 적용 가능한 대안이 요구되며, 이러한 방향의 알고리즘 연구가 활발하게 진행되고 있다[2].
광용적맥파(PPG, Photoplethysmography)는 피부 반사광 변화를 통해 말초 혈류를 측정하는 기술로, 이를 이용한 혈압 추정 기법이 활발히 개발되고 있다[3]. 선행 연구는 PPG 파형의 형태학적 지표와 파생 지표를 체계화한 특징을 구성하고, 이를 장단기 메모리 순환신경망(LSTM, Long Short-Term Memory)에 입력해 혈압을 추정하였다[4]. 다만 PPG는 구조적으로 접촉 기반이어서 장시간 및 자유 활동 상황의 완전한 비부착 모니터링에는 제약이 남는다.
이를 보완하기 위해 최근에는 원격 광용적맥파 (rPPG, remote Photoplethysmography)가 대안으로 부상하고 있다. 카메라 영상에서 얼굴색 변화를 이용해 혈류 신호를 복원하는 방식으로, 착용 부담을 최소화한다[5]. 그러나 rPPG로 직접 혈압을 추정한 연구는 아직 많지 않으며 PPG에서 쓰이던 특징과 LSTM 모델을 rPPG에 적용했을 때의 성능 변화와 설계 고려사항도 충분히 보고되지 않았다.
이에 본 연구는 rPPG 신호로부터 일관된 기준으로 정의한 특징 집합을 구성하고 이를 LSTM 기반 모델에 입력하여 혈압을 추정한다. 특징 정의와 모델 구조는 rPPG 데이터의 잡음 특성과 분포를 고려해 간결성과 일관성을 우선해 설계하였으며, 접촉식 PPG 기반 결과를 참조선으로 두어 센서 방식 차이에 따른 성능 수준을 비교한다. 이러한 구성을 통해 rPPG에서의 특징 적합성과 모델 유효성을 평가하고, 영상 기반 혈압 모니터링에 적용 가능 여부를 검토한다.
또한 rPPG를 이용해 혈압을 연속적으로 추정하려면 시간 축을 어떻게 설계할지도 중요하다. 한 번의 혈압을 추정할 때 참고하는 관찰 시간과 연속된 두 혈압 추정 사이의 시간 간격, 즉 혈압 값을 얼마나 자주 산출할지를 결정하는 혈압 추정 주기는 영상 기반 혈압 모니터링에서 핵심적인 설계 요소다. 본 연구에서는 이 관찰 시간과 혈압 추정 주기를 체계적으로 변화시키며 rPPG 기반 혈압 추정 성능이 어떻게 달라지는지 분석한다.
Ⅱ. 관련 연구
PPG 신호를 이용한 혈압 추정 연구에서는 파형의 형태학적 특징과 파생 지표를 시계열 입력으로 구성하고, 순환신경망 기반 모델을 통해 혈압을 추정하는 접근이 제안되어 왔다[4]. 다만 이러한 접근은 접촉식 신호에 기반한다는 한계를 가진다.
이러한 한계를 보완하기 위해 얼굴 영상으로부터 rPPG 신호를 추출한 뒤 딥러닝 모델을 적용해 혈압을 추정하는 연구가 제안되었으며, PPG 데이터로 학습한 모델을 rPPG 신호로 전이하여 성능을 보완하는 접근도 보고되었다[6]. 한편, 시계열 내 중요한 정보를 강조하기 위해 Self-Attention 구조를 포함하는 Transformer 모델을 PPG 기반 혈압 추정에 적용한 연구가 제안되었으며, 이를 통해 장기 및 단기 시간 의존성을 효과적으로 학습할 수 있음이 보고되었다[7]. 또한 rPPG 신호를 입력으로 하는 딥러닝 기반 혈압 추정 연구를 통해 비접촉 조건에서도 혈압 추정 가능성이 검토되었다[8][9].
그러나 기존 연구들은 주로 특징 정의나 모델 구조에 초점을 두고 있으며, rPPG 기반 혈압 추정에서 관찰 시간의 길이와 연속된 혈압 추정 간격과 같은 입력 시계열 구성 요소가 성능에 미치는 영향을 체계적으로 분석한 연구는 제한적이다. 본 연구는 rPPG 시계열의 관찰 시간과 혈압 추정 주기를 주요 설계 변수로 설정하고, 이들이 혈압 추정 성능에 미치는 영향을 정량적으로 분석한다는 점에서 기존 연구와 차별성을 갖는다.
Ⅲ. 방 법
3.1 데이터셋 및 신호 처리
본 연구에서는 Leipzig University Hospital에서 수집된 rPPG 신호 데이터셋을 사용한다[10]. 해당 데이터셋은 이마와 뺨 ROI를 32 fps RGB로 약 2시간 동안 촬영한 환자 영상으로부터 POS (Plane-Orthogonal-to-Skin) 알고리즘[11]을 적용해 rPPG를 추출하였고, 같은 구간의 수축기 혈압(SBP, Systolic Blood Pressure)과 이완기 혈압(DBP, Diastolic Blood Pressure)의 ground truth가 제공되었다. 선행 연구[10]에서는 rPPG 신호에 대해 0.5–8.0 Hz 대역의 4차 Butterworth band-pass filter를 적용하고, SNR(Signal-to-Noise Ratio)가 −7 dB 미만인 구간을 제거하여 총 17명의 피험자 데이터를 구성하였다. 본 연구에서는 해당 전처리가 완료된 데이터를 기반으로 추가 분석을 수행한다.
이후 촬영 환경, ROI, 피부 반사도 차이에 따른 진폭 편차를 줄이기 위해 rPPG 신호를 pulse 단위로 min–max 정규화한다. 각 pulse를 [0, 1] 범위로 선형 변환하여 특징 계산과 LSTM 학습에 사용한다. 또한 생리학적으로 유효한 혈압 범위만을 분석에 포함하기 위해 SBP가 80–180 mmHg, DBP가 60–130 mmHg 범위를 벗어나는 표본을 제외한다. 이러한 기준을 적용한 결과, 최종적으로 11명의 피험자 데이터가 본 연구의 분석에 사용되었다.
3.2 52개 rPPG 기반 특징 추출 절차
본 연구는 rPPG 신호에 대해 PPG 문헌의 정의를 참고해 총 52개 특징을 구성한다[4]. 구체적으로, min–max 정규화를 거친 원신호에서 파형 형상, 시간 구간, 면적 관련 34개를 계산하고, 변화율 정보를 반영하기 위해 1차 미분에서 5개, 2차 미분에서 13개를 추가한다. 각 특징의 정의와 분류는 표 1에, 추출 기준이 되는 파형 예시는 그림 1에 제시한다. 산출된 52개 특징 벡터는 피험자와 구간 간 스케일 편차를 줄이기 위해 한 차례 추가 min-max 정규화한 뒤, 시계열 입력 구성 과정을 거쳐 LSTM 모델의 입력으로 사용한다.
3.3 시계열 입력 구성
rPPG에서 계산한 52개 특징은 시간 축을 따라 배열된 2차원 데이터이므로, 본 연구에서는 sliding window를 적용해 연속된 구간을 잘라 시계열 입력을 구성하고, 이를 LSTM 기반 시계열 모델에서 일반적으로 사용하는 batch × time step × feature 형태로 표현한다[12]. 각 입력 sequence는 연속된 time step 프레임으로 이루어진 구간이며, 다음 sequence는 시간 축을 따라 stride 프레임만큼 이동한 위치에서 동일한 길이로 잘라 생성한다. 이때 서론에서 언급한 관찰 시간은 곧 입력 sequence 길이를 정하는 time step이고, 혈압 추정 주기는 데이터 준비 단계에서 설정한 stride, 즉 두 sequence 사이의 프레임 이동량이다.
본 실험에서는 time step 20과 40 두 조건을 두고, 각 조건에서 stride를 1에서 time step까지 여러 값으로 변화시키며 총 11가지 조합에 대해 성능을 평가한다. stride 설정에 따라 입력 구간 간 중첩률이 달라지며, 예를 들어 time step이 20일 때 stride가 1인 경우 약 95%의 중첩률을 가지는 반면, stride가 5와 10인 경우 각각 약 75%와 50%의 중첩률을 갖는다. 이러한 설정은 입력 구간 간 중첩률과 학습에 사용되는 sequence 개수가 동시에 변하도록 하여, 시계열 구성 방식이 rPPG 기반 LSTM 모델의 추정 정확도에 얼마나 민감한지를 확인할 수 있다. 그림 2는 연속된 특징 벡터에서 time step과 stride를 적용하여 sliding window 형태의 입력 sequence를 구성하는 과정을 개략적으로 나타낸 것이다.
3.4 LSTM 기반 혈압 추정 구조
시간 축으로 정렬한 rPPG 특징을 입력으로 받아 LSTM 기반 신경망으로 SBP와 DBP를 추정한다. Bidirectional LSTM (BiLSTM) 층이 정방향과 역방향으로 sequence를 처리해 rPPG의 과거와 미래 정보를 반영하도록 하며, 은닉 크기는 각 방향 512로 설정한다. 이어 단방향 LSTM 3개를 512 → 216 → 128 unit으로 쌓아 점진적으로 차원을 축소하고, 각 층 뒤에 dropout 0.3을 적용해 과적합을 완화한다. LSTM 스택 출력은 전체 시점을 단순 평균하지 않고, 시점별 기여 차이를 반영하기 위해 Attention 층으로 전달한다. Attention은 각 시점 hidden state에 점수를 부여하고 softmax로 정규화한 가중치로 중요 시점을 강조해 context 벡터를 생성한다. 이를 Dense(64, sigmoid)로 한 번 더 특징화한 뒤, 최종 Dense(2, sigmoid)에서 SBP와 DBP를 동시에 출력한다. 네트워크의 전체 구조는 그림 3에 제시한다.
모든 time step–stride 실험 조건에서 네트워크 구조와 학습 설정은 동일하게 유지한다. optimizer는 Adam, 손실함수는 MSE, 배치 크기는 8, 최대 epoch는 300으로 두고, 검증 손실이 일정 비율 이상 악화되는 경우 학습을 조기 종료하는 과적합 감지 callback을 적용한다. 이를 통해 시계열 구성과 센서 조건에 따른 차이를 구조적 요인과 분리하여 비교할 수 있도록 한다.
Ⅳ. 실험 및 결과
4.1 실험 방법
모델 학습과 평가는 피험자 단위로 분리하여 수행한다. 각 피험자의 rPPG 특징 시계열 전체를 시간 축 기준으로 동일한 길이의 20개 블록으로 나눈 뒤, 블록 인덱스를 무작위로 섞어 2개는 검증용, 2개는 테스트용, 나머지 16개는 학습용으로 배정한다. 이후 같은 용도로 배정된 블록들 중에서 번호가 연속된 것끼리를 하나의 시계열 segment로 묶어 시간적 연속성을 유지하며, 각 segment에 대해 앞서 설정한 time step–stride 조합에 따라 sliding window를 적용하여 LSTM 입력 sequence를 생성한다. 이때 학습, 검증, 테스트 segment 사이에는 입력 구간이 겹치지 않도록 구성하여 데이터 누수를 방지한다. 각 stride 설정에 대해 상이한 데이터 분할을 기반으로 모델 학습과 평가를 총 5회 반복 수행하며, 결과 분석에서는 반복 실험에서 산출된 성능 지표의 평균값을 사용한다. 한편 PPG는 선행 연구[4]에서 보고된 시계열 설정과 네트워크 구조를 기준선으로 사용하고, time step과 stride 조합을 달리하는 민감도 분석은 rPPG에 대해서만 수행한다.
성능 평가는 SBP와 DBP 각각에 대해 평균절대오차(MAE, Mean Absolute Error)를 기본 지표로 사용하고, 성능 지표의 변동성을 평가하기 위해 반복 실험에서 산출된 MAE에 대해 95% 신뢰구간(CI, Confidence Interval)을 계산한다. 추가로 추정 오차의 분산을 보기 위해 표준편차(SD, Standard Deviation)를 함께 계산하고, 참값과 추정값의 선형적 일치도를 확인하기 위해 피어슨 상관계수(R, Pearson’s correlation coefficient)도 산출한다.
4.2 rPPG 시계열 구성에 따른 결과
표 2와 표 3은 각각 time step = 20과 time step = 40에서 stride를 변화시켰을 때의 BP 추정 성능을 정리한 것이다. time step = 20의 경우 stride = 1에서 SBP와 DBP 모두 가장 낮은 평균 MAE와 높은 R 값을 보여 전반적으로 우수한 성능을 나타낸다. 이때 95% CI는 평균 MAE 해석에 무리가 없는 범위에 분포하여, 작은 stride 조건에서의 성능 경향이 반복 실험 전반에서 일관되게 유지됨을 확인할 수 있다. stride가 증가함에 따라 MAE와 SD가 전반적으로 증가하고 R이 감소하는 경향을 보인다.
time step = 40의 경우에도 작은 stride에서 우수한 성능이 나타난다. stride = 1은 SBP에 대해 가장 낮은 MAE와 가장 높은 R을 보이고, stride = 5는 DBP에서 가장 낮은 MAE와 양호한 R을 기록한다. 이들 조건에서도 95% CI는 평균 성능 해석을 저해할 정도로 과도하게 확장되지 않았다. 반면 stride가 20 이상으로 커지면 SBP와 DBP 모두에서 MAE 증가와 R 감소가 뚜렷해져, 과도한 간격 설정이 시간 정보 손실 및 성능 저하로 이어지는 경향을 보인다.
두 time step 조건을 비교하면, 최적 조합 기준으로 time step = 40이 time step = 20보다 전반적으로 더 우수한 성능을 보인다. 이는 더 긴 시계열 입력이 rPPG 신호의 박동 간 변동과 저주파 및 고주파 성분을 충분히 포함하여, LSTM이 시간적 문맥을 보다 효과적으로 학습할 수 있게 했기 때문으로 해석된다.
4.3 기존 PPG와 rPPG 최적 조합 비교 결과
표 4는 PPG 기반 선행 연구에서 보고된 결과와, 본 연구에서 rPPG에 대해 가장 우수했던 time step–stride 조합을 나란히 비교한 것이다. PPG는 선행 연구[4]의 고정된 시계열 설정을 기준선으로 사용하고, rPPG는 time step과 stride를 조합해 얻은 최적 설정을 사용하여, 동일한 52개 특징 체계와 유사한 LSTM 기반 혈압 추정 모델 구조하에서 두 센서 방식을 비교한다. SBP의 경우 PPG가 더 높은 R을 보이는 반면 rPPG는 MAE와 SD에서 더 낮은 값을 보여 일부 설정에서 절대 오차 측면의 경쟁 가능성을 보인다. DBP에서도 rPPG가 MAE와 SD는 더 낮게 나타났으나, R은 PPG보다 다소 낮아 상관 구조 측면에서 차이가 관찰된다. 다만 두 결과는 서로 다른 데이터 분할과 실험 조건에서 도출된 값이므로, 표 4의 비교는 동일 조건 하의 직접적인 성능 비교라기보다는 rPPG 기반 접근이 접촉식 PPG 기반 방법의 성능 수준에 어느 정도 근접할 수 있는지를 참고적으로 보여주는 데 그 의미가 있다.
Ⅴ. 결론 및 향후 과제
본 연구는 접촉식 PPG 연구에서 제안된 52개 파형 특징 체계를 공통 특징 틀로 삼아 rPPG 신호에도 적용하고, 모델 구조를 고정한 상태에서 관찰 시간과 혈압 추정 주기의 조합을 달리해 시계열 구성 방식이 혈압 추정 성능에 미치는 영향을 분석하였다. 그 결과 충분히 긴 관찰 시간과 지나치게 크지 않은 혈압 추정 주기를 사용할 때 SBP와 DBP의 MAE가 감소하고 상관계수가 개선되는 경향을 보여, rPPG에서도 시계열 설계만으로 성능을 효과적으로 향상시킬 수 있음을 확인하였다. 일부 조건에서는 rPPG가 접촉식 PPG와 비교해 MAE와 SD 측면에서 유사한 수준을 보였으나, 상관 구조와 데이터 규모, 센서 특성을 고려하면 여전히 격차가 남아 있고 결과 해석에도 주의가 필요하였다. 특히 표본 수가 적고 사전 전처리가 이루어진 단일 공개 rPPG 데이터셋을 사용했으며 PPG 기준선과 관찰 시간 및 혈압 추정 주기 설정이 일치하지 않는 한계가 있으므로, 향후에는 더 다양한 rPPG 데이터와 rPPG 특화 특징, 시계열 전략, 실시간 적용을 고려한 모델 구조를 폭넓게 검증하는 연구가 필요하다.
Acknowledgments
본 결과물은 2025년도 경상북도 지역혁신중심 대학지원체계 (RISE)-(특화산업 Scale-up)의 지원을 받아 수행된 결과입니다(2025-RISE-B0080529002321)
References
-
B. Williams, et al., "2018 Practice Guidelines for the management of arterial hypertension of the European Society of Cardiology and the European Society of Hypertension", Blood pressure, Vol. 27, No. 6, pp. 314-340, Sep. 2018.
[https://doi.org/10.1080/08037051.2018.1527177]
-
M. Kachuee, M. M. Kiani, H. Mohammadzade, and M. Shabany, "Cuffless blood pressure estimation algorithms for continuous health-care monitoring", IEEE Transactions on Biomedical Engineering, Vol. 64, No. 4, pp. 859-869, Jun. 2016.
[https://doi.org/10.1109/TBME.2016.2580904]
-
S. S. Mousavi, M. Firouzmand, M. Charmi, M. Hemmati, M. Moghadam, and Y. Ghorbani, "Blood pressure estimation from appropriate and inappropriate PPG signals using A whole-based method", Biomedical Signal Processing and Control, Vol. 47, pp. 196-206, May. 2019.
[https://doi.org/10.1016/j.bspc.2018.08.022]
-
C. El-Hajj and P. A. Kyriacou, "Cuffless blood pressure estimation from PPG signals and its derivatives using deep learning models", Biomedical Signal Processing and Control, Vol. 70, pp. 102984, Sep. 2021.
[https://doi.org/10.1016/j.bspc.2021.102984]
-
W. Verkruysse, L. O. Svaasand, and J. S. Nelson, "Remote plethysmographic imaging using ambient light", Optics express, Vol. 16, No. 26, pp. 21434-21445, Dec. 2008.
[https://doi.org/10.1364/OE.16.021434]
-
C.-H. Cheng, J. W. Chin, K. L. Wong, T. T. Chan, H. C. Lo, K. L. Pang, R. So, and B. Yan, "Remote blood pressure estimation from facial videos using transfer learning: Leveraging PPG to rPPG conversion", Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), Waikoloa, HI, USA, pp. 4225-4236, Jan. 2025.
[https://doi.org/10.1109/WACV61041.2025.00415]
-
Z. Tian, A. Liu, G. Zhu, and X. Chen, "A paralleled CNN and Transformer network for PPG-based cuff-less blood pressure estimation", Biomedical Signal Processing and Control, Vol. 99, pp. 106741, Jan. 2025.
[https://doi.org/10.1016/j.bspc.2024.106741]
- W. Liu, Y. Zhang, X. Wang, and J. Liu, "Ensemble deep learning for blood pressure estimation using facial videos", The 3rd Vision-based Remote Physiological Signal Sensing (RePSS) Challenge & Workshop, 2024, pp. 1-10, Sep. 2022. https://ceur-ws.org/Vol-3750/paper6.pdf, .
-
S.-A. Park, H.-C. Lee, C.-W. Jung, and H.-L. Yang, "Attention mechanisms for physiological signal deep learning: Which attention should we take?", Proc. Int. Conf. on Medical Image Computing and Computer-Assisted Intervention (MICCAI), Singapore, pp. 613-622, Sep. 2022.
[https://doi.org/10.1007/978-3-031-16431-6_58]
-
F. Schrumpf, P. Frenzel, C. Aust, G. Osterhoff, and M. Fuchs, "Assessment of deep learning based blood pressure prediction from PPG and rPPG signals", Proc. of the IEEE/CVF conference on computer vision and pattern recognition, Online, pp. 3820-3830, Jun. 2021.
[https://doi.org/10.48550/arXiv.2104.09313]
-
W. Wang, A. C. Den Brinker, S. Stuijk, and G. De Haan, "Algorithmic principles of remote PPG", IEEE Transactions on Biomedical Engineering, Vol. 64, No. 7, pp. 1479-1491, Sep. 2016.
[https://doi.org/10.1109/TBME.2016.2609282]
-
S. Hochreiter and J. Schmidhuber, "Long short-term memory", Neural computation, Vol. 9, No. 8, pp. 1735-1780, Nov. 1997.
[https://doi.org/10.1162/neco.1997.9.8.1735]
2020년 3월 ~ 현재 : 영남대학교 전자공학과 학부과정
관심분야 : 생체의공학, 딥러닝, 의료인공지능
2010년 8월 : 포항공과대학교 전자전기공학과(공학사)
2017년 8월 : 포항공과대학교 전자전기공학과(공학박사)
2017년 9월 ~ 2019년 8월 : 삼성전자 생산기술연구소 책임연구원
2019년 9월 ~ 2025년 8월 : 영남대학교 전자공학과 조교수
2025년 9월 ~ 현재 : 영남대학교 전자공학과 부교수
관심분야 : 강인제어, 강화학습




