[ Article ]

The Journal of Korean Institute of Information Technology - Vol. 24, No. 4, pp.173-181

ISSN: 1598-8619 (Print) 2093-7571 (Online)

Print publication date 30 Apr 2026

Received 21 Jan 2026 Revised 20 Feb 2026 Accepted 23 Feb 2026

DOI: https://doi.org/10.14801/jkiit.2026.24.4.173

ResNet 구조를 이용한 심전도 신호의 다차원 분석과 이를 성별 분류에 적용한 연구

문승현^*

; 백승민^*

; 박은상^**

; 반성범^**

*조선대학교 전자공학과
**조선대학교 IT연구소(공동교신저자)

Multi-Dimensional ECG Analysis using a ResNet and Its Application to Gender Classification

Seung Hyun Moon^*

; Seung Min Baek^*

; Bak EunSang^**

; Sungbum Pan^**

Correspondence to: Sung Bum Pan Research Institute of IT, Chosun university, Dong-Gu, Gwangju 61452 South Korea Tel.: +82-62-230-6897, Email sbpan@chosun.ac.kr Correspondence to: Bak EunSang Research Institute of IT, Chosun university, Dong-Gu, Gwangju 61452 Tel.: +82-62-230-7855, Email bakeunsang@chosun.ac.kr

초록

본 논문에서는 심전도(ECG) 신호의 1차원 시계열 정보, GAF(Gramian Angular Field) 변환을 통한 2차원 이미지 정보, 그리고 생리학적 기하학적 특징 벡터를 결합한 통합 딥러닝 시스템을 제안하였다. 제안하는 시스템은 1D ResNet으로 시간적 흐름을 학습하고, GAF로 변환된 2D 이미지를 2D ResNet에 적용하였으며, 여기에 PQRST 특징점 기반의 기하학적 벡터를 추가로 결합하여 세 가지 모듈로 구성된다. 이러한 다차원 설계는 신호의 표현력을 극대화하였고 그 효과를 확인하기 위해 공개 데이터셋인 ECG-ID, 자체 데이터셋인 CSU_DB를 활용하여 성별 분류 실험을 수행하였다. 실험 결과, 제안 시스템은 각 데이터셋에 대해 98.8%, 99.6%의 높은 분류 정확도를 달성하였다. 이를 통해 제안하는 시스템이 1차원 시계열 신호를 다차원으로 확장하여 분석하는 효과적인 방법임을 확인하였고, 이질적인 특징들을 딥러닝 구조에서 결합하는 효과적인 방법인 것도 확인할 수 있었다.

Abstract

This study proposes an integrated deep learning framework that combines 1D ECG time-series signals, 2D image-transformed representations of the ECG, and geometric feature vectors derived from the physiological properties of the ECG. The architecture is based on the ResNet model and comprises three core components. The 1D ResNet learns the temporal dynamics of ECG, the 2D ResNet applied to GAF-transformed representations extracts spatial patterns, and geometric feature vectors derived from PQRST fiducial points a available datasets. Experimental results demonstrate that the proposed integrated model achieves classification accuracre incorporated as auxiliary inputs. The system is designed to enhance the representational capacity of 1D time-series signals by extending them into multiple dimensions. It is evaluated in the context of gender classification using publiclyies of 98.8% on the filtered ECG-ID dataset and 99.6% on the CSU_DB dataset. These findings validate the proposed architecture as an effective strategy for multi-dimensional analysis of ECG signals, and for integrating heterogeneous features within a unified deep learning framework.

Keywords:

multi-dimensional analysis, 1D ECG time-series data, GAF transformation, geometric feature vector, gender classification

Ⅰ. 서 론

심전도(ECG, Electrocardiogram)는 심장의 전기적 활동을 비침습적으로 기록한 표준 데이터로, 남녀 간 심장 근육량, 크기, 호르몬 차이 등에 따른 고유한 파형 특성을 포함한다. 이러한 생리적 차이를 바탕으로 성별을 분류하려는 연구는 전통적인 머신러닝 방식부터 1차원 시계열 데이터를 활용한 End-to-End 딥러닝 방식까지 꾸준히 발전해 왔다. 최근에는 GAF(Gramian Angular Field), Spectrogram 등을 통해 1차원 신호를 2차원 이미지형태로 변환하여 CNN(Convolutional Neural Network) 기반 모델에 적용하는 기법이 성별 및 질병 분류 분야에서 널리 활용되고 있다[1].

남자와 여자는 심전도 신호의 파형에서 차이점을 보인다. 이 차이점을 결정짓는 요인은 남자와 여자의 심장 근육량, 크기, 심실 벽 두께, 이로 인한 탈분극 패턴, 호르몬 차이로 알려졌다. 따라서 남녀를 구별할 때 심전도 신호를 이용하는 것은 효과적인 방법이다[2].

본 연구에서는 이런 특성을 가지는 심전도(ECG) 신호를 다양한 차원, 즉 1차원 시계열 정보, 2차원 이미지 형태로 확장한 정보, 그리고 생리학적 특성에 기반한 기하학적 특징 벡터 정보로 변환하여 이를 결합한 통합 시스템을 제안한다.

본 논문의 구성은 다음과 같다. 2장에서는 기존의 성별 분류 연구를 고찰하고, 3장에서는 본 연구가 제안하는 다차원 통합 시스템과 주요 알고리즘을 상세히 설명한다. 4장에서는 3장에서 제안한 방법의 실험 결과를 제시하며, 마지막 5장에서는 그 성과와 한계점을 분석하고 향후 활용 방안을 제안한다.

Ⅱ. 관련 연구

심전도 신호를 기반으로 남녀 성별을 구분하는 기존 방식은 크게 심층 신경망(딥러닝)을 이용하는 방식과 심층 신경망 이외의 방법을 활용하는 방식으로 나눌 수 있다[3].

2.1 심층 신경망 활용한 연구

심층 신경망을 이용하는 방식은 데이터로부터 특징을 스스로 학습하는 구조를 사용하며, 1D 원시 데이터 또는 2D 변환 이미지 신호를 입력으로 사용한다[4].

1D 원시 데이터를 그대로 사용하는 경우, K. Y. Halim et al. 연구팀[5]은 공개 데이터셋인 ECG-ID를 이용하여 실험을 진행하였다. 1차원 심전도 신호를 LSTM(Long Short-Term Memory) 및 Bi-LSTM(Bidirectional LSTM) 기반 심층 신경망에 입력하여 성별 분류를 수행하는 방법이며, 입력 형태 변화가 성능에 미치는 영향을 분석하는 것을 목적으로 둔다. LSTM 모델과 2차원 벡터로 변환한 100×100 입력으로 넣었을 때 LSTM과 Bi-LSTM 모델에서 각각 79.03%와 74.19%의 정확도를 기록하였으며, CNN 기반 이미지 학습 방식에 비해 분류 성능이 제한적이라는 한계가 존재한다.

또한 전처리를 거치지 않은 1차원 신호를 벡터로 입력하여 학습을 진행하는 방법도 존재한다. 이 방식은 신호의 구조를 자동으로 학습한다는 장점이 있으나, 고차원의 입력 구조로 인해 과적합 문제가 발생할 수 있고 잡음 및 기저선 변동에 민감하게 반응하는 등의 문제점이 존재한다[6].

2.2 심층 신경망을 활용하지 않은 연구

심층 신경망을 이용하지 않는 방식은 사용자가 직접 신호의 물리적 및 통계적 특성을 활용해 특징 벡터를 정의하는 머신러닝 기법이다. 원시 신호를 전처리한 뒤 평균, 왜도, 첨도 등 총 42개의 통계적 특징을 추출하거나[7], R점을 검출하고 이를 기준으로 P, Q, S, T 지점을 찾아내어 11개의 시간 및 진폭 특징을 추출하는 등의 특징벡터 기반 방법도 존재한다[8]. 이와 같은 방법들은 연산 복잡도가 낮아 임베디드 환경에 유리하지만, 잡음이 섞인 환경에서 특징점 검출 오류가 발생할 경우 전체 성능에 큰 영향을 미치는 단점이 있다.

기존 연구들은 주로 특징 벡터만을 추출하거나 단일 차원의 딥러닝 구조에 의존해 왔다. 그러나 심전도 신호는 복합적인 생리학적 정보를 내포하고 있어 단일 구조만으로는 유의미한 정보를 추출하는 데 한계가 있다.

이러한 한계를 극복하기 위해 본 논문에서는 시계열 흐름을 반영하는 1D ResNet, GAF를 통해 1차원 신호를 2차원으로 확장하여 공간 특징을 포착하는 2D ResNet, 그리고 기하학적 특징 벡터를 결합한 통합 시스템을 제안한다.

Ⅲ. 제안하는 방법

3.1 DB 및 데이터셋 선정

본 연구에서는 심전도 신호의 생리적 특성을 분석하고, 이용하는 것에 목적을 두었기에 비교적 파형이 뚜렷하고 온전한 상태를 가지는 데이터베이스를 사용한다.

본 연구에서 사용하는 데이터셋은 ECG-ID[9]와 조선대학교 IT 연구소에서 자체 취득한 데이터(CSU_DB)[10] 두 가지를 사용하였다. 첫 번째 데이터셋은 공개 데이터베이스인 ECG-ID이다. 해당 DB는 남성 44명, 여성 46명으로 구성된 총 90명으로부터 수집된 심전도 신호를 포함하며, 총 310개의 신호가 각 20초 동안 500 Hz의 샘플링 주파수로 기록되었다. 데이터는 두 개의 채널(열)로 구성되어 있으며 1열은 고주파 및 저주파 잡음이 혼재된 원본 신호이고, 2열은 필터링을 통해 잡음이 제거되어 상대적으로 품질이 향상된 신호로 구성되어 있다. 본 논문에서는 필터링을 거친 2열 신호를 사용하였다.

두 번째 데이터셋은 CSU_DB이다. 해당 데이터는 남자 39명, 여자 25명 총 65명으로 구성되어 있으며, 각 신호는 30초 동안 2000 Hz의 샘플링 주파수로 기록되었다. 높은 샘플링 주파수로 인해 심전도 데이터의 형태적 차이와 미세한 특성을 정밀하게 분석할 수 있는 장점이 존재한다.

위에서 언급한 두 가지 DB는 인공지능 모델을효과적으로 학습하기 위해 심전도 신호를 심장 박동 주기(beat)단위로 분리하여 사용하였다. 심장 박동 주기로 추출하는 과정은 다음과 같다.

심전도 신호의 개별 심장 박동의 주기 분할을 위해 NeuroKit2 라이브러리[11]를 활용하여 P-Q-R-S-T 특징점을 정밀하게 검출한다. 검출된 각 특징점에는 텍스트 기반 라벨링을 수행하여 데이터의 신뢰성을 확보하였으며, 이를 기반으로 박동 단위의 구간 추출을 진행하였다.

추출 과정에서는 R점을 중심 기준점으로 설정하고, P-R 구간과 R-T 구간의 물리적 거리를 산출하여 전체 박동 주기를 정의하였다. 특히 특징점 검출 오차로 인한 파형 손실을 방지하고 신호의 연속성을 보존하기 위해, P점 이전과 T점 이후에 각각 50샘플의 마진(Margin)을 추가 설정함으로써 분석 구간의 안정성을 도모하였다. 결과적으로 하나의 분석 단위는 '마진-P-R-T-마진'의 결합 구조로 표준화되었으며, 실험에 사용된 데이터셋의 샘플링 주파수 특성을 반영하여 1,134개의 샘플 길이로 분할하여 입력 데이터로 사용하였다. 이러한 전처리를 통해 최종적으로 26,806개의 유효한 심장 박동 데이터를 구축하였다.

3.2 특징벡터 추출

본 논문에서는 심전도 신호에서 검출한 P, Q, R, S, T점들을 기반으로 기하학적 도형을 구성해 특징 벡터를 추출하는 방식을 활용한다. 특징 벡터 추출 방식은 P, Q, R, S, T점을 포함한 특징점의 위치와 진폭 등을 포함하는 방식이다. 추출하는 특징벡터는 5가지 형태로 QRS 삼각형 면적, ST 삼각형 면적, S-T 삼각형 각도, Q-R-T 삼각형의 각도, QT 간격이다. 그림 1은 5 가지 특징벡터를 보여준다.

Fig. 1.

Extraction of geometric feature vectors(QRS area, ST area, S-T angle, Q-R-T angle, and QT interval)

3.3 2D 형태 신호를 이용한 심층 신경망 설계

본 논문에서는 1차원 심전도(ECG) 데이터를 시간-진폭 변화 그 이상의 에너지 분포와 기하학적 흐름을 시각화할 수 있는 2차원 이미지 신호로 변환하여 분석의 정밀도를 높였다. 이를 처리하기 위해 검증된 ResNet 구조를 기반으로 한 2차원 심층 신경망을 설계하였으며, 기존 모델의 핵심인 잔차 연결(Residual connection) 개념을 유지하면서도 이미지 입력에 최적화된 2D 합성곱(2D convolution) 연산 구조를 적용하여 차원 확장과 분석 효율성을 동시에 확보하였다[12].

3.3.1 입력 심전도 신호

모델의 입력으로 사용되는 심전도 신호는 심장박동 단위로 분할된 1D 시계열 데이터를 GAF 방식을 사용하여 이미지 형태로 변환하였다. GAF를 쓰는 이유는 시계열의 비선형적 의존성을 이미지의 공간적 구조로 변환하여 CNN의 강력한 패턴 인식 능력을 활용하기 위함이다. 데이터셋 구성 단계에서 사전에 고정된 길이로 정규화된 1D 시계열 신호를 이미지 신호로 변환한 후 다시 고정된 크기로 정규화를 하여 실험을 진행하였다.

3.3.2 2D ResNet 기반 파형 특징 추출

2D ResNet은 9층의 레이어를 가지는 구조를 사용하였으며, 심장 박동 구간 내의 흐름을 전체적으로 포함하는 2D 이미지 기반 특징과 국소적인 구간에서 관측되는 차이를 수치화한 기하학적 특징을 동시에 추출한다.

시간영역에서 존재하는 1차원 심전도 신호를 2차원 공간으로 투영하여 시계열 데이터 내의 시간-주파수 영역의 상관관계를 보존하는 GAF 특징을 추출한다.

3.3.3 GAF 기반 ECG 이미지 변환

이미지 형태로의 변환 방식은 GAF를 사용하였으며, 선정한 이유는 GAF의 값의 범위 조정과 극좌표 변환이 데이터의 시간적 구조와 상관관계를 잘 표현할 수 있기 때문에 선정하였다. 다음은 GAF 이용하여 1D ECG 신호를 이미지 형태로 변환하는 과정이다.

1. 값의 범위 조정(Scaling): 1차원 신호를 [-1, 1] 범위로 스케일링 한다.

2. 극좌표 변환: 스케일링된 값 x_i를 각도(ϕ)로 변환한다(ϕ = arccos(x_i)).

3. GAF 계산 (G_i_,j): 두 시점 간의 각도 합에 대한 코사인 값으로 정의된다.

G i, j = c o s ϕ i + ϕ j = x i ⋅ x j - 1 - x i 2 1 - x j 2

(1)

식 (1)의 G_i_,j는 변환된 2차원 GAF 이미지(또는 행렬)의 i행 j열에 해당하는 요소 값을 의미한다. x_i,x_j는 특정 시점 i와 j에서의 정규화된 ECG신호 값을 의미하며, 원본 신호의 진폭을 특정 범위 내의 값으로 변환한 상태이다. ϕ_i,ϕ_j는 정규화된 신호 값(x)을 극좌표계로 투영했을 때의 각도(Angle) 값이며, 일반적으로는 ϕ_i= arccos(x_i)의 관계를 가진다. cos(ϕ_i+ϕ_j)는 삼각함수의 덧셈 정리를 이용하여 두 시점의 각도 합에 대한 상관관계를 산출한 결과이다.

수식 우측의 $x i ⋅ x j - 1 - x i 2 1 - x j 2$ 부분은 cos(ϕ_i)cos(ϕ_j) - sin(ϕ_i)sin(ϕ_j)를 변수 x에 대해 치환한 형태이다[13]. 이 과정을 통해 128 × 128 크기의 2차원 이미지를 생성하며, 이는 심장 박동의 주기적 패턴을 시각적 텍스처(Texture) 정보로 변환한 것이다.

다음으로 ECG 파형의 특징점(PQRST)을 탐지하고, 이들 사이에서 나타나는 5 가지의 기하학적 특징 벡터를 구성한다. 각 점은 R점을 기준으로 한 윈도우 탐색(Window-based search)을 통해 결정된다.

3.3.4 파형 기반 특징과 기하학적 특징의 결합

ECG 신호를 GAF를 이용하여 이미지 형태로 변환한 후, 그림 2과 같이 ResNet 구조의 Convolutional Backbone을 통과시킨다. 이를 통해 신호의 비선형적 시간 상관관계가 포함된 고차원 공간 특징(Spatial features)을 추출한다. 최종적으로 MaxPooling(2d)을 거쳐 256 × 8 × 8 크기의 특징 맵이 생성된다.

Fig. 2.

Architecture of the 2D ResNet

융합된 특징 벡터는 최종적으로 FC(Fully Connected) Layer로 입력된다. 결합 된 벡터(256 × 8 × 8 + 5)는 첫 번째 FC 레이어를 통해 256차원으로 압축 및정제된다. 다음으로는 ReLU 활성화 함수와 Dropout(0.3)을 거치며 과적합을 방지하고 유의미한 특징만을 남기게 된다.

마지막 최종 출력 단계에서 FC layer(256 → 2)를 통해 두 개의 스칼라 값을 출력하며, 이를 바탕으로 남성(Male) 또는 여성(Female) 여부를 결정한다. 따라서 심전도 2D 신호를 이용한 심층 신경망 설계 단계에서는 GAF 이미지로부터 추출된 CNN 기반의 특징과 1차원 심전도 신호에서 추출한 특징벡터를 FC layer 단계에서 융합한다. 이는 딥러닝의 자동화된 특징 학습 능력과 전통적인 통계적 변별력을 결합하여 성별 분류의 정확도를 극대화하기 위한 설계이다.

3.3.5 모델 학습 방법

모델 학습에는 이진 분류(Male/Female)를 위해 Binary Cross Entropy with Logits Loss를 사용했으며, 전체 데이터셋을 학습(Train), 검증(Validation), 테스트(Test) 세트로 70% : 15% : 15%의 비율로 분할하여 사용하였다. 데이터 분할 시 발생할 수 있는 데이터 누수(Data leakage) 문제를 방지하고 모델의 일반화 성능을 확보하기 위해, 동일 피험자의 심박동 데이터가 서로 다른 세트에 섞이지 않도록 피험자(Subject)를 기준으로 분리하였다. 최적화 기법으로 AdamW optimizer를 사용, 학습률 스케줄링을 위해 Cosine Annealing 기법을 적용하였다. 그림 2은 ResNet을 기반으로 한 2D 신경망의 구조를 시각화한 것이다.

3.4 제안하는 통합 시스템 설계

본 절에서는 1D ResNet 모델과 2D ResNet 모델을 결합한 통합 심층 신경망 시스템을 설계하고, 이를 통해 최종 성별 분류를 수행한다.

제안한 통합 모델은 서로 다른 차원의 표현 공간에서 효과적으로 특징을 추출하기 위해 이중 경로 구조로 구성되었다. 첫 번째 경로는 1D 심전도 파형을 입력으로 하는 1D ResNet 모델로부터 추출하며, 두 번째 경로는 심전도 신호를 2D 형태로 변환한 후 2D ResNet 모델을 통해 추출한다. 이전에 소개한 1D ResNet 기반 모델에서는 Global Average Pooling 이후 192차원의 파형 기반 특징을 추출하여 이를 단독 성별 분류를 위한 출력층으로 연결하였지만, 통합 모델에서는 해당 특징을 단독 분류를 위한 출력층으로 연결하지 않고 통합 모델의 입력으로 사용한다. 마찬가지로, 이전에 소개한 2D ResNet 기반 모델에서도 Global Average Pooling을 적용하여 512차원의 특징을 생성하고 이를 단독 분류를 위한 출력층에 입력하였으나, 통합 모델에서는 이와 같은 출력층을 바로 사용하지 않으며, Global Average Pooling 이후의 512차원 특징을 통합 모델의 입력으로 사용한다.

이와 같이 1D 모델로부터 추출된 192차원의 특징과 2D 모델로부터 추출된 512차원 특징은 concatenation 연산을 통해 결합 되며, 결합 된 특징 벡터는 총 704차원의 통합 특징 표현을 갖는다.

이때 서로 다른 신경망(1D 및 2D ResNet)에서 산출된 특징값 간의 수치적 스케일 차이를 해소하기 위해 Batch Normalization 과정을 거쳐 특징 공간을 정규화한다. 이는 특정 도메인의 특징이 분류 결정에 지배적인 영향을 미치는 것을 방지하고, 두 모델의 정보가 균형 있게 반영되도록 하기 위함이다. 결합 된 특징 벡터는 이후 다층 FC layer를 통해 단계적으로 차원을 축소하며 최종 분류를 수행한다. 즉, 첫 번째 FC layer에서는 704차원 입력을 176차원으로 변환하고 ReLU 활성화 함수와 dropout을 적용한다. 이후 두 번째 FC layer를 통해 44차원으로 축소한 뒤, 다시 ReLU 활성화 함수 및 dropout을 적용하여 과적합을 방지한다. 마지막으로 출력층에서는 1차원의 logit 값을 출력하여 이진 성별 분류(Male/Female)를 수행한다. 또한 PQRST 점이 명확하게 검출되는 고품질 심전도 신호의 경우에는 앞 절에서 정의한 기하학적 특징 벡터를 추가적인 보조 정보로 활용할 수 있도록 설계하였다. 5개의 특징으로 구성된 5차원의 저차원 특징 벡터가 결합 될 때는 CNN 기반의 고차원 특징들과의 차원 불균형을 해결하기 위해 별도의 Linear Projection Layer를 거쳐 통합 특징 공간으로 투영(Mapping)된다. 이를 통해 수치적으로 명확한 생리학적 특징이 딥러닝 모델의 추상화된 파형 특징을 효과적으로 보완하도록 설계하였다. 반면, PQRST 점의 검출 정확도가 충분히 확보되지 않은 경우에는 기하학적 특징을 제외하고 1D 및 2D 모델 기반 특징 벡터만을 이용하여 동일한 통합 분류 구조를 적용하였다. 그림 3는 제안하는 통합 시스템의 전체 신경망 구조를 시각화 한 것이다.

Fig. 3.

Architecture of the proposed unified deep neural network system

Ⅳ. 실험 결과

4.1 개별 시스템에 의한 남녀 성별 분류 성능

표 1은 필터링 된 ECG-ID, 그리고 CSU_DB를 대상으로 1D ResNet 및 2D ResNet 시스템의 성별 분류 성능을 비교한 결과를 나타낸다. 먼저 필터링 된 ECG-ID의 경우, 1D ResNet 및 2D ResNet 기반 모델 모두에서 97% 이상의 높은 분류 정확도를 기록하였다.

Table 1.

Comparison of gender classification performance of individual CNN-based systems

2D ResNet은 98.9%의 정확도를 기록하며, 1D 기반 모델 대비 일관되게 높은 성능을 보였다. 이는 데이터 출처와 무관하게 2D ResNet이 성별에 따른 파형 구조 차이를 보다 효과적으로 학습할 수 있음을 의미한다. 종합적으로, 신호 품질이 확보된 환경에서는 단일 시스템 기준에서도 2D ResNet 방식이 성별 분류에 있어 안정적이고 높은 성능을 제공함을 확인하였다.

4.2 통합 시스템에 의한 남녀 성별 분류 성능

표 2는 필터링한 ECG-ID, 그리고 CSU_DB를 대상으로 1D ResNet, 2D ResNet, 그리고 두 구조를 결합한 통합 시스템에 대해 기하학적 특징 정보의 결합 여부에 따른 성별 분류 성능을 비교한 결과를나타낸다. 실험 결과를 종합하면, 시스템 구조가 1D ResNet에서 2D ResNet, 통합 시스템, 그리고 통합 시스템에 기하학적 특징 정보를 결합한 형태로 확장될수록 분류 성능이 단계적으로 향상되는 경향이 고품질 심전도 데이터셋을 중심으로 일관되게 관찰되었다. 필터링한 ECG-ID의 경우, 1D ResNet은 안정적인 분류 성능을 보였으나, 2D ResNet을 적용함으로써 파형의 공간적 구조 정보를 함께 학습할 수 있어 분류 정확도가 추가적으로 향상되었다. 이후 1D와 2D 표현을 결합한 통합 시스템에서는 두 입력 정보가 상호 보완적으로 작용하여 단일 구조 대비 더욱 향상된 성능을 달성하였다. 여기에 QRS 면적, ST 면적, QRT 각도등의 기하학적 특성을 명시적으로 반영한 특징 정보를 결합한 경우, 가장 높은 분류 정확도인 98.8%를 비교적 빠른 61 에폭에서 달성하여 분류 성능과 학습 효율 측면 모두에서 가장 우수한 결과를 보였다.

Table 2.

Comparison of gender classification performance between individual CNN-based systems and the proposed system

CSU_DB를 기준으로 한 실험에서도 유사한 성능 향상 흐름이 확인되었다. 특히 통합 시스템에 기하학적 특징 정보를 결합한 모델은 53 에폭에서 99.6%의 최고 정확도를 기록하여, 단일 ResNet 기반 모델뿐 아니라 기하학적 특징 정보를 사용하지 않은 통합 구조 대비서도 명확한 성능 우위를 나타냈다. 이러한 결과는 1D 파형 기반 정보가 시간적 변화 특성을 효과적으로 반영하고, 2D 표현이 파형 형태의 구조적 차이를 보완하는 가운데, 기하학적 특징 정보가 CNN이 직접 학습하기 어려운 생리학적 구간 특성을 사전에 요약된 형태로 제공함으로써 모델의 분별력을 추가적으로 강화했기 때문으로 해석할 수 있다.

종합적으로, 본 실험 결과는 단일 입력 기반 모델에서 다중 표현 기반 통합 구조로의 확장이 성별 분류 성능을 점진적으로 향상시키며, 여기에 기하학적 특징 정보를 결합함으로써 정확도와 학습 효율을 동시에 개선할 수 있음을 실험적으로 입증하였다.

4.3 ECG-ID 기반 기존 연구와의 성능 비교

제안하는 방법과 기존 연구의 성능 비교를 위해 ECG-ID 데이터셋을 활용한 성능 분석을 표 3에 나타내었다. K. Y. Halim et al. 연구팀은 필터링된 신호에 Random Forest를 적용하였으며, LSTM과 Bi-LSTM 모델에서 각각 79.03%와 74.19%의 정확도를 기록하였다. 반면, 본 연구는 수 초 이상의 전체 신호를 사용하는 기존 방식과 달리, 심장 박동 단위로 신호를 정밀 분리하여 분석을 수행하였다는 점에서 차별성을 갖는다. 이러한 박동 단위 분석은 약 0.6초~0.9초의 한 주기 데이터만으로도 즉각적인 판별이 가능해, 긴 대기 시간이 필요한 기존 방식보다 임상 및 보안 환경에서의 실시간성과 실용성이 매우 높다. 특히 본 연구에서 제안하는 1D 및 2D ResNet 통합 시스템은 고품질의 필터링된 신호에 QRS 면적, ST 기울기 등 생리학적 기하학적 특징 벡터를 결합함으로써, 최대 98.8%의 분류 정확도를 달성하여 그 우수성을 입증하였다.

Table 3.

Performance comparison between previous studies and the proposed unified model (ECG-ID filt signals)

Ⅴ. 결론 및 향후 과제

본 논문에서는 2D ResNet 학습을 위한 심전도 신호의 2차원 변환 방법을 제시하였으며, 이를 1D ResNet과 결합하여 기존 단일 구조 모델의 한계를 개선한 통합 시스템을 제안하였다. 실험 결과, 2D ResNet은 1D ResNet보다 높은 성능과 빠른 수렴 속도를 보였으며, 제안된 통합 시스템은 기존 연구 대비 월등한 성능 향상을 기록하였다. 다만, 품질이 좋은 데이터셋애 대해서만 실험을 진행한 만큼 저품질 데이터셋을 적용하여 추가적인 검증 및 성능 개선이 향후 과제로 남아있다.

Acknowledgments

이 논문은 조선대학교 학술연구비의 지원을 받아 연구되었음(2024년)

References

J.-L. C. Lopez, C. Parra, and G. Forero, "A Fast Deep Learning ECG Sex Identifier Based on Wavelet RGB Image Classification", Data 2023, Vol. 8, No. 6, Art no. 97, May 2023. [https://doi.org/10.3390/data8060097]
J. H. Heo, S. W. Yan, J. G. Shin, S. J. Kim, O. K. Kim, J. H. Lee, B. J. Choi, T. J. Cha, J. W. Lee, "Gender Differences of P Wave Signal Averaged Electrocardiograms: Based on the Risk of Atrial Fibrillation", Korean Circulation J., Vol. 37, No. 12, pp. 656-662, Dec. 2007. [https://doi.org/10.4070/kcj.2007.37.12.656]
M. M. R. Khan, M. A. B. Siddique, S. Sakib, A. Aziz, A. K. Tanzeem, and Z. Hossain, "Electrocardiogram heartbeat classification using convolutional neural networks for the detection of cardiac arrhythmia", Proc. Int. Conf. Electrical, Communication and Computer Engineering (ICECCE), Istanbul, Turkey, pp. 915-920, Apr. 2020. [https://doi.org/10.1109/I-SMAC49090.2020.9243474]
S. Kiranyaz, O. Avci, O. Abdeljaber, T. Ince, M. Gabbouj, and D. J. Inman, "1D convolutional neural networks and applications: A survey", Mechanical Systems and Signal Processing, Vol. 151, Art No. 107398, May 2021. [https://doi.org/10.1016/j.ymssp.2020.107398]
K. Y. Halim, D. T. Nugrahadi, M. R. Faisal, R. Herteno, and I. Budiman, "Gender Classification Based on Electrocardiogram Signals Using Long Short Term Memory and Bidirectional Long Short Term Memory", Jurnal Ilmiah Teknik Elektro Komputer dan Informatika (JITEKI), Vol. 9, No. 3, pp. 606-618, Sep. 2023. [https://doi.org/10.26555/jiteki.v9i3.26354]
F. Noor, J. M. Chaudhary, S. Aziz, S. Z. H. Naqvi, E. Alanazi, and A. S. Alahmadi, "A Deep Learning Framework for Identity Recognition Using ECG Signals", Electronics, Vol. 11, No. 21, Art No. 3432, Oct. 2022. [https://doi.org/10.3390/electronics11213432]
M. U. Khan, J. M. Ch., M. Saad, S. Z. H. Naqvi, S. Aziz, and M. A. Qasim, "Electrocardiogram based Gender Classification", Proc. 2nd Int. Conf. Electrical, Communication and Computer Engineering (ICECCE), Istanbul, Turkey, Apr. 2020. [https://doi.org/10.1109/ICECCE49384.2020.9179305]
J.-L. Cabra, D. Mendez, and L. C. Trujillo, "Wide machine learning algorithms evaluation applied to ECG authentication and gender recognition", Proc. 2nd Int. Conf. Biometric Engineering and Applications, Amsterdam, Netherlands, pp. 58-64, May 2018. [https://doi.org/10.1145/3230820.3230830]
ECG-ID, https://physionet.org/content/ecgiddb/1.0.0/, . [accessed: Apr. 21, 2025]
CSU_DB, https://www.chosun.ac.kr/user/indexSub.do?codyMenuSeq=937215851&siteId=riit, . [accessed: Sep. 25, 2025]
D. Makowski, T. Pham, Z. J. Lau, J. C. Brammer, F. Lespinasse, H. Pham, C. Schölzel, and S. H. A. Chen, "NeuroKit2: A Python toolbox for neurophysiological signal processing", Behavior Research Methods, Vol. 53, No. 4, pp. 1689-1696, Aug. 2021. [https://doi.org/10.3758/s13428-020-01516-y]
K. He, X. Zhang, S. Ren, and J. Sun, "Deep Residual Learning for Image Recognition", Proc. IEEE Conf. Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA, pp. 770-778, Jun. 2016. [https://doi.org/10.1109/CVPR.2016.90]
Y. Elmir, Y. Himeur, and A. Amira, "ECG classification using Deep CNN and Gramian Angular Field", arXiv preprint arXiv:2308.02395, , pp. 137-141, Jul. 2023. [https://doi.org/10.48550/arXiv.2308.02395]