Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 23, No. 8, pp.27-35
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Aug 2025
Received 21 May 2025 Revised 30 Jun 2025 Accepted 03 Jul 2025
DOI: https://doi.org/10.14801/jkiit.2025.23.8.27

항공전자 장비의 고장 예지를 위한 예비 연구: 인공지능 기반 고장 관련 변수 추출

안다운* ; 이익규**
*한국생산기술연구원 모빌리티시스템그룹 수석(교신저자)
**한국항공우주산업 AI/SW연구실 AI개발팀 연구원
A Preliminary Study on Avionics Prognostics: AI-based Extraction of Failure-Related Variables
Dawn An* ; Ikgyu Lee**

Correspondence to: Dawn An Advanced Mobility System Group, Korea Institute of Industrial Technology, 320, Techno sunhwan-ro, Daegu, Korea Tel.: +82-53-580-0174, Email: dawnan@kitech.re.kr

초록

상태기반정비는 시스템의 잔존유효수명을 예측하는 고장예지 기술을 바탕으로 최적의 유지보수 시점을 결정하는 비용 효율적인 전략으로, 항공 분야를 위시한 다양한 산업에 적용되고 있다. 이를 위해서는 베어링의 진동신호, 배터리의 전압 및 전류 신호 등 시스템의 건전성을 나타내는 모니터링 데이터가 필수적이다. 그러나 항전시스템에서는 모니터링되는 만여 개의 변수 중 무엇이 고장과 관련이 있는지조차 알려져 있지 않다. 본 논문에서는 대한민국 공군에서 제공받은 실제 비행 데이터를 활용하여 항전장비의 고장 관련 변수를 추출하는 방법을 제안한다. 데이터의 복잡도를 낮추기 위해 오토인코더를 이용해 차원을 축소한 후, 랜덤 포레스트를 통해 고장 관련 변수를 추출하였다. 결과로써 유의미한 후보 변수 30개를 추출하였으며, 이 중 다섯 개 변수는 다양한 조건에서도 일관되게 높은 중요도를 보여 신뢰성 있는 고장 관련 변수로서의 가능성을 확인하였다.

Abstract

Condition-Based Maintenance (CBM) is a cost-effective strategy that determines the optimal maintenance timing based on prognostic technologies that predict the system’s Remaining Useful Life (RUL). It has been applied across various industries, with the aviation sector at the forefront. To implement CBM, monitoring data that reflects system health—such as bearing vibration signals and battery voltage and current signals—is essential. However, in avionics systems, it is not even known which of the more than 10,000 monitored variables are related to failures. This paper proposes a method for extracting failure-related variables of avionics equipment using actual in-flight data provided by the Republic of Korea Air Force. To reduce data complexity, an autoencoder was employed for dimensionality reduction, followed by the application of a random forest algorithm to identify failure-related variables. A total of 30 candidate variables were extracted, among which five consistently showed high importance across various conditions, demonstrating their potential as failure-related variables.

Keywords:

avionics, prognostics, remaining useful life, autoencoder, random forest

Ⅰ. 서 론

상태기반정비(CBM, Condition-Based Maintenance)는 시스템의 건전성 상태를 모니터링하고, 고장예지 기술을 통해 잔존유효수명(RUL, Remaining Useful Life)을 예측함으로써 유지보수 시점을 최적화할 수 있는 전략으로 주목받고 있다[1]. CBM은 기존의 사후정비나 예방정비에 비해 유지보수 비용을 절감하고 시스템 가용성을 높이는 데 효과적이며, 특히 항공[2][3], 철도[4], 에너지[5] 등 고신뢰성이 요구되는 분야에서 폭넓게 활용되고 있다.

CBM 수행을 위해서는 시스템의 건전성 상태와 직간접적으로 관계된 모니터링 데이터가 필수적이다. 결함 발생 시 진동이 심해지는 베어링의 경우에는 가속도계를 이용하여 측정된 진동의 크기가 고장 모니터링 변수로 주로 활용된다[6][7]. 배터리는 전압 및 전류 등이[8][9], 항공기 엔진은 온도, 압력 및 속도 등이[10][11] 각 시스템의 고장 관련 모니터링 변수로 사용되고 있으며, 이러한 모니터링 데이터는 결함 및 열화를 대표하는 유의미한 특징 신호로 추출되는 과정을 거쳐 상태진단 및 고장예지에 사용된다. 특징 추출연구는 베어링 진동신호와 같은 단변량 데이터의 경우에도 분석이 까다로운 과제로 간주되며, 관련 연구가 활발히 진행되고 있다.

반면, 항공전자(이하 항전)시스템은 운용 신뢰성과 비용 측면에서 CBM의 필요성이 큼에도 불구하고, 고장 관련 변수가 무엇인지조차 거의 알려져 있지 않다. 이는 항전시스템의 구조와 기능이 매우 복잡하고, 만여 개에 이르는 모니터링 변수를 포함하고 있어 고장 메커니즘과 모니터링 데이터 간의 인과관계를 체계적으로 분석하기 어렵기 때문이다. 또한, 데이터의 보안, 저장, 형식 및 프로토콜 차이 등의 문제로 인해 데이터 접근 및 활용이 제한되며, 이러한 요소들 역시 연구의 큰 장벽으로 작용하고 있다.

따라서 본 논문은 항전장비 CBM 체계 구축을 위한 초석을 마련하고자, 대한민국 공군에서 제공받은 실제 비행 데이터를 활용하여 고장 관련 변수를 추출하는 방법을 제안한다. 본 연구는 고장과 관련된 실제 변수(Ground truth)가 알려져 있지 않은 상황에서 수행된 탐색적 분석으로, 정량적 성능 평가보다는 인공지능 기반 기법을 통해 유의미한 후보 변수를 추출하는 과정의 타당성과 해석 가능성 확보에 초점을 맞추었다. 이를 위한 절차는, 데이터의 고차원성과 복잡도를 낮추기 위해 오토인코더(Autoencoder)[12]를 활용하여 차원을 축소한 뒤, 랜덤 포레스트(Random forest)[13]를 적용하여 고장과 관련된 주요 변수를 추출하는 두 단계로 진행된다.

본 논문은 다음과 같이 구성된다. 2장에서는 본 연구의 대상이 되는 주요 항전장비를 선정하며, 3장에서는 선정된 장비의 고장 관련 변수를 추출하기 위한 오토인코더와 랜덤 포레스트 기반의 방법을 설명한다. 4장에서는 제안 방법의 적용 결과를 제시하고 분석하며, 마지막으로 5장에서는 결론 및 향후 연구 방향에 대해 기술한다.


Ⅱ. 대상 장비 선정

2.1 정비이력 데이터

본 연구에서는 고정익 항공기 특정 기종의 모든 호기에 대한 정비이력 데이터를 분석하여 대상 항전장비를 선정하였다. 정비이력은 2020년 7월부터 2025년 2월까지, 약 4년 8개월간 총 17,700여 건이 기록되었으며, 이 중에서 교환 장착 및 수리가 수행된 정비건 중 항전장비와 관련있는 정비는 1,587건이었다.

정비이력 데이터에 기록되는 항전장비에는 EGI(Enhanced GPS/INS), FCR(Fire Control Radar), FCS(Flight Control System), HUD(Head Up Display), IFF(Identification Friend or Foe), INS(Inertial Navigation System) 등이 있으며, 본 논문에서는 보안상 문제로 장비 명칭을 알파벳으로 대체하여 사용하였고, 앞서 언급한 장비들은 이후 분석 대상 장비와는 별개임을 밝혀둔다.

2.2 항전장비 선정 결과

정비이력에 기록된 1,587건의 데이터 중, 현장 경험을 바탕으로 우선 선정된 항전장비 8개 품목(A~H, 실제 장비명의 영문 알파벳 순)의 고장 빈도에 대한 정량적 분석 결과를 그림 1에 제시하였다. 그림에서 빨간색, 파란색, 검정색 막대는 각각 전체(교체+수리) 건수, 교체 건수, 수리 건수를 나타낸다. 교체와 수리 모두에서 다른 장비에 비해 높은 고장 빈도를 보이는 것은 F장비이며, 그 뒤를 전체건수를 기준으로 D, E, G, H장비가 순서대로 따른다. A, B, C장비는 서로 유사한 수준으로, 상대적으로 가장 낮은 고장 빈도를 나타냈다.

Fig. 1.

Failure frequency of major avionics equipment

고장 빈도에 더해 고려해야 할 것이 정비 기간, 난이도, 장비 단가 등을 고려한 유지보수 비용이다. 현재 정량화할 수 있는 데이터로는 장비 단가가 있으며, 신품 및 정비의 평균 단가를 정비 최소 단가를 기준으로 정규화하여 표 1에 제시하였다.

Main equipment unit price

표 1의 신품 및 정비 단가를 그림 1의 교체 및 수리 건수에 각각 적용하여 시간에 따른 누적 유지보수 비용을 계산한 결과를 그림 2에 나타내었다. 고장 빈도가 가장 높았던 F장비는 표 1에서 확인된 상대적으로 높은 단가로 인해 다른 장비에 비해 최소 약 4배에서 최대 약 54배까지 높은 누적 유지보수 비용이 요구된다. 이처럼 압도적으로 높은 F장비의 누적 유지보수 비용은 주요 항전장비 선정의 타당성을 뒷받침한다.

Fig. 2.

Cumulative maintenance costs of avionics equipment over time


Ⅲ. 고장 관련 변수 추출 방법

3.1 MUX 데이터

이번 장에서는 F장비 선정에 사용된 동일 기종 항공기의 특정 호기로부터 실제 비행 중 수집된 MUX(Multiplexer) 데이터를 활용하여 고장 관련 변수를 추출한다. 대상 호기에서 F장비는 2024년 3월 새로 교체된 후, 76.7시간의 누적 비행을 거쳐 7월에 고장이 발생하였다. 교체 후 고장이 발생하기까지의 기간 동안 MUX 데이터는 총 23회 기록되었으며, 이 23회의 모니터링 데이터가 본 장에서 활용되는 한 세트의 열화 데이터가 된다.

MUX 데이터는 총 3개 채널을 통해 통신된 결과 매회 약 6,000개의 변수가 200여 개의 파일에 나뉘어 저장된다. 기본적으로는 통신의 송수신 장비에 따라 파일이 구분되지만, 대부분 동일 송수신 장비 간에도 수백 개의 변수를 포함하고 있어 여러 개의 파일로 분리 저장되며, 파일마다 저장된 변수의 개수는 일정하지 않다.

본 연구에서는 약 6,000개의 변수 중 2장에서 선정된 F장비의 고장과 관련이 있는 변수들을 필터링하기 위해 송수신 장비 명칭, 신호 목록 및 유형 등의 정보가 포함된 전기신호 인터페이스 통제문서를 활용하였다. 해당 문서에서 F장비의 상위 시스템을 송신 또는 수신 주체로 명시한 항목을 키워드 기반으로 검색하였고, 그 결과 총 22개 파일에서 922개의 관련 변수가 선택되었다. 이어서 F장비의 수명 기간 동안 23회에 걸쳐 데이터 값이 모두 0인, 정보성이 없는 변수를 제거한 2차 필터링 결과, 21개 파일에서 426개의 변수가 최종 선정되었다.

이들 변수에는 비행 일시, 기체의 고도, 속도, 자세 등 직관적으로 이해 가능한 일부 변수 외에도, 밀접한 관계자가 아니면 개념조차 파악하기 어려운 다수의 변수가 포함되어 있다. 항공 국방 분야의 특성상 변수 개념을 이해하는 데 필요한 정보 접근이 제한적이므로 수백 개에 이르는 변수를 개별적으로 분석하는 것은 매우 비효율적이다. 더불어, 개념이 파악된 변수라 하더라도 그것이 고장과 물리적으로 어떤 관련이 있는지를 해석하는 일은 또 다른 문제이다. 이에 본 연구에서는 총 426개 변수 중 F장비의 고장과 연관성이 높은 변수를 데이터 기반으로 우선 추출하는 효과적인 방법을 다음 절에서 제시하고자 한다.

3.2 AI 기반 고장 관련 변수 추출 방법

분석 대상인 426개의 변수 각각에는 매회 모니터링 시 수십만 개의 신호가 저장되며, 변수마다 샘플링 비율이 달라서 분석에 어려움이 있다. 이를 해결하기 위해 본 논문에서는 오토인코더를 활용하여 데이터 전처리를 수행한 뒤, 랜덤 포레스트를 통해 고장 관련 변수를 최종적으로 추출하였다. 이 전체 과정은 그림 3에 요약되어 있다.

Fig. 3.

Flowchart of the proposed method

오토인코더는 비지도 학습 기법 중 하나로, 입력 데이터를 낮은 차원으로 인코딩한 후 디코딩을 통해 원본 데이터를 복원하는 방식으로 특징을 학습한다[12]. 축소 차원이 지나치게 작으면 정보 손실이 크고, 반대로 너무 크면 연산량과 학습 시간이 증가하는 문제가 발생한다. 본 연구에서는 축소 차원을 5, 10, 15, 20으로 변경해가며 성능(시간 관련 변수의 개수, 4장 표 3 참조) 변화를 비교한 결과, 10차원이 과도한 정보 손실 없이 계산 효율성과의 균형을 가장 잘 이루는 것으로 판단되었다. 이에 따라 본 논문에서는 각 변수에 기록된 수십만 개 신호를 오토인코더를 통해 10차원으로 축소하였으며, 이를 통해 데이터 분석 과정의 효율을 높이면서 샘플링 비율이 다른 문제도 해결하였다.

랜덤 포레스트는 다수의 결정 트리를 생성하여 분류 및 회귀를 수행하는 기계학습 기법으로[13], 변수 중요도 결과를 기반으로 고장 관련 변수를 추출하였다. 이때 랜덤 포레스트의 입력은 인코딩된 변수들이고, 출력은 RUL이며, 구체적인 입출력 데이터의 구조는 표 2에 제시하였다. 앞서 인코딩된 426개 변수 각각의 10개 데이터가 모두 사용되기 때문에 총 입력 변수는 4,260개가 되며, 23회의 모니터링 데이터를 기반으로 학습이 수행된다.

Structure of input and output data for the random forest model

RUL은 F장비의 전체 수명인 76.7시간에서 각 시점의 비행 시간을 차감한 값으로 정의되며, 비행시간이 증가할수록 감소하여 마지막 모니터링 시점에서는 0이 된다. 요약하자면, 랜덤 포레스트의 입력과 출력의 크기는 각각 23 × 4260과 23 × 1이 되고, 출력과의 상관도에 따라 입력의 중요도가 계산된다.

결과로써 얻어진 4,260개 입력에 대한 중요도를 426개 변수 단위로 합산하여 각 변수에 대한 중요도를 추정하였다. 랜덤 포레스트의 무작위성에 기인한 오차를 줄이고 결과의 강건성을 확보하기 위해 동일 과정을 100회 반복한 후 평균값을 최종 중요도로 사용하였다. 또한, 트리 개수(n)에 따른 영향을 분석하기 위해 다섯 가지 조건(n=100, 200, 300, 400, 500)에서 동일 과정을 반복하였으며, 그 결과는 다음 장에서 제시한다.


Ⅳ. 고장 관련 변수 선정 결과 및 분석

다섯 가지 트리 개수 중 대표적으로 n=100과 n=300일 때의 결과를 그림 4에 제시하였다. 그림에서 파란색과 빨간색 막대 높이는 각 변수의 중요도를 나타내며, 중요도가 높은 상위 30개 변수를 빨간색으로 구분하여 표시한 것이다. 또한, 검은색 수직 파선은 21개 파일 간의 구분을 의미한다. 두 조건 모두에서 중요도가 높은 두 변수는 93번과 243번으로 나타났으며, 상위 30개 변수가 전체적으로 유사하게 추출되었음을 확인할 수 있다.

Fig. 4.

Results of variable importance estimation

그림 5는 트리 개수 변화에 따른 중요도 상위 30개 변수의 파일 번호를 나타낸 것이다. 점으로 표시된 30위 결과는 트리 개수에 상관없이 유사한 분포를 보이는 한편, 원으로 표시된 중요도 1위 변수가 n≤200과 n≥300을 기준으로 일정하게 유지되는 것이 확인된다.

Fig. 5.

File number corresponding to the top 30 variables in importance

변수 중요도 추정 결과가 유사한 경향을 보이므로, 대표적으로 n=100일 때의 결과 중 상위 15개 변수의 정의를 표 3에 제시하였다.

Definition of the top 15 variables in importance

이 중 시간의 흐름과 관련된 변수들(1, 3, 6, 15위)이 중요도 상위에 포함되었고, 사용 시간의 경과와 밀접하게 대응되는 이러한 변수들이 RUL과 높은 상관도를 보이는 결과는 본 연구에서 제안한 방법의 유효성을 뒷받침하는 근거가 될 수 있다. 다만 일, 시, 분, 초 등 단순히 시간 경과만을 나타내는 변수들은 고장과 직접적인 물리적 연관성이 있다고 보기는 어렵다. 즉, 시간 변수는 제안 방법이 RUL과 상관도가 높은 데이터 값을 갖는 변수를 잘 추출하는지 판단할 수 있는 성능 지표로는 유효하지만, 고장 관련 변수로는 적절하지 않다. 추가로, 좌표계나 명령어 등과 관련된 변수들(5, 9, 11, 13위) 역시 고장과의 관련성이 낮은 것으로 판단된다.

이에 따라 학습 과정에서의 불필요한 노이즈를 줄이고 결과의 신뢰도를 높이기 위해 물리적 유의성이 부족한 digit, toggle, coordinate system, time tag, command 등과 관련된 변수들을 제외하였다. 그 결과 분석 대상 변수는 426개에서 354개로 감소하였고, 이 변수들을 대상으로 앞서의 분석 과정을 동일하게 반복하였다.

그림 6그림 5와 마찬가지로, 중요도 상위 30개 변수의 파일 번호를 트리 개수 변화에 따라 나타낸 것이다. 물리적 유의성이 고려되지 않았던 그림 5와 비교하면, 상위 30위는 물론 1위가 속한 파일 번호도 일관되게 나타나 결과의 신뢰도가 향상되었음을 확인할 수 있다.

Fig. 6.

File number corresponding to the top 30 variables in importance after considering physical significance

물리적 유의성이 고려된 이후의 결과를 보다 정밀하게 분석하기 위해 중요도 상위 5개 변수를 n=100~500일 때의 모든 경우에 대해 정리한 내용을 표 4에 제시하였다. 변수 221번과 243번은 모든 트리 개수에서 1위 또는 2위에 해당하여 고장과 강한 연관성이 있음을 확인할 수 있으며, 변수 85번, 224번, 366번은 각각 n=200, n=100, n=500을 제외한 네 가지 경우에서 중요도 5위 내에 포함되었다. 이 변수들(85, 221, 224, 243, 366번)이 모두 포함된 경우는 n=300과 n=400이며, 이 중 n=300일 때 상위 30개 변수 중 대표적으로 15개의 정의를 표 5에 제시하였다. 보안상 변수 정의의 앞 두 자리만 표시하였지만, 고도, 위치, 속도, 제어 등의 단어가 포함되어 있음을 확인하였다.

Top 5 variables in importance across different numbers of trees

Definition of the top 15 variables in importance after considering physical significance

그러나 이들 대부분은 기체의 비행 상태를 나타내는 직관적인 정보와는 거리가 있으며, 변수의 의미를 파악하기 위한 개념 분석이 필요하다. 본 연구를 통해 추출된 30개의 변수에 대한 물리적 분석이 향후 수행되어야 하지만, 현 단계에서는 변수별 데이터의 추세 확인을 통해 결과의 유효성을 판단할 수 있다. 이를 위해 추출된 변수들 중 중요도 1위인 243번 변수와 30위인 79번 변수의 정규화된 원데이터를 그림 7에 제시하였다. 중요도 1위와 비교했을 때, 30위 변수는 비행 시간에 따른 변화가 미미하였으며, 이를 통해 두 가지를 판단할 수 있다. 첫째, 제안된 방법이 정보량이 풍부한 변수를 효과적으로 추출했음을 보여준다. 둘째, 상위 30위 이후의 변수들은 분석 필요성이 낮다고 판단할 수 있다. 수명 주기 전반에 걸쳐 풍부한 정보를 포함하고 있지만 변화 양상이 뚜렷하지 않은 중요도 1위의 243번과 같은 변수들은 향후 추가적인 분석이 요구된다. 이를 위해서는, 앞서 표 3에서와 같이 단순히 데이터에만 의존하여 무의미한 변수를 추출했던 오류를 피하기 위해 변수의 물리적 해석이 필수적으로 병행되어야 한다.

Fig. 7.

Raw data of the top 1 and top 30 variables


Ⅴ. 결론 및 향후 과제

본 연구에서는 항전장비의 고장 관련 변수를 효과적으로 추출하기 위해 오토인코더와 랜덤 포레스트를 결합한 AI 기반 방법을 제안하였다. 누적 유지보수 비용이 타 장비 대비 현저히 높은 F장비에 본 방법을 적용하여 중요도 상위 30개의 변수를 추출하였으며, 물리적 유의성 검토와 랜덤 포레스트의 트리 개수 변화 등 다양한 조건에서의 적용을 통해 분석 과정의 타당성을 확보하고 결과의 신뢰성을 확보하였다.

이를 통해 고장 관련 정보가 불분명한(Ground truth 부재) 고차원 항전장비 시스템에서도 데이터 기반으로 의미 있는 변수들을 추출할 수 있음을 확인하였으며, 이는 향후 연구를 위한 기초 자료로 활용될 수 있다.

다만 본 연구는 항전장비 CBM 체계 구축을 위한 기초 단계로, 추출된 변수에 대한 물리적 해석과 고장 메커니즘과의 연관성 검토가 추가적으로 요구된다. 이에 따라 후속 연구에서는 본 연구를 통해 추출된 30개의 변수의 물리적 개념을 분석하고, 이를 기반으로 원데이터로부터 고장 및 열화 특징을 추출할 예정이다. 이후, 이러한 특징 정보를 활용하여 RUL을 예측함으로써 항전장비 CBM 체계를 완성해 나갈 계획이다.

Acknowledgments

이 논문은 2022년 정부(방위사업청)의 재원으로 국방기술진흥연구소의 지원을 받아 수행된 연구임(KRIT-CT-22-081, 무기체계 CBM+ 특화연구센터)

References

  • R. Ahmad and S. Kamaruddin, "An overview of time-based and condition-based maintenance in industrial application", Computers & Industrial Engineering, Vol. 63, No. 1, pp. 135-149, Aug. 2012. [https://doi.org/10.1016/j.cie.2012.02.002]
  • W. J. Verhagen, B. F. Santos, F. Freeman, P. van Kessel, D. Zarouchas, T. Loutas, R. C. Yeun, and I. Heiets, "Condition-based maintenance in aviation: challenges and opportunities", Aerospace, Vol. 10, No. 9, pp. 762, Aug. 2023. [https://doi.org/10.3390/aerospace10090762]
  • Y. Guo, Y. Sun, Q. Si, X. Guo, and N. Chen, "Probabilistic risk assessment of civil aircraft associated failures under condition-based maintenance", Reliability Engineering & System Safety, Vol. 253, pp. 110550, Jan. 2025. [https://doi.org/10.1016/j.ress.2024.110550]
  • N. Yao, Y. Jia, and K. Tao, "Rail weld defect prediction and related condition-based maintenance", IEEE Access, Vol. 8, pp. 103746-103758, Jun. 2020. [https://doi.org/10.1109/ACCESS.2020.2999385]
  • S. Y. Oh, C. Joung, S. Lee, Y. B. Shim, D. Lee, G. E. Cho, J. Jang, I. Y. Lee, and Y. B. Park, "Condition-based maintenance of wind turbine structures: A state-of-the-art review", Renewable and Sustainable Energy Reviews, Vol. 204, pp. 114799, Oct. 2024. [https://doi.org/10.1016/j.rser.2024.114799]
  • G. Xu, D. Hou, H. Qi, and L. Bo, "High-speed train wheel set bearing fault diagnosis and prognostics: A new prognostic model based on extendable useful life", Mechanical Systems and Signal Processing, Vol. 146, pp. 107050, Jan. 2021. [https://doi.org/10.1016/j.ymssp.2020.107050]
  • H. Dhungana, T. Rykkje, and A. S. Lundervold, "Bearing prognostics using the Pronostia data: A comparative study", IEEE Access, Vol. 13, Mar. 2025. [https://doi.org/10.1109/ACCESS.2025.3551772]
  • C. Semeraro, M. Caggiano, A. G. Olabi, and M. Dassisti, "Battery monitoring and prognostics optimization techniques: Challenges and opportunities", Energy, Vol. 255, pp. 124538, Sep. 2022. [https://doi.org/10.1016/j.energy.2022.124538]
  • J. Z. Kong, F. Yang, X. Zhang, E. Pan, Z. Peng, and D. Wang, "Voltage-temperature health feature extraction to improve prognostics and health management of lithium-ion batteries", Energy, Vol. 223, pp. 120114, May 2021. [https://doi.org/10.1016/j.energy.2021.120114]
  • O. Asif, S. A. Haider, S. R. Naqvi, J. F. Zaki, K. S. Kwak, and S. R. Islam, "A deep learning model for remaining useful life prediction of aircraft turbofan engine on C-MAPSS dataset", IEEE Access, Vol. 10, pp. 95425-95440, Sep. 2022. [https://doi.org/10.1109/ACCESS.2022.3203406]
  • R. K. Sharma, "Framework based on machine learning approach for prediction of the remaining useful life: A case study of an aviation engine", Journal of Failure Analysis and Prevention, Vol. 24, No. 3, pp. 1333-1350, Jun. 2024. [https://doi.org/10.1007/s11668-024-01922-w]
  • P. Li, Y. Pei, and J. Li, "A comprehensive survey on design and application of autoencoder in deep learning", Applied Soft Computing, Vol. 138, pp. 110176, May 2023. [https://doi.org/10.1016/j.asoc.2023.110176]
  • H. A. Salman, A. Kalakech, and A. Steiti, "Random forest algorithm overview", Babylonian Journal of Machine Learning, Vol. 2024, pp. 69-79, Jun. 2024. [https://doi.org/10.58496/BJML/2024/007]
저자소개
안 다 운 (Dawn An)

2015년 2월 : 한국항공대학교 기계공학과(공학박사)

2015년 5월 : University of Florida 기계항공공학과(공학박사)

2015년 5월 ~ 2016년 5월 : University of Florida 박사후 연구원

2016년 6월 ~ 현재 : 한국생산기술연구원 수석연구원

관심분야 : PHM, 고장예지, 신호처리, XAI

이 익 규 (Ikgyu Lee)

2023년 8월 : 성균관대학교 컴퓨터교육과(이학사), 전자전기공학부(공학사)

2023년 6월 ~ 현재 : 한국항공우주산업 연구원

관심분야 : PHM, CBM+, AI, Data Science

Fig. 1.

Fig. 1.
Failure frequency of major avionics equipment

Fig. 2.

Fig. 2.
Cumulative maintenance costs of avionics equipment over time

Fig. 3.

Fig. 3.
Flowchart of the proposed method

Fig. 4.

Fig. 4.
Results of variable importance estimation

Fig. 5.

Fig. 5.
File number corresponding to the top 30 variables in importance

Fig. 6.

Fig. 6.
File number corresponding to the top 30 variables in importance after considering physical significance

Fig. 7.

Fig. 7.
Raw data of the top 1 and top 30 variables

Table 1.

Main equipment unit price

Equipment New product Maintenance
A 30.00 1.56
B 82.22 2.22
C 48.89 6.39
D 63.33 6.33
E 5.00 1.56
F 144.44 10.89
G 7.78 1.00
H 100.00 10.00

Table 2.

Structure of input and output data for the random forest model

time index, t Input
(variable)
Output
(RUL)
0 - 76.7
1 X1:101, X1:102,, X1:10426t=1 75.6
2 X1:101, X1:102,, X1:10426t=2 74.6
3 X1:101, X1:102,, X1:10426t=3 71.0
23 X1:101, X1:102,, X1:10426t=23 0

Table 3.

Definition of the top 15 variables in importance

Ranking Variable number Variable definition
1 93 SECOND DIGIT OF UTC DAY
2 243 SA*****
3 90 FIRST DIGIT OF UTC SEC.
4 221 AC*****
5 379 TARGET TOGGLE
6 94 THIRD DIGIT OF UTC DAY
7 360 BE*****
8 366 AB*****
9 335 COORDINATE SYSTEM
10 224 AN*****
11 333 COORDINATE SYSTEM
12 85 RT*****
13 145 COMMAND WORD 2
14 395 JA*****
15 89 SECOND DIGIT OF UTC MIN.

Table 4.

Top 5 variables in importance across different numbers of trees

Num. of trees, n ranking 100 200 300 400 500
1 243 221 243 243 221
2 221 243 221 221 243
3 366 366 366 224 85
4 360 224 85 366 224
5 85 360 224 85 364

Table 5.

Definition of the top 15 variables in importance after considering physical significance

Ranking Variable number Variable definition
1 243 SA*****
2 221 AC*****
3 366 AB*****
4 85 RT*****
5 224 AN*****
6 223 MA*****
7 266 TA*****
8 46 PT*****
9 360 BE*****
10 364 RA*****
11 220 AC*****
12 395 JA*****
13 95 TI*****
14 131 HE*****
15 157 TA*****