Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 21, No. 2, pp.33-41
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 28 Feb 2023
Received 12 Dec 2022 Revised 10 Feb 2023 Accepted 13 Feb 2023
DOI: https://doi.org/10.14801/jkiit.2023.21.2.33

반려동물의 행동 분석을 위한 인공지능 기반의 웨어러블 센서 데이터 연구

서예진* ; 김현정** ; 문재준*** ; 이승호**** ; 김규석*****
*한국폴리텍대학 구미캠퍼스 전기과 조교수
**한동대학교 창의융합교육원 조교수
***펫터 CEO
****펫터 CTO
*****한국폴리텍대학 분당융합기술교육원 데이터융합SW과 조교수 서울대학교 환경대학원 도시계획학 박사수료(교신저자)
A Study on the Artificial Intelligence-based Wearable Sensor Data Pet Behavior Analysis
Yejin Seo* ; Hyunjung Kim** ; Jaejoon Moon*** ; Seungho Lee**** ; Kyuseok Kim*****

Correspondence to: Kyuseok Kim Dept. of Data Convergence Software Korea Polytechnics Tel.: +82-31-696-8832, Email: kyuseokkim@kopo.ac.kr

초록

최근 들어 반려동물을 양육하는 가정이 증가하고 있다. 국내 반려인은 현재 1,500만명으로, 앞으로도 관련 산업 및 시장 규모가 급격히 성장 중에 있다. 여러 가지 관련 서비스 중 반려동물의 헬스케어와 관련된 시장은 그 성장세가 가장 빠른 영역 중 하나이다. 이에, 본 연구에서는 반려동물의 헬스케어를 위한 웨어러블 디바이스를 개발하고 그 성능을 측정하였다. 구체적으로는 반려동물의 생체 데이터를 수집하여 인공지능 기반으로 이들의 행동 패턴을 분석할 수 있는 모델을 제안하였다. 본 연구에서 활용한 방법론은 CNN(Convolutional Neural Network), SVM(Support Vector Machine), RF(Random Forest)이다. 이들 모델 중 RF는 예측 정확도가 0.8999, 정밀도가 0.9008로 측정되어 시장에서 상용 가능한 수준의 성능을 보였다.

Abstract

The number of households raising pets has been recently increasing. There are currently 15 million of companions in Korea, and the related industries and markets are rapidly growing. Among them, the market for pet healthcare is one of the fastest growing ones. In this paper, therefore, a wearable device for pet healthcare was developed, and its performance was measured. Specifically, we proposed a AI(Artificial Intelligence) model that collects bioinformatics data for pets, and analyze their behavior patterns. The methodologies used in this paper are CNN(Convolutional Neural Network), SVM(Support Vector Machine), and RF(Random Forest). Among them, RF was measured with a prediction accuracy of 0.8999 and a precision of 0.9008, showing commercially available performance in the market.

Keywords:

multi-classification, CNN, SVM, random forest, bioinformatics

Ⅰ. 서 론

최근 1인 가구 증가와 저출산 및 고령화의 같은 사회현상으로 인해 반려동물을 양육하는 가정이 증가하고 있다. 최근 반려동물을 가족 구성원으로 인식하고 감정을 가진 하나의 인격체로 대우하는 현상인 펫 휴머나이제이션(Pet Humanization) 트렌드가 빠르게 확산하고 있다[1]. 따라서 반려인은 반려동물의 건강을 상시 점검해야 할 필요성이 커졌다. 그래서 반려동물에게도 사람과 유사한 의료 및 돌봄 서비스가 필요하게 되었고 기술의 발달과 함께 이와 관련된 반려동물을 위한 스마트 헬스케어 제품의 요구가 증가하기 시작하였다. 또한 최근에는 코로나19 팬데믹으로 인해 언택트 시대가 가속화되면서 다양한 반려동물을 위한 스마트 웨어 제품이 출시되고 있으며, 이와 함께 비대면 진료의 필요성도 대두되고 있다[2].

펫테크는 반려동물(Pet)과 기술(Technology)을 합성한 용어로, 반려동물 관련 용품에 빅데이터, 인공지능(AI) 등 첨단 ICT 기술이 접목되어 반려동물 양육에 도움을 주는 제품 및 서비스를 의미한다[3]. 펫테크 중에서 반려동물용 헬스케어는 반려동물의 건강관리에 직접적으로 관련 있는 제품 및 서비스를 의미한다. 국내외 반려동물 헬스케어 제품 및 서비스를 살펴보면 대부분은 활동량 분석과 그에 따른 권장 사료량이나 위치 추적 서비스 기술에 의존하고 있는 모습을 볼 수 있다.

본 연구에서는 실질적인 반려동물 헬스케어를 위해 웨어러블 디바이스와 전용 앱을 통해 반려견의 종별, 나이별, 성별 생체데이터를 취득하고, 이 생체데이터로부터 인공지능 기반의 행동패턴을 분석하는 연구를 수행하였다. 본 연구를 기반으로 추후에는 행동패턴으로부터 질병예측이 가능하게 함으로써 동반자로서의 반려동물에게 헬스케어 서비스를 확장하고 개체 맞춤형 건강관리의 새로운 비즈니스 모델의 확장에 대한 요구를 만족하게 하려는 데 그 목적이 있다.

본 논문의 구성을 다음과 같다. 2장은 관련 연구로서 펫테크와 관련된 문헌을 고찰한다. 3장에서는 본 논문에서 활용하는 데이터와 인공지능 연구 방법론에 대해서 기술하며, 4장에서는 이를 활용한 연구 결과에 대해서 설명한다. 마지막으로 5장에서는 결론에 대해 기술하고 본 연구가 갖는 한계점 및 향후 연구에 대하여 기술한다.


Ⅱ. 관련 연구

2.1 수의사의 강아지 진료 관련 질의

수의사마다 진료하는 스타일이 다르며 대개의 진료 과정은 아래와 같다[4][5].

첫 번째는 문진이다. 전문 용어로는 history taking이라고 한다. 나이, 성별, 사료의 종류와 양, 먹는 시간, 예방접종은 했는가, 새로 데려온 강아지라면 어디서 데려왔는가, 전에도 무슨 질병을 앓은 적이 있는 가 등 형사가 범인 취조하듯 많은 것을 물어봐야 한다. 문진은 상당히 중요하다. 문진을 잘하는 수의사가 유능한 수의사가 아닌가 싶다. 대개는 문진 과정에서 체온을 잰다.

두 번째는 시진, 촉진, 청진, 냄새 맡기이다. 문진이 끝나면 이곳저곳을 만져 보고, 눈으로 샅샅이 훑어 살펴보는 등의 과정을 거친다. 이 과정에서는 입 안을 보기도 하고, 눈을 뒤집어 보기도 하고, 귓속을 보기도 하고, 항문 주위를 보거나 냄새를 맡기도 하고, 피부와 털을 살펴보기도 한다. 배도 만져 보고, 폐와 심장의 소리도 듣는다. 팔다리의 움직임이나 전체적인 영양 상태 등도 함께 본다.

세 번째는 검사이다. 위의 두 단계가 끝나면 검사 단계에 들어간다. 별문제가 아닌 경우에는 간단하게 한두 가지만 검사하거나 아예 검사하지 않는 경우도 있지만, 어쨌든 위의 두 단계를 종합하여 수의사는 무슨 검사를 할 것인지 결정한다. 경우에 따라서는 한두 가지 검사 후에 또 다른 검사를 할 수도 있다.

네 번째는 판단이다. 검사 결과가 나오면 모든 자료를 토대로 ‘도대체 무슨 문제가 있는 것인지’를 판단해야 한다. 이때 수의사의 수의학 전문 지식과 그동안의 경험이 총동원된다. 때에 따라 쉽고 명쾌하게 답을 얻을 수도 있고, 어떤 경우에는 도대체 감이 잡히지 않을 때도 있다.

마지막은 치료이다. 이제 치료해야 한다. 간단하게 주사하고 먹는 약 주고 끝나는 경우도 있고, 입원 치료를 하거나 기타 필요한 치료를 할 수도 있다.

위와 같은 진료 순서에 따라 수의사는 진단 및 치료를 진행한다. 이러한 과정 중 가장 중요한 단계가 반려인과의 문진 단계이다. 그러나 반려동물은 질병 감춤 본능으로 병원에서는 발견할 수 없는 증상들이 있다. 그러므로 평소 반려동물의 건강 상태를 정확히 알 수 있는 반려인의 세심한 관리와 관찰이 필요하고 이상 증상에 대하여 정확히 수의사에게 설명하는 것이 진료에 있어 가장 중요한 과정이다. 그러나 반려인이 항상 반려동물과 함께 있을 수 없고 전문가 수준의 반려인이 아니라면 반려동물의 초기 건강 이상을 쉽게 발견하는 것은 어렵다. 그러므로 평상시 반려동물의 행동 패턴 및 생활 습관의 변화를 관리하는 것은 중증질환 예방을 위한 가장 중요한 건강관리 방법이다. 예를 들어 반려동물의 수면시간 및 활동 시간의 변화의 기록과 더불어 강아지에게 가장 많이 나타나는 중이염 및 피부 질환의 경우 몸을 긁거나 핥는 동작들은 반려동물의 동작 분석을 통하여 조기 질병 발견과 정확한 질병 진단을 위한 중요한 수단이다.

2.2 펫테크 관련 연구

신해웅 et al.(2020)은 IoT 센서가 내장된 양방향 통신이 가능한 웨어러블 디바이스를 통해 반려동물의 음성, 행동 데이터를 분석하였다[6]. 이 연구는 반려견의 음성인식 데이터를 분석하여 동물의 감정 상황을 지속적으로 모니터링 할 수 있다는 특징을 가진 연구였다. 그러나 IoT 기술에 있어서는 어떤 수단이 쓰였는지, AI 기술에 있어서는 어떤 방법론이 활용되어 상황에 대한 판단 정확도가 어떤지는 알 수 없었다.

한수연 et al.(2022)은 CCTV 영상을 통해 반려묘의 행동을 인식하여 AI를 기반으로 분석을 하는 시스템을 연구하였다[7]. 연구 방법론으로는 SVM, LSTM(Long Short-Term Memory)등을 활용하여 자세 예측, 행동 예측 등을 수행하였다. 이를 통해 반려묘의 행동뿐만 아니라 빈뇨, 다뇨 등의 질병도 예측할 수 있을 것으로 기대하였다. 그러나 해당 연구 모형의 예측과 판단 정확도를 계산하지 않아 정확한 정량적인 수치에 입각한 상용화 가능성은 모호한 것으로 판단된다.

송규호(2020)는 1~2인 가구 반려동물을 키우면서 빈번하게 발생할 수 있는 반려동물의 케어와 그에 따른 분리불안 문제를 해소할 수 있는 스마트 디바이스를 개발하였다[8]. 본 연구에서 개발한 디바이스는 공모양의 장난감으로서 반려동물과 사용자가 집에 함께 있을 때와 그렇지 않을 때인 두 가지 경우를 모두 해소할 수 있도록 구성하였다. 반려동물과 사용자가 집에 같이 있다면 이 디바이스의 Bluetooth 칩셋과 스마트폰을 통해 통신하여 사용자가 스마트폰으로 조작할 수 있게 구성하였다. 그리고 사용자가 밖에 있는 경우에는 장난감 내부 시스템의 모션인식 센서 등을 통해 이 디바이스가 자동으로 움직일 수 있도록 구성하였다. 본 연구에서는 반려동물의 분리불안 문제의 해결에 도움이 될 수 있는 디바이스를 개발하였으나 동작 관련 데이터 수집 등을 통해 반려동물의 활동 상황 등을 확인하거나 예측할 수 있는 부분은 구현되지 않았다.

이지훈 et al.(2022)은 영상 데이터와 센서 데이터를 활용하여 반려동물의 이상행동 탐지 서비스를 제안하였다[9]. 연구 데이터는 CCTV 이미지 데이터와 목줄형 웨어러블 디바이스의 센서 데이터이다. 그리고 연구 방법론으로는 CNN-BiLSTM 모델을 활용이며 달리기, 걷기, 서기, 앉기, 눕기 등 5가지의 행동을 판단하였다. 이 모델을 평가하기 위하여 정확도, 재현율, F1-Score를 산출하였으며 0.89에서 1.0 사이의 정확도를 보였다. 결과적으로, 본 연구에서는 높은 정확도의 결과물을 도출하였다.

2.3 본 연구의 차별점

기존 연구들과 대비하여 본 연구는 다음과 같이 3가지의 차별점이 있다.

첫째, 본 연구에서는 반려동물 행동 패턴 분류를 위해 차제 제작한 반려동물용 웨어러블 디바이스를 이용하여 생체 데이터를 수집하였다. 본 연구에서 생체데이터는 반려동물의 움직임에 대한 데이터이며 수집된 데이터를 이용하여 반려동물의 수면, 휴식, 걷기, 뛰기, 핥기, 몸털기 등의 시간과 빈도 그리고 강도 등에 관한 생체데이터를 분석한다. 이 웨어러블 디바이스는 목걸이 형태로 반려동물 착용 시 불편함이 없도록 아래 표 1그림 1과 같이 소형화와 경량화 설계로 개발되었다.

Specification of wearable device for pet

Fig. 1.

Wearable device for pet

둘째, 시판 중인 제품을 대부분 IMU 3축 센서이나 본 연구에서는 IMU 6축 센서로부터 얻은 데이터이므로 다양한 행동 패턴 분류 및 행동 분석의 정확도를 보다 높일 수 있다.

셋째, 반려동물 생체 데이터를 실시간으로 추출할 수 있는 웨어러블 디바이스 전용 모바일 앱을 이용하여 데이터 분류 및 라벨링의 정확도를 크게 향상시켰다.


Ⅲ. 연구 방법

3.1 연구 데이터

본 연구에서는 아래 그림 2와 같이 펫터에서 개발 중인 웨어러블 디바이스를 강아지에게 착용하여 얻어진 데이터를 활용하였다.

Fig. 2.

Wearable device and app for pet

해당 강아지와 데이터 수집 관련 정보는 표 2와 같다. 본 연구에서 활용된 데이터는 약 8kg의 미니어처 푸들로부터 수집되었다. 데이터의 수집 주기는 200ms이며, 총 8,888건이 수집되었다. 따라서 이 데이터의 수집 시간은 약 15분이다.

Information on dog and data collection

아래 표 3과 같이 이 디바이스의 가속도 센서와 자이로 센서로부터 200ms 주기로 얻어지는 x, y, z 값을 활용하였다. 그리고 강아지의 행동에 대해서는 정지, 걷기, 뛰기, 몸털기 등 총 4가지로 구분하여 라벨링을 하였다.

Experimental data sets

본 웨어러블 디바이스에서 활용된 가속도 센서와 자이로 센서의 값의 측정 범위와 해석 방법은 아래 표 3과 다음과 같다. 가속도 센서의 출력값 범위는 –32,768 ~ 32,767이며 표현 범위는 -4g ~ +4g이다. 따라서, 가속도 센서의 출력값 1은 0.122g [m/s2]이 된다. 그리고 자이로 센서의 출력값 범위는 –32,768~32,767로 표현 범위는 –2000 [deg/s] ~ +2000 [deg/s]이다. 따라서, 자이로 센서 값 1당 0.07 [deg/s]가 된다.

3.2 연구 방법론

본 연구에서는 강아지의 행동을 정지, 걷기, 뛰기, 몸털기 등 4가지로 분류하기 위하여 머신러닝 기반의 대표적인 다중 분류 방법론 세 가지를 활용한다. DNN(Deep Neural Network)의 심층 기법인 CNN과 Decision Tree 기반의 RF, 그리고 Vector 기반의 SVM을 활용한다. 이 세 가지 다중 분류 기법을 활용하여 분류의 정확도를 측정하고 비교해 본다.

첫 번째로 활용한 CNN 모델은 하나 또는 여러 개의 convolutional layer, pooling layer, fully connected layer로 구성되어있다[10][11]. CNN 모델은 주로 영상 복원, 분류를 하는데 사용되는 방법론이나 최근에는 데이터 분류에도 활용되고 있다. 구조는 크게 두 부분으로 나뉠 수 있다. 하나는 데이터의 특징을 추출하는 부분과 다른 하나는 분류하는 부분으로 나눌 수 있다. 먼저 데이터의 특징을 추출하기 위해 convolutional layer에서는 필터를 사용하여 convolution을 계산하고 그 결과로 feature map을 생성한다. 추출한 특징은 활성 함수를 통해 데이터의 특징을 비교한다. pooling layer에서는 convolutional layer 사이에서 파라미터의 수나 계산수집된 샘플 수량을 최소화하기 위해 사이즈를 줄여준다. 이를 통해 다운 샘플링을 수행하고, 오버피팅도 조절할 수 있다. 그리고 데이터를 분류하기 위해 fully connected layer에서 뉴런들을 모두 연결하여 최종적으로 데이터를 분류한다.

두 번째로 활용한 RF 모델은 decision tree ensemble을 이용한 분류기로, 이진 분류를 기본으로 하고 있다[12]. 그리고 빠른 훈련 속도를 가지며 많은 양의 데이터를 실행시키는데도 적절한 분류기이다. 여러 개의 decision tree를 형성하고 새로운 데이터 포인트를 각 트리에 통과시킨다. 그리고 각 트리가 분류한 결과에서 많이 득표한 결과를 최종 분류 결과로 선택하는 것이다.

세 번째로 활용한 SVM 모델은 특징 기반 분류기로서 특징 공간에 있는 특징들을 분리할 수 있는 초월평면을 결정하는 방법이다[13]. 다시 말하면, SVM은 분류를 위하여 기준선을 정의한다. 이를 결정 경계(Decision Boundary)라고 부른다. 예를 들어, 속성이 A와 B로 두 개만 있다고 가정하고, 결정 경계를 설정한다. 그러면 결정 경계의 한 쪽은 A로 판단하고, 다른 한쪽은 B로 판단하는 기법이다.

일반적으로 모델의 정확도를 평가하는 방법으로는 MSE(Mean Squared Error), MAPE(Mean Absolute Percentage Error) 등이 있다[14]. 그러나 본 연구 모델의 종속변수는 0에서 3까지의 정수형 숫자를 내고, 0과 3까지의 숫자가 활동의 정도를 나타내는 것은 아니기에 이로 평가하기는 어렵다.

그래서 본 연구에서는 대표적인 분류 성능의 평가 지표인 Precision, Recall, Accuracy, F1-score을 활용한다. 이를 활용하기 위하여 아래 표 4와 같은 Confusion matrix를 기본으로 한다. Confusion matrix의 가로 행은 예측된 결과값이며, 세로 행은 실제의 값이다. 첫째, 실제의 값은 1이고, 예측된 결과값도 1일 때를 TP(True Positive)라고 한다. 둘째, 실제의 값은 0이고, 예측된 결과값도 0일 때를 TN(True Negative)라고 한다. 이 두 가지 경우는 실제의 값과 예측된 결과값이 일치한 경우이다. 셋째, 실제의 값은 0인데 예측된 결과의 값이 1일 때에는 FP(False Positive)라고 한다. 마지막으로 실제의 값은 1인데 예측된 결과의 값이 0일 때에는 FN(False Negative)라고 한다. 이 두 가지의 경우는 실제의 값과 예측된 결과의 값이 불일치한 경우이다.

Confusion matrix

본 연구에서는 최종적으로 표 4에서의 Confusion matrix 원소를 활용하여 Accuracy, Precision, Recall, F1-Score 등 4가지 방법론을 활용한다. 각 방법론을 구하는 식은 아래 (1)부터 (4)와 같다.

Accuracy는 실제의 값과 예측된 결괏값을 비교했을 때 얼마나 같은지를 판단하는 방법이다. Accuracy는 아래 식 (1)과 같이 분모는 전체 경우의 수가 되고, 분자는 그중 일치한 결과의 수가 된다.

Accuracy=TP+TNTP+TN+FP+FN(1) 

Precision은 Positive로 예측된 결괏값 중 실제의 값이 Positive인 것의 비율을 의미한다. Precision은 아래 식 (2)과 같이 분모는 Positive로 예측한 전체 경우의 수가 되고, 분자는 Positive로 예측한 것 중 실제 값도 Positive로 일치한 결과의 수가 된다.

Precision=TPTP+FP(2) 

Recall은 실제의 값이 Positive인 것들 중에서 예측과 실제의 값이 Positive로 일치한 것의 비율이다. Recall은 아래 식 (3)과 같이 분모는 실제의 값이 Positive인 전체 경우의 수가 되고, 분자는 그 중 일치한 결과의 수가 된다.

Recall=TPTP+FN(3) 

F1-Score는 Precision과 Recall을 조합하여 두 값이 0에 가까울수록 F1-Score도 낮은 값을 갖도록 하게 하는 조화 평균이다. F1-Score는 아래 식 (4)와 같이 Precision과 Recall 곱의 두 배를 두 값의 합으로 나눈 값이 된다.

F1-Score=2×Precision×RecallPrecision+Recall(4) 

3.3 연구 모형 및 관련 설정

본 논문에서 활용하는 인공지능 연구 모형은 아래 식 (5)와 같다. 종속변수인 애완동물의 행동인 ACT를 분류하기 위하여 x, y, z 평면의 가속도 센서값과 자이로 센서값을 독립변수로 설정한다.

ACTi=β0+β1ACXi+β2AXYi+β3ACZi  +β4GYXi+β5GYYi+β6GYZi+ϵ(5) 

각 연구 모형별 설정값은 아래 표 5와 같다. CNN 모델은 학습 횟수인 epochs는 10부터 200까지 10씩 증가시키고, 학습 단위인 batch_size는 1로 고정한다. RF 모델은 생성할 의사 결정 나무 개수를 10부터 200까지 10씩 증가시키고, 의사 결정 나무의 깊이인 max_depth는 10부터 200까지 10씩 증가시킨다. 그리고 SVM 모델의 설정값은 default로 두고 5회 반복 수행한다. 이렇게 각 설정 값별로 얻어진 모델의 평가 지표를 비교하여 모델별 최적의 설정값을 찾는다.

Settings values for research model


Ⅳ. 연구 결과

4.1 기술 통계

본 연구에서는 활용한 데이터의 기술 통계를 산출하면 아래 표 6와 같다. 가속도 센서로 부터 얻어진 x, y, z 값의 평균은 각 –3.83, -205.21, 31.14로 약 –0.4673ms2, 약 –25.0356ms2, 약 3.7991ms2임을 알 수 있다. 그리고 자이로 센서로 부터 얻어진 x, y, z 값의 평균은 각 208.95, -699.56, -154.33으로 약 14.6265[deg/s], 약 –48.9692[deg/s], 약 10.8031[deg/s] 임을 알 수 있다.

Descriptive statistics(n=8,888)

그러나 ACY 값을 제외한 모든 값의 표준편차 절대값이 평균의 절대값 보다 크기에 산포의 범위가 매우 넓음을 알 수 있다.

4.2 인공지능 모델별 예측 정확도 비교

본 연구에서 활용하는 CNN, RF, SVM 모델의 설정값의 변경 또는 반복 수행 후 모델 예측 정확도의 기술 통계를 수행하였다. 그 결과는 아래 표 7과 같다.Accuracy, Precision, Recall, F1-Score 값은 각 모델별로 큰 차이는 없었으나 최소값, 최대값, 평균값 등의 차이는 존재하였다. 이는 각 모델의 설정값에 따라 Accuracy, Precision, Recall, F1-Score는 달라질 수 있다는 것을 의미한다. 각 모델의 지표별 평균값을 비교하면 RF 모델은 0.8999에서 0.9004로 SVM 모델의 0.8419에서 0.8493이나 편차가 큰 CNN 모델의 0.5279에서 0.9183보다 높고, 안정적임을 알 수 있었다.

Model evaluation result

표 7을 통해 CNN과 RF 모델의 각 지표별 최고값을 보이는 설정값은 아래 표 8과 같다. CNN 모델은 epochs가 60에서 90일 때 Accuracy, Precision, Recall, F1-Score가 최고치를 보였다. 그리고 RF 모델은 4개의 지표 모두 n_estimator가 200, max_depth가 30일 때 최고치를 보임을 알 수 있었다. SVM 모델은 같은 설정값으로 5회를 반복하였으며 각 지표별 값의 차이는 크지 않았음을 알 수 있다.

Optimal model settings


Ⅴ. 결론 및 향후 과제

최근 1인 가구의 증가, 저출산 및 고령화와 같은 사회현상으로 인해 반려동물을 양육하는 가정이 증가하고 있다. 그리고 반려동물을 하나의 인격체로 대우하여 반려인은 반려동물에 대한 건강도 항상 신경쓰고 있다.

본 연구에서는 반려동물의 헬스케어를 위한 소형화, 경량화의 웨어러블 디바이스를 자체적으로 개발하여 반려동물의 생체 데이터를 수집하고 이를 활용한 인공지능 기반의 행동 패턴을 분석하였다.

연구 데이터로는 약 8kg의 미니어처 푸들 종의 강아지로 수집된 약 15분간의 데이터이다. 이 데이터는 정지, 걷기, 뛰기, 몸털기 등 4가지의 행동으로 구분하여 라벨링을 하였다. 그리고 이 데이터는 머신러닝 기반의 다중 분류 방법론인 CNN, SVM, RF를 통해 분류, 예측하였다. 연구 결과, 세 가지의 방법론 중 RF 모델의 예측 정확도, 정밀도, 재현율, F1-Score는 최고 0.8999에서 0.9004로 적은 편차로 높은 값을 보임을 알 수 있었다.

추후 연구에서는 본 연구에서 활용한 웨어러블 디바이스를 기반으로 더 많은 반려동물로부터 데이터를 수집하여 독립변수를 추가함으로써 모델의 적용 범위와 정확도를 높일 수 있을 것이다. 또한, CNN, SVM, RF 외 추가적인 다중 분류 기법을 활용할 수 있을 것이다. 이를 통해 높아진 예측 정확도를 기반으로 반려동물의 질환을 예측할 수 있는 기저 데이터로 활용될 수도 있을 것이다.

Acknowledgments

이 논문은 과학기술정보통신부(한국산업기술진흥협회 전문기관)에서 시행한 2022년 2차 기술애로해결 지원사업(R&D 심화컨설팅)의 지원을 받아수행된 연구입니다

References

  • W. K. Hwang and K. P. Son, "2021 Korea Companion Animal Report", KB Financial Goup Inc. Management Research Institute, pp. 16-17, 2021.
  • Y. J. Choi, S. Y. Kim, I. H. Sul, and H. R. Lee, "Smart Wearable Healthcare Technology Trend and Prospect for Companion Animals for the Untact Era", Proc. of the 2020 Fall Conference of Korean Society for Emotion and Sensibility, Daejeon, pp. 59, Dec. 2020.
  • K. H. Park, "Latest trends in the growing pet care industry and ways to strengthen global competitiveness of Korean companies", Korea International Trade Association, Jan. 2022.
  • S. G. Lee, "The Direction of Pet Care", WITH CAP(COMPANION ANIMAL PRACTICE), Vol. 1, No. 1, pp. 18-29, Mar. 2003.
  • D. G. Park "a pleasent veterinarian's 24 hour of animal hospital", Bookie, pp. 162-164, 2005.
  • H. W. Shin and J. S. Kim, "A Study on the Development of Wearable Products Applied to PetTech Service Using IoT and AI Technology", Journal of the Korean Society of Design Culture, Vol. 26, No. 1, pp. 261-272, Mar. 2020. [https://doi.org/10.18208/ksdc.2020.26.1.261]
  • S. Y. Han and D. W. Park, "Cat Behavior Pattern Analysis and Disease Prediction System of Home CCTV Images using AI", Journal of the Korea Institute of Information and Communication Engineering, Vol. 26, No. 9, pp. 1266-1271, Sep. 2022.
  • K. H. Song, "Development of Smart Device To Resolve Separation Anxiety of Pet", Journal of Basic Design & Art, Vol. 21, No. 1, pp. 281-293, Feb. 2022. [https://doi.org/10.6109/jkiice.2020.24.10.1384]
  • J. H. Lee, M. C. Shin, J. H. Park, and N. M. Moon, "Deep Learning-Based Companion Animal Abnormal Behavior Detection Service Using Image and Sensor Data", Journal of The Korea Society of Computer and Information, Vol. 27, No. 10, pp. 1-9, Oct. 2022. [https://doi.org/10.9708/jksci.2022.27.10.001]
  • S. J. Ha, D. W. Lee, H. J. Kim, E. J. Kim, S. C. Kwon, and S. H. Lee, "A Study on the Performance Comparison of Neural Network for Metal Detection Based on MI Sensor", Journal of Industrial Technology Research, Vol. 27, No. 2, pp. 113-124, Jun. 2021. [https://doi.org/10.29279/kostet.2021.26.2.113]
  • T. Guo, J. W. Dong, H. Li, and Y. Gao, "Simple convolutional neural network on image classification", IEEE 2nd International Conference on Big Data Analysis (ICBDA), Vol. 9, No. 2, pp. 721-724, Mar. 2017. [https://doi.org/10.1109/ICBDA.2017.8078730]
  • B. Leo, "Random Forests", Machine Learning, Vol. 45, No. 1, pp. 5-32, Oct. 2001. [https://doi.org/10.1023/A:1010933404324]
  • C. Ehrentraut, M. Ekholm, H. Tanushi, J. Tiedemann, and H. Dalianis, "Detecting hospital-acquired infections: A document classification approach using support vector machines and gradient tree boosting", Health Informatics Journal, Vol. 24, No. 1, pp. 24-42, Mar. 2018. [https://doi.org/10.1177/1460458216656471]
  • D. Chicco, M. J. Warrens, and G. Jurman, "The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation", PeerJ. Computer science, Vol. 7, pp. 1-24, Jul. 2021. [https://doi.org/10.7717/peerj-cs.623]
저자소개
서 예 진 (Yejin Seo)

2002년 2월 : 울산대학교 전기전자자동화공학부(공학사)

2004년 2월 : 울산대학교 전기전자정보시스템공학부(공학석사)

2015년 2월 : 울산대학교 전기전자컴퓨터공학과(공학박사)

2020년 ~ 현재 : 한국폴리텍대학 구미캠퍼스 전기과 조교수

관심분야 : 시스템제어, 신호처리, 머신러닝, 딥러닝

김 현 정 (Hyunjung Kim)

2010년 2월 : 한동대학교 경제학사, 경영학사, 도시환경공학(부전공)

2012년 2월 : 서울대학교 건설환경공학(공학석사)

2015년 9월: The University of Tokyo 도시공학(공학박사)

2017년 : Environmental Systems Research Institute(ESRI) Korea, Manager 과장

2021년 ~ 2022년 : 서울대학교 건설환경종합연구소 연구교수

2022년 ~ 현재 : 한동대학교 창의융합교육원 조교수

관심분야 : 도시 및 지역계획, 스마트시티, 시공간 빅데이터 분석, 도시공간분석, GIS, 공간AI

문 재 준 (Jaejoon Moon)

1998년 02월 : 동국대학교 반도체과학과(이학사)

2000년 02월 : 동국대학교 반도체과학과(이학석사)

2000년 ~2017년 : 삼성전자(종합기술원)삼성DMC연구소 전문·책임연구원

2021년 06월 ~ 현재 : 펫터 CEO

이 승 호 (Seungho Lee)

1996년 02월 : 숭실대학교 전자공학과(공학사)

2010년 02월 : 경희대학교 스포츠의과학과(체육학석사)

1996년 ~ 2012년 : 삼성전자(종합기술원) 책임연구원

2019년 ~ 2021년 : ㈜지아이피앤이 대표

2021년 06월 ~ 현재 : 펫터 CTO

김 규 석 (Kyuseok Kim)

2011년 2월 : 한국항공대학교 정보통신공학(공학사)

2019년 8월 : 아주대학교 정보통신공학(공학석사)

2023년 2월 현재 : 서울대학교 도시계획학 박사수료

2019년 6월 : LG전자(주) 선임연구원

2020년 2월 : ㈜LG유플러스 책임연구원

2020년 ~ 현재 : 한국폴리텍대학 분당융합기술교육원 데이터융합SW과 조교수

관심분야 : 데이터 수집, 데이터 분석, 머신러닝, 딥러닝, 도시계획, 근거리 무선통신, 상황인지

Fig. 1.

Fig. 1.
Wearable device for pet

Fig. 2.

Fig. 2.
Wearable device and app for pet

Table 1.

Specification of wearable device for pet

Size(W x H x D) [mm] Weight[g]
53.2 x 25.8 x 10.8 15

Table 2.

Information on dog and data collection

Category Description
Breed Miniature poodle
Weight 8kg
Length 420mm
Height 370mm
Neck circumference 280mm
Hair length 3mm
Data collection cycle 200ms
Number of collected samples 8,888

Table 3.

Experimental data sets

Category Coordinate
plane
Abbr. Range of output
values
Accelerometer x ACX -32,768∼32,767
y ACY
z ACZ
Gyroscope x GYX
y GYY
z GYZ
Action - ACT 0 : Stop
1 : Walk
2 : Run
3 : Shake

Table 4.

Confusion matrix

Predictive values
Positive Negative
Actual values Positive TP FN
Negative FP TN

Table 5.

Settings values for research model

Research model Setting Value Misc.
CNN epochs 10 ∼ 200 by 10+
batch_size 1
RF n_estimator 10 ∼ 200 by 10+
max_depth 10 ∼ 200 by 10+
SVM 5 repetitions with the same settings

Table 6.

Descriptive statistics(n=8,888)

Minimum Maximum Mean STD.DEV
ACT 0 3 0.69 0.63
ACX -636 356 -3.83 124.69
ACY -632 124 -205.21 153.67
ACZ -593 306 31.14 92.45
GYX -32,559 32,556 208.95 7,836.62
GYY -32,073 32,269 -699.55 7,515.59
GYZ -32,254 32,511 -154.33 8,173.14

Table 7.

Model evaluation result

Accuracy Precision Recall F1-score Misc.
CNN Min. 0.5381 0.4092 0.6322 0.5594
Max. 0.5861 0.5279 0.9183 0.6155
Avg. 0.5632 0.4583 0.8423 0.5897
STD. 0.0156 0.0353 0.0923 0.0203
RF Min. 0.7495 0.7541 0.7495 0.7519
Max. 0.8999 0.9008 0.8999 0.9004
Avg. 0.8885 0.8895 0.8885 0.8890
STD. 0.0280 0.0270 0.0280 0.0275
SVM - 0.8436 0.8493 0.8436 0.8419

Table 8.

Optimal model settings

Standard Value Setting Value
CNN Accuracy 0.5861 epochs 70
batch_size 1
Precision 0.5279 epochs 90
batch_size 1
Recall 0.9183 epochs 60
batch_size 1
F1-Score 0.6155 epochs 70
batch_size 1
RF Accuracy 0.8999 n_estimator 200
max_depth 30
Precision 0.9008 n_estimator 200
max_depth 30
Recall 0.8999 n_estimator 200
max_depth 30
F1-Score 0.9004 n_estimator 200
max_depth 30