Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 22, No. 4, pp.121-138
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 30 Apr 2024
Received 15 Feb 2024 Revised 19 Mar 2024 Accepted 22 Mar 2024
DOI: https://doi.org/10.14801/jkiit.2024.22.4.121

머신러닝 기반 돼지의 미래 활동 지수에 영향을 미치는 요인과 예측에 관한 연구

조예성* ; Nabilah Muallifah* ; Fachrina Dwei Puspitasari* ; 김유승* ; Mhd Anas Al Saidi* ; 이문용**
*KAIST 데이터사이언스대학원
**KAIST 산업및시스템공학과 교수(교신저자)
A Machine Learning-based Study of Factors and Predictions of the Future Activity Index of Pigs
Yesung Cho* ; Nabilah Muallifah* ; Fachrina Dwei Puspitasari* ; Yusung Kim* ; Mhd Anas AI Sadi* ; Munyong Yi**

Correspondence to: Munyong Yi Dept. of Industrial and Systems Engineering, KAIST, 291, Daehak-ro, Yuseong-gu, Daejeon, Korea Tel.: +82-42-350-1613, Email: munyi@kaist.ac.kr

초록

활동 지수(Activity index)는 양돈에서 활용되는 돼지 무리의 활동 수준을 평가하는 도구로, 돼지의 건강, 신체 성장, 행동 및 생활 환경의 질을 나타내는 중요한 지표다. 그러나 대규모 양돈장에서는 막대한 자원이 할당되고 기록 결과가 일관되지 않을 가능성이 있기 때문에 돼지 활동을 수동으로 관찰하는 것은 현실적으로 어렵다. 따라서 본 연구는 가까운 미래의 활동 지수를 예측하여 돼지 활동 수준을 자동으로 모니터링하는 방법을 모색하는 것을 목표로 한다. 우리는 영상의 배경 제거(Background subtraction) 방법을 활용하여 활동 지수를 계산했다. 또한, 생물학적 특성, 및 외생적 사건의 발생을 포함한 다양한 농장 속성을 고려하여, 활동 지수와 농장 속성 간의 상관 관계를 분석하여 활동 지수의 변화에 영향을 미치는 주요 속성을 파악했다.

Abstract

The term activity index refers to a measure of the activity level of pig herds that has been applied as an assessment tool in pig farming practice. The index has become an indicator of pig’s health, physical growth, behavior control, and quality of living conditions. In large-scale pig farms, however, manual observation of pig activity is impractical due to huge resource and potentially inconsistent recording results. Thus, our study aims to explore the automatic monitoring of pig activity level by predicting the near feature activity index. We calculated the activity indexes by utilizing background subtraction techniques from video frames. Further, we also harnessed other farming attributes including biological characteristics and the occurrence of exogenous events. Our analysis uncovers the relationship between activity index and these farming attributes, and pinpoints several attributes that influence the change in activity index.

Keywords:

pig welfare, smart farming, activity index prediction, background subtraction, video analysis

Ⅰ. 서 론

산업의 신속한 발전과 세계 경제의 안정적인 성장으로 소비자들은 안정적인 열량 공급과 고품질 안전 식품을 확보하는 중요성에 대해 인식하고 있다[1][2]. 결과적으로, 고품질 고기를 선호하는 소비자들의 선호를 충족하기 위해 시장은 빠르게 변화하고 있다[3]. 또한, 식품 생산 관행과 동물 복지에 대한 소비자들의 인식이 높아지면서 고품질의 윤리적으로 양육된 돈육에 대한 수요가 증가하고 있다[4]. 이에 대응하여, 소비자들은 이러한 제품에 프리미엄을 지불할 의사가 있다는 것이 밝혀졌다[4]. 이러한 수요를 충족하고 소비자들의 기대에 부응하기 위해, 돼지의 복지와 웰빙을 우선시하는 복지 중심의 더 많은 돈육 농장을 설립하는 것이 권장된다. 복지 중심의 관행을 채택함으로써, 이러한 농장은 돼지의 건가와 성장을 촉진함으로써 우수한 품질의 돈육 생산에 기여할 수 있다[5][6]. 농장에서의 돼지의 복지는 양육 돼지의 성장률, 누운 행동, 그리고 꼬리 물기와 관련이 있음이 밝혀졌다[7]. 돈육 복지의 향상은 품질 향상의 영역을 넘어서 경제적 이점을 가지고 있다. 이러한 이점에는 생산성과 효율성이 증가하는 것이 포함된다[8]. 건강하고 만족한 돼지들은 더 잘 먹고, 더 빨리 자라며, 사료 영양소를 체중으로 효율적으로 전환하기 때문에 복지는 성장과 사료 효율성의 향상으로 이어질 수 있다는 것을 나타낸다[9]. 또한 복지 중심의 양육은 수의학 비용 절감으로도 이어져 양돈 운영의 경제성에도 기여할 수 있다[6]. 이러한 점들을 고려할 때, 농가가 기존의 체중 중심(Weight-centered)의 양돈 방식에서 벗어나 복지 중심(Weflare-centered)의 접근 방식을 수용해야 할 필요성이 높아졌다.

돼지의 복지를 평가하기 위해 활동 지수(Activity index)는 건강, 신체 성장, 행동 및 환경에 관한 정보를 제공하기 때문에 중요한 지표 중 하나이다. 돼지의 활동 지수 변화는 감염과 같은 건강 문제, 스트레스 유발, 그리고 공격적인 행동과 같은 문제를 나타낼 수 있다[10][11]. 돼지의 활동 지수는 또한 꼬리 물기를 감지하는 가장 유망한 요인 중 하나로 밝혀졌다[12][13]. 이는 전통적인 양식 환경에서 꼬리 물기가 돼지의 복지에 심각한 문제로 작용한다[14]. 높은 활동 지수는 꼬리 물기 발생 가능성을 시사할 수 있다[13]. 돼지는 환경 변화에 대응하여 바닥에서의 활동 및 활동 시간을 수정하기 때문에 활동 지수는 생활 조건을 묘사할 수도 있다[15]. 따라서 활동 지수를 모니터링함으로써 농부와 동물 복지 감사원은 조기에 잠재적인 건강 또는 스트레스 문제를 식별하고 적절한 조치를 취할 수 있다.

농부들은 전통적으로 활동 지수를 수동적으로 모니터링하여 가축의 웰빙과 건강을 평가하고 환경, 경영 기술 또는 의료 치료를 조정한다[16][17]. 그러나 농장 규모와 가축 수의 증가로 인해 개별 모니터링은 어려워지며 주요 지표를 놓치기 쉽다[16][18]. 또한 농부들은 동물의 편안함을 평가할 수 있을지 모르지만, 이 판단은 사람마다 다를 수 있다[19]. 마찬가지로, 카메라 녹화물의 수동 평가도 주관적인 편향이 있을 수 있으며, 신뢰성을 위해 관찰자 교육이 필요하다[14]. 결과적으로 수동 관측은 직접적인 것과 비디오 기반의 것 모두 상업적 규모에서는 비용이 많이 들고, 시간이 많이 소요되며, 노동 집약적이며, 현실적으로 불가능하다[20]. 움직임을 측정하기 위해 이동 가능한 가속도계를 부착하는 등의 다른 방법도 비용이 많이 들고 돈사에 사람이 개입하는 문제가 존재한다[21][22]. 따라서 상업적 농장에서 동물 복지를 유지하기 위해 더 효율적인 방법이 필요하다.

이미지 처리 기술이 개선됨에 따라, 동물의 지수를 사람이 돈사에 침입하지 않고도 자동으로 측정하기 위한 다양한 연구가 수행되었다. 대표적으로는 돼지 우리 내의 촬영 영상 데이터를 사용하여 활동 지수를 결정하는 것이다. 이전 연구들은 운동을 식별하기 위해 통계 기반의 알고리즘을 사용했다. 예를 들어, 동영상의 연속된 프레임 간의 픽셀 차이 값을 측정하거나, 운동을 식별하기 위해 광학 흐름을 사용했다[23]-[30]. 최근에는 딥러닝이 발전함에 따라 학습 기반의 방법을 사용하여 활동 지수를 결정하는 연구가 수행되었다 [14][31]. 예를 들어, [14]은 합성곱 신경망 모델(CNN, Convolution Neural Network)을 사용하여 이상 탐지를 수행하고, 장단기 기억 모델(LSTM, Long Short-Term Memory Network)을 사용하여 이상 점수를 계산하여 활동 지수를 고려한 이상 정도를 측정했다.

기존 연구들은 행동 감지를 위한 보조 지표로 활동 지수를 사용해 왔지만, 활동 지수의 분석과 예측은 아직 충분히 연구되지 않았다. 동물과 환경 간의 복잡하고 동적인 상호작용은 이상 현상 및 개선 기회를 해결하기 위해 선제적인 자원 할당을 요구한다. 따라서 사전에 사건의 발생을 예측함으로써 농장 관리자들은 이상 현상이나 개선 기회에 대응하기 위해 필요한 자원을 효과적으로 할당할 수 있다[32]. 예를 들어, 농부들은 활동 지수에서 예상되는 이상 현상에 대해 조기에 파악하여 돼지의 복지를 평가하고 적절히 대비할 수 있다. 따라서 본 연구는 카메라 녹화로부터 얻은 과거 활동 데이터를 기반으로 미래 활동 지수를 예측하는 것을 목표로 한다. 또한 예측 과정에서 활동 지수를 설명하는 중요한 요소를 연구하고 그 영향을 분석한다.

본 논문은 다섯 부분으로 구성된다. 서론(1장)에서는 연구의 기초를 설정하고 목표를 설명한다. 관련 연구(2장)에서는 돼지의 활동 지수를 측정하고 영향을 미치는 요인에 대한 이전 연구들을 탐구한다. 데이터 및 방법론(3장)에서는 돼지의 미래 활동 지수를 예측하기 위해 사용된 데이터셋, 계산 및 예측 방법을 개요로 설명한다. 결과 및 토의 부분(4장)에서는 예측 방법으로 얻은 결과, 각 예측 변수의 함의, 그리고 중요한 예측 오류가 있는 샘플에 대해 논의한다. 마지막으로 논문은 결론(5장)으로 마무리되며, 연구 결과를 요약하고 추가 연구에 대한 통찰력을 제공한다.


Ⅱ. 관련 연구

돼지의 미래 활동 수준을 모니터링하고 예측하는 효율성을 향상시키기 위해, 먼저 돼지의 활동 수준을 계산하는 기존 방법을 탐색한다. 더불어, 돼지의 활동 수준에 영향을 미칠 수 있는 다양한 요인들을 조사하여 그 중요성과 영향을 밝힌다.

2.1 돼지의 활동 지수의 응용

가축 농장에서 동물의 활동 지수 측정에 대한 연구는 다양한 목적으로 수행되었다. 전통적인 방법은 인간이 각종 조건에서 다양한 동물 행동의 빈도와 지속 시간을 수동으로 평가하기 위해 동물행동 체계를 사용하는 것이다. 예를 들어, [10]은 감염성 질병이 돼지의 전반적인 활동에 미치는 영향을 조사하여 감염 시 활동 지수가 기준치에 비해 감소하는 것을 발견했다. 마찬가지로, [14]는 스트레스 유발이 돼지의 행동에 미치는 영향을 조사하여, CRF 투여 후 특정 행동 및 전반적인 활동 및 공포 관련 행동의 빈도와 지속 시간이 증가하는 것을 발견했다. 그러나 이러한 연구들은 가치 있는 통찰력을 제공했지만, 수동적인 계산에 의존하는 한계가 있을 수 있다.

위 문제를 해결하기 위해, 이후 연구들은 동물의 활동 지수를 카메라 녹화의 픽셀 분석을 통해 측정할 수 있음을 보여주었다. 특히, 연속된 프레임 간의 픽셀 변화를 조사하여 활동 지수를 도출하는 것이다[33]. 이 방법은 돼지 활동을 분류하는 데에 있어서 인간의 관찰과 높은 일치성을 보였다[16][24]. 이는 돼지의 환경에 대한 반응을 조사하고 활동 지수를 측정하는 데에 유용한 통찰력을 제공했다[23]. 또한 임계값 분할 기술을 사용하여 돼지를 배경에서 분리하고 특정 우리 영역에서 돼지의 행동 패턴을 예측하는 데에 사용되었다[34][35].

움직임을 모니터링하기 위한 더 발전된 방법은 광학 흐름(Optical flow) 분석이다. 광학 흐름 분석은 연속된 비디오 프레임 간의 픽셀 간 차이를 평가하여 움직임의 방향과 속도에 대한 상세한 정보를 제공한다[33]. [27]은 비정상적인 움직임 탐지를 위해 광학 흐름 분석을 사용하여 돼지의 복지를 평가했다. 그들은 돼지의 광학 흐름 벡터를 수정된 각도 히스토그램으로 임베딩하여 서포트 벡터 머신(SVM, Support Vector Machine)을 활용하여 움직임을 인식했다. 또 다른 주목할 만한 연구인[36]은 아프리카 돼지 열병 바이러스에 감염된 돼지의 이미지에서 생성된 광학 흐름 벡터에 SVM을 활용하여 임상 증상이 나타나기 전에 활동 패턴의 변화를 식별하는 조기 경보 시스템을 구축하였다.

동물의 공격적인 행동을 수동으로 감시하는 문제를 해결하기 위해 다른 딥러닝 방법이 사용되었다.

[37][38]은 인공 신경망을 사용하여 동물 활동 수준을 기반으로 공격적인 행동을 분류하는 것을 탐구했다. 또한, [14]는 두 단계의 CNN 기반 프레임워크를 제안하여 비정상적인 활동 패턴을 식별하고 분류하는 데에 성공적으로 91%의 성공률을 달성했다. 이러한 모델들은 공격적인 행동을 정화하게 감지하는 데 중요한 잠재력을 보여주며, 돼지 양식 시스템에서의 공격적 상호 작용의 이해와 관리를 개선하는 데 기여한다.

2.2 돼지의 활동 지수에 영향을 미치는 요인

이전 연구들은 돼지의 활동 지수가 다양한 요인에 영향을 받는 것을 보여준다. 온도와 습도와 같은 환경 조건은 돼지의 활동 수준과 부정적인 상관 관계가 있다는 것으로 밝혀졌다 [39]. 이 외에도, 환경 개선은 돼지의 활동 지수를 증가시킨다는 것이 밝혀졌는데, 이는 돼지들이 탐험, 탐식, 놀이 및 사회적 상호 작용과 같은 활발한 행동을 더 많이 하도록 유도하기 때문이다[6][40]-[42]. 이전 연구들은 또한 사료 행동이 특히 성장-마감 단계 동안 돼지의 활동 수준과 긍정적인 상관 관계를 가지고 있음을 발견했다[43][44]. 모든 공격적 상호 작용의 90%가 먹이를 공급 중에 발생한다는 것이 알려져 있다. 마지막으로, 체중과 나이와 같은 생체학적 요인도 동물들의 활동 수준에 상당한 영향을 미치는데, 체중은 활동 수준과 부정적인 상관 관계르 가지고 있으며, 나이와 관련된 신체 활동의 감소는 주로 나이가 많은 돼지에서 발견된다[45]-[50].


Ⅲ. 데이터 및 방법론

3.1 데이터셋

돼지의 활동 지수를 계산하기 위해 본 연구는 공개된 에든버러 돼지 행동 비디오 데이터셋(Edinburg pig behavior video dataset)을 사용했다(그림 1). 이 데이터셋은 스코트랜드 농촌대학교 돼지 연구 센터(Scotland’s Rural college pig research center)에 있는 단일 돼지 우리에 양성돼 있는 여덟 마리의 성장 중인 돼지의 비디오 클립을 포함하고 있다[51]. 비디오는 이미지의 깊이(Depth)와 RGB 정보를 캡처할 수 있는 오버헤드 카메라를 사용하여 기록되었다. 모든 클립은 2019년 11월 5일부터 12월 11일까지 기록되었다. 하루에 2분 간격으로 07:00부터 20:00까지 매일 수집되었다. 각 비디오는 6 fps의 프레임 속도로 녹화된 5분 분량의 영상이 포함되어 있다.

Fig. 1.

Examples of Edinburg dataset (a) Pig object-specific bounding box and behavior label for the pig (b) Depth maps in the image

데이터셋에는 돼지의 위치와 행동을 나타내는 바운딩 박스 주석(Bounding box annotation)이 포함되어 있다. 이는 눕기, 이동하기, 먹기, 마시기 및 서기와 같은 돼지의 행동을 보여준다.

또한 YOLOv3 모형[52]을 사용한 자동 객체 감지 및 [53]에 의해 설명된 추적 알고리즘을 사용하여 파생된 레이블도 있으며, 이는 돼지의 행동을 시간 순서대로 알려준다.

우리는 돼지의 행동이 활동 수준에 영향을 미친다고 가정한다. 따라서 클립 프레임 속도를 기준으로 15개의 프레임 또는 2.5초 이상 특정 행동이 지속되는 경우, 해당 행도으로 분류한다는 정의를 사용하여 기존 라벨에서 행동 데이터를 수집했다. 이 가이드라인을 참고하여 1시간의 시간 동안 특정 행동으로 분류된 연속된 15개의 프레임 수를 합산하여 발생 횟수를 계산했다.

3.2 추가 파생 데이터

3.2.1 생물학적 특성

우리는 돼지의 몸 크기가 활동 수준에 영향을 미친다고 가정한다. 돼지의 신체 크기에 초점을 맞춘 이전 연구들에서도 이러한 관계를 확인하였다[46]-[48]. 또한 돼지가 나이가 들고 몸집이 커짐에 따라 활동성이 점차 감소한다는 사실이 발견되었다[46][49]-[51]. 따라서 본 연구에서는 돼지의 생물학적 특성(나이와 돼지의 체구 사이즈)도 분석에 포함하였다. 그러나 실제 신체 크기에 대한 기록이 없기 때문에 본 연구에서는 점유 지수(Occupation index)를 사용하여 돼지의 신체 크기를 도출했다. 점유 지수는 이미지의 총 픽셀 수 대비 돼지가 차지하는 픽셀 수로 정의된다[16]. 데이터셋에 제공되는 바운딩 박스 영역을 사용하여 점유 픽셀을 추정한다. 그림 2(a)는 돼지가 차지하는 시간에 따른 평균 바운딩 박스 면적의 증가 추세를 보여준다. 하지만 그래프를 자세히 보면, 바운딩 박스의 직사각형 모양에 대한 돼지 몸체의 위치와 정렬의 동적 변화에 의해 발생하는 위, 아래의 변동을 볼 수 있다. 이는 그림 2(b)에 나와있듯, 동일한 돼지가 수직으로 서있을 때와 누워있을 때의 바운딩 박스의 차이로 인함인데, 이 경우에는 신체 성장과 무관하게 점유 지수 값이 일정한 변동을 가지게 된다.

Fig. 2.

Occupation index

따라서 우리는 구한 점유 지수 값이 실제 돼지의 나이와 상관 관계가 있는 지를 통계 검증을 수행하였다. 두 변수의 피어슨 상관관계 테스트 결과 0.6387 (t-value=11.474, p-value<2 × 10-16)의 양의 상관 관계를 가졌다. 이 결과는 점유 지수를 통해 돼지들의 신체 사이즈를 대략적으로 추정하는 간접적인 지표로서 활용이 가능하다는 점을 보여준다.

3.2.2 외생적 사건

우리는 외생적 사건(Exogenous event)을 돼지 무리가 사람의 개입이나 우리에 물건이 들어오는 등의 사건으로 인해 갑작스러운 행동 변화를 경험하는 기간으로 정의한다. 우리는 외생적 사건이 돼지 활동 변화에 큰 영향을 미칠 수 있다고 가저하고 비디오 클립와 라벨링 데이터를 통해 외부 사건에 대한 정보를 수집하였다.

먼저 외생적 사건을 물체 공급, 사람의 개입, 기타 교란의 세 가지 큰 범주로 분류한다. 그런 다음 각 범주에 대해 세분화하여 레이블링을 진행하는데, 물체 공급의 경우 놀이 도구 공급(Plaything supply)과 지푸라기 공급(Straw supply), 사람 개입의 경우, 청소 개입(Cleaning operation)과 무작위 개입(Random intervation), 기타 교란을 먹이 공급(Food refill)과 돈사 출입(Pen access)으로 나누어 분류하였다. 구체적으로 살펴보면, 우선 지푸라기 공급의 경우 외부에서 돼지 무리에게 새로운 지푸라기를 가져다주는 경우를 의미한다. 놀이 도구 공급의 경우 외부에서 돼지의 놀이 행동을 자극하기 위해 골판지와 같은 물체를 제공한 후 돼지 무리가 이를 찾는 경우를 의미한다. 청소 개입은 사람이 돈사 내를 청소하기 위해 우리에 들어가 더러운 지푸라기를 제거하는 경우를 의미한다. 무작위 개입의 경우, 돼지 상태 확인하거나 몸의 표식을 다시 그리기, 주사 투여 등과 같은 기타 사람의 개입이 무작위적으로 발생하는 경우를 의미한다. 먹이 공급의 경우, 돼지의 사료 통의 사료가 떨어져 이를 공급하는 경우를 의미하며 마지막으로 돈사 출입은 돼지들이 돈사를 나가거나 들어오는 사건이 발생하는 경우를 의미한다.

우리는 이러한 사건의 레이블링의 신뢰성을 보장하기 위해 본 단계에서 4명의 연구자들이 각 영상 클립을 독립적으로 분류하는 과정을 거쳤다. 각 연구자들은 이벤트 발생의 경우 1, 아닌 경우 0으로 레이블링을 하여, 각 클립에 대해 50%의 정족수를 넘은 이벤트로 최종 레이블링을 수행하여 외생적 사건 변수를 구축하였다.

3.3 활동 지수 계산

돼지의 활동 지수를 계산하기 위해 우리는 영상의 프레임 간 픽셀 차이를 활용하였다. 먼저 각 비디오 클립에서 1,800개의 프레임(이미지)를 추출하여 회색 스케일로 변환하였다. 다음으로, 돼지 객체를 강조하기 위해 배경 제거(Background subtraction)방법을 사용하여 프레임을 전처리하였다. 또한 이진 변환을 수행하여 배경 제거 결과에서 회색 그림자를 제거하여 프레임을 흑백으로 전환하였다. 여기서는 임계값을 127을 사용하여 이 값보다 낮은 픽셀 색상을 검정(0)으로, 그렇지 않으면 흰 색(255)로 전환하였다. 또한 데이터셋에서 제공된 마스크 주석을 활용하여 비디오 클립에 있는 인접 우리에 존재하는 돼지 영역은 분석 대상에서 제외하였다.

프레임을 전처리한 후 [23][24]가 개발한 방법에 따라, 프레임 t와 프레임 t+1 사이의 픽셀 차이를 계산하였다(그림 3). 두 개의 연속된 프레임 사이에서 값이 0에서 255로, 또는 그 반대로 변경된 픽셀을 움직임이 발생한 픽셀로 식별하였다. 즉 픽셀 별로 두 프레임 당 값의 차이가 0이 아닌 경우 움직임이 발생한 픽셀 수로 정의한다. 마지막으로 각 프레임에서 달라진 픽셀 수가 프레임의 전체 픽셀 수에서 차지하는 비율을 계산하였다. 식 (1)은 이를 활용하여 활동 지수를 계산한 수식을 보여주는데, Idiff(x,y,t)의 경우 t 시점 기준 프레임 t와 t+1 사이의 (x,y) 픽셀의 값의 차이를 의미한다. 즉 값의 차이가 있게 되면 Idiff 은 0이 아닌 255나 –255 값을 가지게 되고 이는 움직임이 발생한 픽셀의 수를 의미하게 된다. 분모는 전체 픽셀의 수를 의미하고 최종적으로 식 (1)은 돼지의 움직임의 수준을 정량화하는 수치를 의미하게 된다.

activity =x,y1, if Idiffx,y,t00, otherwisex,y1(1) 
Fig. 3.

Illustration how to calculate pixel difference in frame-to-frame background-removed images

위와 같은 방법으로 활동 지수의 시계열 데이터를 얻은 후, 우리는 그림 4과 같이 1시간 동안의 활동 지수 값의 평균을 구하여 데이터를 평활화하였는데, 이는 1시간 별 값을 선택한 이유는 짧은 기간에 존재하는 시계열 데이터에 내재된 편향을 줄이기 위함이다. 또한 평활화 기법을 사용하면 짧은 시간 동안의 돼지 활동을 보다 상세하고 정확하게 평가할 수 있다. 따라서 단기적인 스트레스 요인과 건강 문제를 파악하는 데 유용하여 농가가 돼지 건강과 생산성을 개선하기 위해 적시에 조치를 취할 수 있다[16][54][55].

Fig. 4.

Example of activity index data observed from November 28th to November 30th, Activity index in 1-minute increments (gray) and activity index in 1-hour increments (red) with average smoothing to reduce variation

3.4 활동 지수 변수

3.4.1 활동 지수의 정기성 (시간대 변수)

이전 연구에 따르면 활동 지수는 계절성과 추세를 가지고 있는 것으로 나타났다[29][55][56]. 다른 연구들도 이러한 추세가 돼지 활동의 스케줄링 패턴을 설정할 때 돼지 행동에 영향을 미친다는 것을 확인하였다[56][57]. 따라서 우리는 영상이 촬영된 시간대가 활동 지수의 변화에 영향을 미칠 수 있다고 가정하였다. 우리는 활동 지수의 시계열 데이터를 08:00시부터 20:00까지 각 시간대로 그룹화하여 정리하였다. 이전 관측치도 예측에 포함했기 때문에 07:00부터 08:00까지는 제외하였다. 또한 더미 코딩을 사용하여 시간대의 값을 이진 값으로 인코딩하여 해당 시간대에 활동 지수 값이 관찰되었음을 1, 그렇지 않으면 0으로 정의하여 사용하였다. 따라서 08:00부터 09:00까지의 시간대는 다른 모든 시간대의 값이 0인 경우 항상 1의 값을 갖기 때문에 표 1의 변수에는 언급되지 않는다.

Description of main variales used in the regression models

3.4.2 활동 지수의 연속성 (이전 활동 지수)

위에서 언급한 것처럼 돼지의 활동은 일정한 춧가 존재하기 때문에, 우리는 특정 활동 지수 값은 이전 시간의 활동 지수에 영향을 받는다고 가정한다. 여기서, 우리는 이전 시간대의 2가지 유형, 즉 시간 단위(직전 1시간 전 활동 지수)와 하루 단위(동일한 시간대의 전날 활동 지수)의 이전 시간 활동 지수를 정의하였다.

3.5 활동 지수 예측

표 1은 활동 지수를 예측하기 위해 사용된 변수 목록을 보여준다 (모든 변수는 1시간 단위를 기준). 우리는 표 1에 설명된 모든 변수를 활용하여 활동 지수를 예측하기 위한 머신러닝 모형을 학습시켰다. 우리는 데이터 특성 상 정형 데이터를 활용하며, 분석의 기간이 짧기 때문에 딥러닝이 아닌 전통 머신러닝 기법을 활용하여 예측을 수행하였다[58].

3.5.1 모형의 적합도 확인

예측 모형을 훈련하기 앞서, 우리는 먼저 선형 회귀를 사용하여 독립 변수에 대한 효과의 해석 가능성을 확인하였다. 모든 변수를 표 1에 나열된 대로 선형 회귀 모델을 활용하여 분석하였다. 모형의 일반적인 공식은 다음과 같다.

AI=α+βkvk+ϵ(1) 

여기서 vkV, V는 모든 독립 변수의 집합을 의미한다. βk는 모든 변수 항의 계수를 의미하며 K는 모든 변수의 수를 의미한다.

우리는 모형의 적합성을 결정하기 위해 F 통계량의 R2 값과 p-value를 참고하였다. R2는 모든 독립 변수에 의해 설명되는 활동 지수의 변동성을 측정한다. 우리 모형의 경우 R2 값이 0.639로 독립 변수의 값으로부터 활동 지수에 관한 정보의 약 64%를 유추할 수 있는 모형이다. 이 값은 표준 임계값(80% 이상) 보다는 작을 수 있지만, 생태학 데이터의 고유한 노이즈와 예측 불가능성으로 인해 50%의 임계값이 일반적인 생물 생태학 분야에서는 여전히 수요 가능한 것으로 간주된다[59]-[61]. 또한, 모델에 변수를 포함시켰을 때, null 모델에 비해 적합도가 향상되는 지 여부를 평가하는 F 통계의 p-value를 통해 R2의 수용 가능성을 추가로 확인하였다. 우리 모형의 경우 임계 값이 0.05인 경우, F 통계량이 12.39고, p-value 값이 2 × 1016 미만인 것으로 보아 모형이 통계적으로 유의미한 것으로 확인하였다.

3.5.2 예측 모형

우리는 모형의 예측력을 검증하기 위해 독립 변수와 활동 지수 결과 사이의 선형 및 비선형 관계를 조사하였다. 선형 관계를 조사하기 위해 다중 선형 회귀 모형을 사용하였다. 한편, 비선형 관계를 조사하기 위해 세 가지 다른 기법, 서포트 벡터 회귀 모형(SVR, Support Vector Regressor), 랜덤 포레스트(Random forest), 극한 경사 부스팅(eXtreme Gradient BOOSTing)를 사용하였다. 서포트 벡터 회귀 모형은 독립 변수와 활동 지수 간의 관계를 조사하고 데이터 포인트를 맞추는 근사화 쌍곡면을 구축한다. 우리는 오차를 최소화하기 위해 방사형 커널(Radical basis function Kernel)을 적용하고 각각 엡실론(Epsilon)과 감마(Gamma) 값으로 0.1과 0.04 하이퍼 파라미터 값으로 선택하였다. 랜덤 포레스트는 데이터를 재귀적으로 분할하고 랜덤 변수들의 조합으로 예측을 수행하는 여러 개의 서브 트리들을 형성하고 이 트리들의 예측값을 종합하여 최종 예측값을 도출한다.

우리는 트리 수를 500개를 사용하고 각 트리마다 4개의 변수를 사용하였다. 마지막으로, 극한 경사 부스팅은 예측 값과 실제 값 사이의 잔차(Residual information, 잔여 정보)를 계산하여 이전 학습 모형으로부터 예측 오류를 수정하도록 학습한 다수의 약한 학습 모형을 순차적으로 학습시킨다.

이 잔여 정보는 경사 하강 최적화(Gradient descent optimization)를 통해 반복적으로 전달되어 시간이 지남에 따라 오류를 최소화하고 모형을 개선하게 된다. 극한 경사 부스팅을 학습하기 위해 반복되는 라운드를 5로 설정하고 트리의 최대 깊이를 6으로 설정하였다. 학습 속도 (ETA, Estimated Time of Arrival)는 0.3으로 설정하였고, 학습의 과적화를 막기 위해 L2 규제화를 적용하였다.

3.5.3 데이터 분할

우리는 11월 5일부터 12월 8일까지의 데이터를 기반으로 모형을 학습하였다. 테스트 데이터의 경우 12월 9일부터 12월 11일까지의 기간을 사용하는데 예측 결과의 객관성을 보장하기 위해 테스트 데이터를 재귀적으로 3번 분할하여 사용하였다. 즉, 테스트 데이터셋은 3개의 기간으로 구성되는데, 12월 9일~12월 11일, 12월 10일~12월 11일 (이 경우, 12월 9일은 학습 데이터로 사용된다), 그리고 12월 11일로만 구성되는 (이 경우 12월 9일, 10일은 학습 데이터로 사용된다) 3가지 케이스를 사용한다. 우리는 이 3가지에 대한 예측 성과를 평균을 내어 성능을 집계하였다.


Ⅳ. 결과 및 토의

4.1 결과 분석

우리는 독립 변수의 활동 지수 간의 관계를 설명하기 위해 앞서 설명한 다중 선형 회귀 모형을 사용하였다. 각 변수에 대한 분석 결과는 표 2에서 공시하였다.

Parameter for the likelihood of change in activity index, The linear regression model presents 12 significant farming attributes affecting the probability of fluctuation in pig activity index

4.1.1 과거 활동 지수

표 2의 결과는 과거 활동 지수 (직전 시간과 하루 전날)가 돼지 활동 지수의 변화에 영향을 미치는 요인 중 일부임을 보여준다. 계수 값 β1 = 0.2169는 이전 시간에 돼지 활동 지수가 1 단위 증가할 때마다 현재 활동 지수도 0.2169 단위로 증가한다는 것을 의미한다. 반면, β2 = 0.1338은 전날 같은 시간 동안 돼지 활동 지수가 1 단위 증가할 때마다 현재 활동 지수 역시 0.1338 단위로 증가한다는 것을 의미한다. 이 결과는 [60][61]의 선행 연구와 맥락을 같이한다. 직전 1시간에 대한 활동 지수 값이 하루 전날의 값에 비해 활동 지수 변화에 더 큰 영향을 미치는 것은 돼지의 활동 패턴을 예측할 수 없기 때문이다.

4.1.2 생물학적 특성

표 2를 보면, 돼지들의 나이와 점유 지수와 같은 생물학적 변수는 활동 지수를 유의미하게 예측할 수 없는 것으로 확인하였다. 여기서 우리는 그림 6에서 볼 수 있듯 활동 지수가 연령(일수)가 증가함에 따라 일정한 추세를 보이지 않음을 알 수 있다. 활동 지수는 또한 돼지의 연령과 양의 관계를 나타내는 점유 지수의 증가에 따른 증가 추세를 보이지 않는다. 또한 그림 5를 보면 활동 지수의 추세가 넓은 범위의 시간대에 걸쳐 지속적으로 확장 또는 축소되는 대신 단기간에 걸쳐 좁은 시간대에 걸쳐 변동이 나타나는 것을 확인하였다.

Fig. 5.

Graph of the actual value (yellow) and predicted value (green) of the activity index using a random forest, The vertical line (cream) is December 9th, based on the split between training and test data

Fig. 6.

Violin plots of when exogenous events occurred (green) and not occurred (yellow) for the introduction of an object into the pen (a), intervention of human (b), and other types of disturbance to the pig herd (c) The screenshots of the clips on the right illustrate the provision of plaything (a.i) and straw (a.ii), the intervention of man for cleaning (b.i) and other random activities (b.ii), and the disturbance due to gate opening (c.i) and feeding (c.ii)

4.1.3 돼지 행동 변수

앞서 언급한 것처럼 우리는 돼지들의 행동이 활동 지수에 영향을 미칠 것이라 가정한다. 우리는 돼지들의 행동 중 크게 먹이를 먹는 행위, 물을 마시는 행위, 누워 있는 행위의 3가지 행위를 분석해서 활동 지수에 미치는 영향을 파악하였다.

먹이를 먹는 행위의 경우 계수 값이 β5 =-0.0015로 활동 지수를 예측하는 데 영향력 있는 행동으로 나타났다. 이 값은 돼지가 현재 먹이를 먹고 있다면 다음 시간대에 활동 지수가 0.0015단위로 감소한다는 것을 의미한다.

이러한 활동 지수의 감소는 식사를 마친 돼지가 잠을 자려고 하는 일반적인 행동으로 인해 발생하는 것으로 관찰되었다. 또한 먹이를 먹는 행위 변수의 계수는 앞서 설명한 모든 변수에 비해 상대적으로 유의성이 약하다. 이러한 현상은 돼지가 자유롭게 먹이에 접근할 수 있기 때문에, 즉 농장주가 먹이를 주는 스케줄이 없기 때문에 발생하는 것으로 추측된다. 따라서 각 돼지는 다른 돼지와 동일한 식사 일정을 가지지 않기 때문에 무리의 활동 지수 변화에 미치는 영향이 약해지게 된다. 이러한 무리의 일정 불일치로 인해 또한 물을 마시는 행위와 누워 있는 행위 변수 또한 다음 시간대의 할동 지수를 잘 예측할 수 없게 된다.

4.1.4 외생적 사건 변수

비디오 클립에 녹화된 돼지들은 사람에게 호기심을 갖거나 의식을 하는 등 사람의 개입으로 인한 다양한 영향을 받았다. 이러한 패턴은 선형 회귀 결과에도 번영되어, 활동 지수 증가에 대한 두 번째로 높은 예측 인자로 사람이 우리에 개입하는 사건을 들 수 있다. 표 2는 청소 작업과 무작위 개입에 대한 β8 = 0.4286, β9 = 0.5172의 값을 통해 이러한 관계를 보여준다. 이 값은 사람이 청소 또는 기타 업무를 위해 돈방에 들어가면 돼지 활동 지수가 각각 0.4286, 0.5172단위로 증가하는 것을 유추할 수 있다. 청소 작업에 비해 기타 업무에 대한 계수 값이 더 높은 것은 두 가지 유형의 무작위 개입이 발생(녹색)하거나 발생하지 않을 때(노란색)의 확률 분포에도 반영되어 있다(그림 6(b)). 두 유형의 추론에 대한 사분위수 범위는 다르며 무작위 개입이 더 높은 값을 나타낸다. 또한 두 개입 유형에 대한 분포의 모양도 다름을 알 수 있다. 청소 개입의 분포는 평평한 피크(1.0~1.5)가 하나 있는데, 이는 돼지 무리가 청소 인력의 움직임에 따라 지속적이고 균일하게 이동한다는 것을 나타낼 수 있다 (그림 6(b.i)). 한편, 무작위 개입 분포의 피크는 다소 날카로운 (1.25) 것으로 나타나 청소 개입만큼 돼지 무리의 움직임이 오래 지속되지 않음을 나타낸다.

또한 표 2의 결과에 따르면, 놀이 도구와 지푸기가 공급되면 활동지수가 β10 = 0.6570, β11 = 0.5256 단위로 증가하는 것을 확인하였다. 또한 그림 6(a)는 놀이 도구와 지푸라기를 공급했을 때 (녹색) 또는 공급하지 않았을 때 (노란색)의 활동 지수 분포를 나타낸다. 두 조건의 평균과 사분위수 범위가 크게 다르다는 것을 알 수 있다. 이는 놀이 도구나 지푸라기가 돈방에 공급되었을 때 활동 지수의 변동이 크다는 것을 나타낸다. 그러나 놀이 도구와 지푸라기 공급에 따른 활동 지수의 분포가 약간 다른데, 놀이 도구 공급의 분포는 활동 지수가 비슷하게 높은 두 개의 정점(1.5와 2.0)을 나타낸다. 반면 지푸라기 공급 분포도 1.25와 2.0의 2개의 정점을 보이지만, 후자의 확률은 전자의 확률보다 훨씬 낮다. 이는 놀이 도구 공급과 지푸라기 공급 때의 돼지의 행동이 서로 다르다는 것을 나타낸다. 그림 6(a.i)에서 볼 수 있듯, 돼지 무리는 개체 간의 사회적 유대를 촉진하는 놀이 도구를 소유하기 위해 소규모 그룹으로 경쟁하는 경향이 있으며 높은 활동 지수를 유지한다. 반면, 돼지 무리에게 지푸라기를 공급하면 돼지가 개별적으로 지푸라기를 탐색하는 경향이 있기 때문에 초기의 높은 활동 지수는 시간이 지남에 따라 감소한다 (그림 6(a.ii)).

또한 표 2의 분석을 보면, 먹이를 공급해줄 때, 돼지 활동 지수가 β12 = 0.3458 단위로 증가하였다.그림 6(c)에서 먹이 공급에 대한 분포를 추가로 조사하였다. 먹이 공급 분포(녹색)은 평균값에서 볼 수 있듯 미공급 분포(노란색)와 약간의 차이만 존재한다. 이 패턴은 돼지 무리가 언제든지 먹이에 자유롭게 접근할 수 있기 때문이다. 여기서 활동 지수의 증가는 먹이 욕구 충족이 아닌 사람의 존재로 인해 발생할 수 있다.

또한 우리 모형은 돈사의 출입이 활동 지수를 잘 설명하지 못함을 보여준다 (p-value > 0.05). 이 결과는 분포에도 반영되는데, 그림 6(c)는 이러한 사건이 발생한 경우(녹색)과 발생하지 않은 경우(노란색)의 분포가 거의 비슷하다는 것을 보여준다. 이 패턴은 관찰된 비디오 클립의 일부분에서 무리가 존재하지 않기 때문에 발생할 수 있다.

4.1.5 활동 시간대

회귀 모형에서 변수로 사용한 모든 시간대 중 저녁 시간대(17:00~18:00, 18:00~19:00)가 유의미한 변수로 나타났고, 오후 시간대(16:00~17:00, 15:00~16:00)가 그 뒤를 이었다. 이는 각각 오후 시간대인 β21 =-0.2746, β22 =-0.2715와 저녁 시간대인 β23 =-0.3037, β24 =-0.2972의 계수 값을 갖는다. 이러한 값은 앞서 언급한 기간 동안 돼지 활동이 감소하는 경향이 있음을 나타낸다. 이는 돼지가 주로 저녁과 밤 시간대에 잠을 자고 있어 활동량이 적기 때문일 것으로 추측된다. 또한 15:00 이전의 모든 시간대는 활동 지수를 예측하는 데 유의미하지 않았다. 이는 돼지 무리가 낮 동안 일정하게 움직이지 않는 경향이 있기 때문이다. 또한 활동 지수의 변화에 큰 영향을 미치는 대부분의 외생적 사건은 낮에 발생했지만 무작위적인 시간대에 발생했다.

4.2 예측 결과

표 3은 4가지 머신 러닝 기법의 예측 성능을 보여준다. 성능을 측정하기 위해 우리는 R2와 평균 절대 백분율 오차(MAPE, Mean Absolute Squared Error)를 사용하였다. MAPE는 식 (3)처럼 오차 값의 비율을 이용하여 성능을 측정하는데, 일반적인 성능 지표로 사용되는 평균 제곱근 오차(RMSE, Root Mean Squared Error) 대비 값의 스케일에 영향을 받지 않는다. 또한 MAPE는 백분율로 표기되어 RMSE 대비 이상치에 적은 영향을 받기 때문에 우리는 보다 일반적인 성능을 측정하는 지표로서 MAPE을 사용하여 성능을 측정하였다.

MAPE=1ni=1nyi-yi^yi(3) 

Prediction results from machine learning methods (LR means Linear Regression, SVR means support vector regressor, XGB means XGBoost, RF means random forest)

4가지 머신 러닝 기법 모두 훈련 및 테스트에서 50%의 임계값 이상의 허용 가능한 R2값을 가졌다. 랜덤 포레스트는 훈련에서 87.7%의 가장 높은 R2값을 달성하였고, 테스트에서는 73.1%의 R2 값으로 극한 경사 부스팅이 가장 높은 값을 달성하였다. 반면, 서포트 벡터 회귀 모형은 훈련과 테스트 모두에서 가장 낮은 R2 값을 가졌다. 이는 랜덤 포레스트와 극한 경사 부스팅 모두 서포트 벡터 회귀 모형보다 독립 변수들이 주어졌을 때 활동 지수의 변동성을 더 잘 설명할 수 있음을 의미한다. 또한 MAPE는 활동 지수 예측 값과 실제 값의 차이의 평균 비율을 의미한다. 한 가지를 제외한 모든 머신 러닝 기법은 훈련과 테스트에서 모두 20%에서 50% 사이인 합리적인 MAPE 값을 가졌다. 표 3은 다중 선형 회귀가 훈련에서 54.8%, 테스트에서 41.6%로 가장 높은 MAPE 값을 나타냄을 보여준다. 반면 랜덤 포레스트는 훈련의 경우 31.2%, 테스트의 경우 30%로 가장 낮은 MAPE 값을 가졌다. 이 결과는 랜덤 포레스트가 다른 기법을 적용한 것보다 예측값을 원하는 실제 활동 지수에 더 잘 맞출 수 있음을 시사한다. 또한 이 결과를 통해 훈련 데이터에 대한 과적합도 발생하지 않음을 확인하였다.

4.3 높은 오차 샘플 분석

그림 5는 실제 활동 지수 값과 랜덤 포레스트가 예측한 값의 결과를 보여준다. 노란색 선은 실제 값, 녹색 선은 예측 값, 크림색 세로 선은 훈련 데이터와 테스트 데이터를 구분하는 기준선으로, 12월 9일로 설정하였다. 그림 5에서 볼 수 있듯, 예측값은 활동 지수의 전반적인 추세를 잘 따르고 있지만, 오차가 큰 값도 일부 존재하는데, 예를 들어 11월 29일의 경우 실제 활동 지수 값이 2.0 이상으로 예측 값과 큰 오차를 보였다. 이는 향후 더 나은 모형을 구축하기 위해 오차가 큰 샘플의 특성을 분석할 필요가 있음을 시사한다. 따라서 이 섹션 4.3에서는 활동에 영향을 미치는 추가 요인을 파악하기 위해 사후 분석을 수행한다.

앞서 언급했듯, 오차가 큰 샘플을 분석할 필요가 있기 때문에 오차 값에 따라 이상치 값을 추출하였다. 이상치는 절대 오차값이 1 사분위수에서 사분 범위 (Inter Quantile Range, IQR)의 ±1.5 배를 초과하거나 3 사분위수에서 IQR의 ±1.5배를 초과하는 경우에 식별되었다. 그림 7은 오차 값의 박스 플롯 (Box Plot)을 보여주며, 오차 값이 매우 높은 5개의 이상치가 있음을 보여준다. 표 4는 5개의 이상치 값의 실제 활동 지수 값과 예측 값을 보여준다.

Fig. 7.

Boxplot of error values (1st quartile is 0.036, median is 0.071, 3rd quartile is 0.1393, and IQR is 0.1026)

High error sample lists (1 : with exogenous events, 0 without exogenous events)

표 4에서 볼 수 있듯, 모두 예측 값이 실제 값보다 작았으며 11월 8일을 제외한 모든 경우에서 최소 2가지 이상의 외생적 사건이 발생한 경우임을 알 수 있다. 이는 돼지의 탐색 행동과 관련이 있는데, 예를 들어 돼지는 청소 후 새로운 환경을 다시 탐색하려는 호기심이 생기고, 새로운 지푸라기나 놀이 도구가 제공되면 더욱 호기심과 흥분을 느끼며 탐색 행동이 강화된다(그림 8).

Fig. 8

Examples of high error samples. All four shows events that occurred between 11 a.m and 12 p.m on November 7th (a) clean event occurred, (b) the increase in exploratory behavior of pigs after cleaning, (c) the straw supply and (d) starting to group nudging as their exploratory activity increases

그러나 위 샘플의 경우, 이러한 사건이 연달아 발생하면서 돼지의 탐색 행동이 격렬해져 다른 돼지를 공적으로 밀거나 심지어 싸움을 벌이는 경우도 존재하였다.

이러한 행동이 5분 이상 지속되거나 격렬한 상호 작용이 지속되는 경우 활동이 매우 급증하는 경향이 있었으며, 모형이 활동 지수 값의 급증을 완전히 예측하지 못하였다. 이는 외부 사건의 계단식 효과가 돼지의 활동에 영향을 미칠 수 있으며, 외생적 사건으로 인한 활동의 급증을 예측하기 위해 더 잘 설계된 변수를 사용할 수 있음을 시사한다.


Ⅴ. 결과 및 토의

우리는 돼지의 성장과 건강을 관리하기 위해 미래의 활동 지수를 미리 예측하여 돼지의 활동량 추이오 패턴을 파악하였다. 이를 위해 돼지의 활동량에 영향을 미치는 외부 및 내부 요인을 분석하였다. 먼저 돼지는 청소, 지푸라기/놀이도구 공급, 사람의 개입 등 외부 환경의 변화에 따라 활동량에 민감한 변화를 보였다. 내부 요인으로는 돼지의 생물학적 요인, 이전 시간대의 행동 및 활동 지수의 영향을 분석하였다. 활동 지수는 과거에 관찰된 행동, 특히 먹이 행동의 영향을 받았으며, 기록된 이전 활동 지수와 시간대별 추세에도 영향을 받는다는 사실을 발견하였다. 다음 요인을 사용하여 훈련된 모형은 훈련 데이터와 테스트 데이터 모두 R2 0.7-0.8의 높은 설명력을 보였으며, 제안된 모형이 몇 가지 활동 급증을 제외하고는 전반적인 활동 수준을 잘 예측하는 것으로 확인되었다. 그러나 구축한 모형에서 포착하지 못한 이상치, 즉 돼지들의 공격적인 행동과 사회적 상호작용 증가로 인한 활동 지수 값이 치솟는 경우, 예측 오차가 커서 모형의 전반적인 성능을 떨어뜨렸다.

이러한 한계를 극복하기 위해서 후속 연구에서는 분석 기간을 늘리고, 돼지의 상호 작용을 고려한 추가 기능, 행동 변화를 반영하는 추가 변수를 추가해야 할 것이다. 활동 수준의 변화와 추세를 파악하려는 시도가 돼지의 성장과 건강 상태를 보다 정확하게 파악하여 축산업의 생산 효율을 크게 높일 수 있을 것으로 기대된다.

Acknowledgments

본 결과물은 농림축산식품부 및 과학기술정보통신부, 농촌진흥청의 재원으로 농림식품기술기획평가원과 재단범인 스마트팜연구개발사업단의 스마트팜다부처패키지혁신기술개발사업의 지원을 받아 연구되었음(421043-04)

References

  • C. R. Daniel, A. J. Cross, C. Koebnick, and R. Sinha, "Trends in meat consumption in the USA", Public health nutrition, Vol. 14, pp. 575-583, Apr. 2011. [https://doi.org/10.1017/S1368980010002077]
  • J. Trienekens and P. Zuurbier, "Quality and safety standards in the food industry, developments and challenges", International journal of production economics, Vol. 113, No. 1, pp. 107-122, May 2008. [https://doi.org/10.1016/j.ijpe.2007.02.050]
  • "The Power of Meat 2023", https://www.fmi.org/docs/default-source/research/power_of_meat_2023_top_10_final.pdf?sfvrsn=df723499_1, [accessed: Mar. 11, 2024]
  • Y. Liang, Y. Cheng, Y. Xu, G. Hua, Z. Zheng, H. Li, and L. Han, "Consumer preferences for animal welfare in china: Optimization of pork production-marketing chains", Animals, Vol. 12, No. 21, pp. 3051-3069, Nov. 2022. [https://doi.org/10.3390/ani12213051]
  • D. G. D. Maes, J. Dewulf, C. Pineiro, S. Edwards, and I. Kyriazakis, "A critical reflection on intensive pork production with an emphasis on animal health and welfare", Journal of Animal Science, Vol. 98, pp. S15-S26, Aug. 2020. [https://doi.org/10.1093/jas/skz362]
  • A. Ludwiczak, et al., "How housing conditions determine the welfare of pigs", Animals, Vol. 11, No. 12, pp. 3484-3500, Dec. 2021. [https://doi.org/10.3390/ani11123484]
  • S. S. Nielsen, et al., "Welfare of pigs on farm", EFSA Journal, Vol. 20, No. 8, Aug. 2022. [https://doi.org/10.2903/j.efsa.2022.7421]
  • T. Jaaskelainen, T. Kauppinen, K. Vesala, and A. Valros, "Relationships between pig welfare, productivity and farmer disposition", Animal Welfare, Vol. 23, No. 4, pp. 435-443, 2014. [https://doi.org/10.7120/09627286.23.4.435]
  • P. Racewicz, et al., "Welfare health and productivity in commericial pig herds", Animals, Vol. 11, No. 4, pp. 1176-1192, Apr. 2021. [https://doi.org/10.3390/ani11041176]
  • G. Reiner, K. Hubner, and S. Hepp, "Suffering in diseased pigs as expressed by behavioural, clinical and clinical-chemical traits, in a well defined parasite model", Applied animal behaviour science, Vol. 118, No. 3-4, pp. 222-231, May 2009. [https://doi.org/10.1016/j.applanim.2009.02.010]
  • J. L. Salak-Johnson, D. L. Anderson, and J. J. McGlone, "Differential dose effects of central CRF and effects of CRF astressin on pig behavior", Physiology & behavior, Vol. 83, No. 1, pp. 143-150, Oct. 2004. [https://doi.org/10.1016/j.physbeh.2004.08.005]
  • E. Brunberg, A. Wallenbeck, and L. J. Keeling, "Tail biting in fattening pigs: Associations between frequency of tail biting and other abnormal behaviours", Applied Animal Behaviour Science, Vol. 133, No. 1-2, pp. 18-25, Aug. 2011. [https://doi.org/10.1016/j.applanim.2011.04.019]
  • P. Statham, L. Green, M. Bichard, and M. Mendl, "Predicting tail-biting from behaviour of pigs prior to outbreaks", Applied Animal Behaviour Science, Vol. 121, No. 3-4, pp. 157-164, Dec. 2009. [https://doi.org/10.1016/j.applanim.2009.09.011]
  • M. Wutke, A. O. Schmitt, I. Traulsen, and M. Gultas, "Investigation of pig activity based on video data and semi-supervised neural networks", AgriEngineering, Vol. 2, No. 4, pp. 581-595, Dec. 2020. [https://doi.org/10.3390/agriengineering2040039]
  • K. Sallvik and K. Walberg, "The effects of air velocity and temperature on the behaviour and growth of pigs", Journal of Agricultural Engineering Research, Vol. 30, pp. 305-312, 1984. [https://doi.org/10.1016/S0021-8634(84)80031-1]
  • A. Costa, F. Borgonovo, T. Leroy, D. Berckmans, and M. Guarino, "The use of image analysis as a new approach to acces behaviour classification in a pig barn", Acta Veterinaria Brno, Vol. 82, No. 1, pp. 25-30, 2013. [https://doi.org/10.2754/avb201382010025]
  • K. Y. Kim, H. J. Ko, H. T. Kim, C. N. Kim, and S. H. Byeon, "Association between pig activity and environmental factors in pig confinement buildings", Australian Journal of Experimental Agriculture, Vol. 48, No. 5, pp. 680-686, Apr. 2008. [https://doi.org/10.1071/EA06110]
  • E. Arulmozhi, A. Bhujel, B. E. Moon, and H. T. Kim, "The application of cameras in precision pig farming: An overview for swine-keeping professionals", Animals, Vol. 11, No. 8 pp. 2343-2366, Aug. 2021. [https://doi.org/10.3390/ani11082343]
  • H. Xin, "Assessing swine thermal comfort by image analysis of postural behaviors", Journal of Animal Science, Vol. 77, No. 2, pp. 1-9, Jan. 1999. [https://doi.org/10.2527/1999.77suppl_21x]
  • M. V. Matthews, C. N. Ncobela, A. T. Kanengoni, and M. Chimonyo, "Effects of environmental enrichment on behaviour, physiology and performance of pigs – a review", Asian-Australasian Journal of Animal Sciences, Vol. 32, No. 1, pp. 1-13, Dec. 2018. [https://doi.org/10.5713/ajas.17.0138]
  • C. Cornou and S. Lundbye-Christensen, "Classifying sows’ activity types from acceleration patterns: an application of the multi-process kalman filter", Applied Animal Behaviour Science, Vol. 111, No. 304, pp. 262-273, Jun. 2008. [https://doi.org/10.1016/j.applanim.2007.06.021]
  • J. Wang, Y. Zhang, M. Bell, and G. Liu, "Potential of an activity index combining acceleration and location for automated estrus detection in dairy cows", Information Processing in Agriculture, Vol. 9, No. 2, pp. 288-299, Jun. 2022. [https://doi.org/10.1016/j.inpa.2021.04.003]
  • H. Bolemen, J. M. Aerts, D. Berckmans, and V. Goedseels, "Image analysis to measure activity index of animals", Equine Veterinary Journal, Vol. 29, No. S23, pp. 16-19, Jun. 2010. [https://doi.org/10.1111/j.2042-3306.1997.tb05044.x]
  • S. Ott, et al., "Automated video analysis of pig activity at pen level highly correlates to human observations of behavioural activities", Livestock Science, Vol. 160, pp. 132-137, Feb. 2014. [https://doi.org/10.1016/j.livsci.2013.12.011]
  • H. H. Kristensen and C. Cornou, "Automatic detection of deviations in activity levels in groups of broiler chickens – a pilot study", Biosystems engineering, Vol. 109, No. 4, pp. 369-376, Aug. 2011. [https://doi.org/10.1016/j.biosystemseng.2011.05.002]
  • W. Zhu, X. Pu, X. Li, and X. Zhu, "Automated detection of sick pigs based on machine vision", 2009 IEEE International Conference on Intelligent Computing and Intelligent Systems, Shanghai, pp. 790-794, Nov. 2009. [https://doi.org/10.1109/ICICISYS.2009.5358295]
  • R. Gronskyte, L. H. Clemmensen, M. S. Hviid, and M. Kulahci, "Monitoring pig movement at the slaughterhouse using optical flow and modified angular histograms", Biosystems Engineering, Vol. 141, pp. 19-30, Jan. 2016. [https://doi.org/10.1016/j.biosystemseng.2015.10.002]
  • S. Kuster, M. Kardel, S. Ammer, J. Brunger, R. Koch, and I. Traulsen, "Usage of computer vision analysis for automatic detection of activity changes in sows during final gestation", Computers and Electronics in Agriculture, Vol. 169, pp. 105177-105182, Feb. 2020. [https://doi.org/10.1016/j.compag.2019.105177]
  • Y. Z. Li, L. J. Johnston, and M. S. Dawkins, "Utilization of optical flow algorithms to monitor development of tail biting outbreaks in pigs", Animals, Vol. 10, No. 2, pp. 323-337, Feb. 2020. [https://doi.org/10.3390/ani10020323]
  • M. L. V. Larsen, L. J. Pedersen, S. Edwards, S. Albanie, and M. S. Dawkins, "Movement change detected by optical flow precedes, but does not predict, tail-biting in pigs", Livestock Science, Vol. 240, pp. 104136-104140, Oct. 2020. [https://doi.org/10.1016/j.livsci.2020.104136]
  • H. Roberts and A. Segev, "Animal behavior prediction with long short-term memory", IEEE International Conference on Big Data (Big Data), Atlanta, GA, USA, pp. 4157-4164, Dec. 2020. [https://doi.org/10.1109/BigData50022.2020.9378184]
  • D. Berckmans, "Automatic on-line monitoring of animals by precision livestock farming", Livestock production and society, pp. 287-294, 2006. [https://doi.org/10.3920/9789086865673_023]
  • K. Wurtz, et al., "Recording behaviour of indoor-housed farm animals automatically using machine vision technology: A systematic review", PloS one, Vol. 14 No. 12, Dec. 2019. [https://doi.org/10.1371/journal.pone.0226669]
  • Y. Guo, W. Zhu, P. Jiao, and J. Chen, "Foreground detection of group-housed pigs based on the combination of mixutre of gaussians using prediction mechanism and threshold segmentation", Biosystems Engineering, Vol. 125, pp. 98-104, Sep. 2014. [https://doi.org/10.1016/j.biosystemseng.2014.07.002]
  • Y. Z. Guo, W. X. Zhu, P. P. Jiao, C. H. Ma, and J. J. Yang, "Multi-object extraction from top-view group-housed pig images based on adaptive partitioning and multi-level thresholding segmentation", Biosystem Engineering, Vol. 135, pp. 54-60, Jul. 2015. [https://doi.org/10.1016/j.biosystemseng.2015.05.001]
  • E. Fernandez-Carrion, et al., "Motion-based video monitoring for early detection of livestock diseases: The case of african swine fever", PloS one, Vol. 12, No. 9, Sep. 2017. [https://doi.org/10.1371/journal.pone.0183793]
  • M. Ozack, et al., "Classification of aggressive behaviour in pigs by activity index and multi-layer feed forward neural network", Biosystem Engineering, Vol. 119, pp. 89-97, Mar. 2014. [https://doi.org/10.1016/j.biosystemseng.2014.01.005]
  • C. Chen, W. Zhu, C. Ma, Y. Guo, W. Huang, and C. Ruan, "Image motion feature extraction for recognition of aggressive behaviors among group-housed pigs", Computers and electronics in agriculture, Vol. 142, pp. 380-387, Nov. 2017. [https://doi.org/10.1016/j.compag.2017.09.013]
  • K Olczak, J. Nowicki, and C. Klocek, "Pig behaviour in relation to weather conditions – a review", Annals of Animal Science, Vol. 15, No. 3, pp. 601-610, Jul. 2015. [https://doi.org/10.1515/aoas-2015-0024]
  • I. Camerlink, K. Scheck, T. Cadman, and J. L. Rault, "Lying in spatial proximity and active social behaviours capture different information when analysed at group-level in indoor-housed pigs", Applied Animal Behaviour Science, Vol. 246, pp. 105540-105547, Jan. 2022. [https://doi.org/10.1016/j.applanim.2021.105540]
  • M. V. Mkwanazi, C. N. Ncobela, A. T. Kanengoni, and M. Chimonoyo, "Effects of environmental enrichment on behaviour, physiology and performance of pigs – a review", Asian-Australasian journal of animal science, Vol. 32, No. 1, pp. 1-13, Dec. 2018. [https://doi.org/10.5713/ajas.17.0138]
  • M. H. Presto, H. K. Andersson, S. Folestam, and J. E. Lindberg, "Activity behaviour and social interactions of pigs raised outdoors and indoors", Archives Animal Breeding, Vol. 51, pp. 338-350, Oct. 2008. [https://doi.org/10.5194/aab-51-338-2008]
  • N. Lewis, "Frustration of goal-directed behaviour in swine", Applied Animal Behaviour Science, Vol. 64, No. 1, pp. 19-29, Apr. 1999. [https://doi.org/10.1016/S0168-1591(99)00025-8]
  • E. Hessel, et al., "Influence of increased feeding frequency on behavior and integument lesions in growing-finishing restricted-fed pigs", Journal of animal science, Vol. 84, No. 6, pp. 1526-1534, Jun. 2006. [https://doi.org/10.2527/2006.8471968x]
  • S. Griss, et al., "If they could choose: How would dogs spend their days? activity pattern in four populations of domenstic dogs", Applied Animal Behaviour Science, Vol. 243, pp. 105449-105460, Oct. 2021. [https://doi.org/10.1016/j.applanim.2021.105449]
  • J. C. Tou and C. E. Wade, "Determinants affecting physical activity levels in animal models", Experimental Biology and Medicine, Vol. 227, No. 8, pp. 587-600, Sep. 2002. [https://doi.org/10.1177/15353702022270080]
  • C. Savory and J. M. Lariviere, "Effects of qualitative and quantitative food restriction treatments on feeding motivational state and general activity level of growing broiler breeders", Applied Animal Behaviour Science, Vol. 69, No. 2, pp. 135-147, Sep. 2000. [https://doi.org/10.1016/S0168-1591(00)00123-4]
  • D. K. Ingram, "Age-related decline in physical activity generalization to nonhumans", Medicine and Science in Sports and Exercise, Vol. 32, No. 9, pp. 1623-1629, 2000. [https://doi.org/10.1097/00005768-200009000-00016]
  • H. Kristensen, J. M. Aerts, T. Leroy, C. Wathes, and D. Berckmans, "Modelling the dynamic activity of broiler chickens in response to step-wise changes in light intensity", Applied Animal Behaviour Science, Vol. 101, No. 1-2, pp. 125-143, Dec. 2006. [https://doi.org/10.1016/j.applanim.2006.01.007]
  • M. Smit, R. A. Corner-Thomas, K. Weidgraaf, and D. G. Thomas, "Assocaition of age and body condition with physical activity of domestic cats (felis catus)", Applied Animal Behaviour Science, Vol. 248, pp. 105584-105592, Mar. 2022. [https://doi.org/10.1016/j.applanim.2022.105584]
  • L. Bergamini, et al., "Extracting accurate long-term behavior changes from a large pig dataset", 16th International Joint Conference on Computer Vision, Imageing and Computer Graphics Theory and Applications (VISGRAPP 2021), pp. 524-533, 2021. [https://doi.org/10.5220/0010288405240533]
  • J. Redmon and A. Farhadi, "Yolov3:An incremental improvement", arXiv:1804.02767, , Apr. 2018. [https://doi.org/10.48550/arXiv.1804.02767]
  • S. Pini, M. Cornia, F. Bolelli, L. Baraldi, and R. Cucchiara, "MVAD names: a dataset for video captioning with naming", Multimedia Tools and Applications, Vol. 78, pp. 14007-14027, Dec. 2018. [https://doi.org/10.1007/s11042-018-7040-z]
  • A. Costa, F. Borgonovo, T. Leroy, and D. Berckmans, and M. Guarino, "Dust concentration variation in relation to animal activity in a pig barn", Biosystem Engineering, Vol. 104, No. 1, pp. 118-124, Sep. 2009. [https://doi.org/10.1016/j.biosystemseng.2009.05.009]
  • K. Buettner, I. Czycholl, K. Mees, and J. Krieter, "Temporal development of agonistic interactions as well as dominance indices and centrality parameters in pigs after mixing", Applied Animal Behaviour Science, Vol. 222, pp. 104913-104922, Jan. 2020. [https://doi.org/10.1016/j.applanim.2019.104913]
  • J. N. Marchant-Forde, "Introduction to the Welfare of Pigs", The welfare of pigs, Springer Science & Business Media, Vol 7, pp. 1-12, 2008. [https://doi.org/10.1007/978-1-4020-8909-1_1]
  • M. P. Akerfeldt, S. Holmstrom, A. Wallenbeck, and E. Ivarsson, "Inclusion of intensively manipulated silage in total mixed ration to growing pigs-influence on silage consumption, nutrient digestibility and pig behaviour", Acta Agriculturae Scandinavica, Section A – Animal Science, Vol. 68, No. 4, pp. 190-201, Feb. 2020. [https://doi.org/10.1080/09064702.2020.1725104]
  • L. Grinztajin, E. Oyallon, and G. Varoquaux, "Why do tree-based models still outperform deep learning on typical tabular data?", In Advances in Neural Information Processing Systems (NeurIPS), Vol. 35, pp. 507-520, 2022.
  • D. Chicco, M. J. Warrens, and G. Jurman, "The coefficient of determination r-squared is more informative than smape, mae, mape, mse, and rmse in regression analysis evaluation", PeerJ Computer Science., Vol. 7, Jul. 2021. [https://doi.org/10.7717/peerj-cs.623]
  • M. R. E. Symonds and A. Moussalli, "A brief guide to model selection, multimodel inference and model averaging in behavioural ecology using akaike’s information criterion", Behavioral Ecology and Sociobiology, Vol. 65, pp. 13-21, Aug. 2011. [https://doi.org/10.1007/s00265-010-1037-6]
  • A. Moller and M. D. Jennions, "How much vairance can be explained by ecologist and evolutionary biologist?", Oecologia, Vol. 132, pp. 492-500, Aug. 2002. [https://doi.org/10.1007/s00442-002-0952-2]
저자소개
조 예 성 (Yesung Cho)

2022년 2월 : 한동대학교 ICT창업학부(공학사)

2024년 2월 : 한국과학기술원 데이터사이언스 대학원(공학석사)

관심분야 : 컴퓨터 비전, 머신러닝, 딥러닝

Nabilah Muallifah

2018년 7월 : 가자 마다 대학교 (Gadjah Mada Univ.) 산업공학부(공학사)

2024년 2월 : 한국과학기술원 데이터사이언스 대학원(공학석사)

관심분야 : 비스니스 애널리틱스

Fachrina Dewi Puspitasari

2014년 2월 : 인도네시아 국립대학교 (University of Indonesia) 기계공학부(공학사)

2024년 2월 : 한국과학기술원 데이터사이언스 대학원(공학석사)

관심분야 : 딥러닝, 인공지능

김 유 승 (Yusung Kim)

2019년 2월 : 경북대학교 농업경제학과(경제학사)

2022년 2월 : 한국과학기술원 기술경영전문대학원(공학석사)

2022년 2월 : 한국과학기술원 기술경영학부(창업융합전문석사)

2022년 3월 ~ 현재 : 한국과학기술원 데이터사이언스 대학원 박사과정

관심분야 : 데이터베이스, 딥러닝, 머신러닝

Mhd Anas Al Saidi

2021년 2월 : 다마스커스 대학 (Damascus Univ) 정보 시스템 공학부(공학사)

2022년 9월 ~ 현재 : 한국과학기술원 데이터사이언스 대학원 석사과정

관심분야 : 데이터베이스, 딥러닝

이 문 용 (Munyong Yi)

1998년 2월 : 매릴랜드 대학교 정보 시스템 공학(공학박사)

2005년 8월 ~ 2009년 8월 : 사우스캐롤리나 대학(University of South Carolina) 교수

2009년 8월 ~ 현재 : 한국과학기술원 산업 및 시스템 공학부 교수

관심분야 : 정보시스템, 딥러닝, 인간공학

Fig. 1.

Fig. 1.
Examples of Edinburg dataset (a) Pig object-specific bounding box and behavior label for the pig (b) Depth maps in the image

Fig. 2.

Fig. 2.
Occupation index

Fig. 3.

Fig. 3.
Illustration how to calculate pixel difference in frame-to-frame background-removed images

Fig. 4.

Fig. 4.
Example of activity index data observed from November 28th to November 30th, Activity index in 1-minute increments (gray) and activity index in 1-hour increments (red) with average smoothing to reduce variation

Fig. 5.

Fig. 5.
Graph of the actual value (yellow) and predicted value (green) of the activity index using a random forest, The vertical line (cream) is December 9th, based on the split between training and test data

Fig. 6.

Fig. 6.
Violin plots of when exogenous events occurred (green) and not occurred (yellow) for the introduction of an object into the pen (a), intervention of human (b), and other types of disturbance to the pig herd (c) The screenshots of the clips on the right illustrate the provision of plaything (a.i) and straw (a.ii), the intervention of man for cleaning (b.i) and other random activities (b.ii), and the disturbance due to gate opening (c.i) and feeding (c.ii)

Fig. 7.

Fig. 7.
Boxplot of error values (1st quartile is 0.036, median is 0.071, 3rd quartile is 0.1393, and IQR is 0.1026)

Fig. 8

Fig. 8
Examples of high error samples. All four shows events that occurred between 11 a.m and 12 p.m on November 7th (a) clean event occurred, (b) the increase in exploratory behavior of pigs after cleaning, (c) the straw supply and (d) starting to group nudging as their exploratory activity increases

Table 1.

Description of main variales used in the regression models

Variable Description
Previous hour Aidx* Aidx at one hour beforec,$
Previous day Aidx Aidx at one day beforec,$
Age Timepoint (day) of observationa
Occupation Index Mean area of bounding boxc,$
Eating # of eating activty in an houra,$ (2.5s)
Drinking # of drinking activity in an houra,$ (2.5s)
Lying # of lying activity in an houra,$ (2.5s)
Cleaning operation entering pen for cleaningb
Rand. intervention entering pen for miscellanyb
Plaything supply plaything provision like b
Straw supply Provision straw for warmth, exploratory behavior, etc.,b
Food refill Occasional food replenishmentb
Pen access pigs exiting and entering penb
Morning 9 Time from 9:00 to 10:00b
Morning 10 Time from 10:00 to 11:00b
Morning 11 Time from 11:00 to 12:00b
Noon 12 Time from 12:00 to 13:00b
Afternoon 13 Time from 13:00 to 14:00b
Afternoon 14 Time from 14:00 to 15:00b
Afternoon 15 Time from 15:00 to 16:00b
Afternoon 16 Time from 16:00 to 17:00b
Afternoon 17 Time from 17:00 to 18:00b
Afternoon 18 Time from 18:00 to 19:00b
Afternoon 19 Time from 19:00 to 20:00b

Table 2.

Parameter for the likelihood of change in activity index, The linear regression model presents 12 significant farming attributes affecting the probability of fluctuation in pig activity index

Variable Coefficient Regression val
Previous hour Aidx β1 0.2169*
Previous day Aidx β2 0.1338*
Age β3 -0.0001
Occupation index β4 -0.0001
Eating β5 -0.0015*
Drinking β6 0.0001
Lying β7 -0.0001
Cleaning operation β8 0.4286***
Rand. intervention β9 0.5172***
Plaything supply β10 0.6570***
Straw supply β11 0.5256***
Food refill β12 0.3458*
Pen access β13 0.0760
Morning 9 β14 0.0401
Morning 10 β15 0.0653
Morning 11 β16 -0.0120
Noon 12 β17 0.0808
Afternoon 13 β18 -0.0995
Afternoon 14 β19 -0.0471
Afternoon 15 β20 -0.0470
Afternoon 16 β21 -0.2746**
Afternoon 17 β22 -0.2715*
Afternoon 18 β23 -0.3037**
Afternoon 19 β24 -0.2972**
R2 0.6390
F-static 12.39
Adjusted R2 0.5874
p-value 2×10-16

Table 3.

Prediction results from machine learning methods (LR means Linear Regression, SVR means support vector regressor, XGB means XGBoost, RF means random forest)

Machine Train Test
R2 MAPE R2 MAPE
LR 0.648 0.548 0.649 0.416
SVR 0.621 0.474 0.640 0.311
XGB 0.792 0.448 0.730 0.306
RF 0.877 0.312 0.714 0.300

Table 4.

High error sample lists (1 : with exogenous events, 0 without exogenous events)

Date Actual
aidx
Predicted
aidx
Error Cleaning
operation
Straw
supply
Food
refill
Plaything
supply
Pen
access
Rand.
intervent
11/07 11:00 1.570 1.270 0.303 1 1 0 0 0 0
11/08 14:00 1.240 0.937 0.308 0 0 0 0 0 1
11/29 13:00 2.000 1.380 0.622 0 1 0 1 0 1
12/05 08:00 1.360 1.060 0.297 0 0 1 0 0 1
12/10 08:00 1.310 0.958 0.355 1 0 1 1 0 0