Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 18, No. 6, pp.1-9
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 30 Jun 2020
Received 10 Apr 2020 Revised 16 Jun 2020 Accepted 19 Jun 2020
DOI: https://doi.org/10.14801/jkiit.2020.18.6.1

이질 공공빅데이터 기반 농장별 맞춤 병해충 예측 모델

유신성* ; 최기쁨* ; 명현** ; 오효정***
*전북대학교 기록관리학과 석사과정
**전북대학교 생태조경디자인학과 교수
***전북대학교 문헌정보학과 부교수(교신저자) 문화융복합아카이빙 연구소
Prediction Model of Pest According to Individual Farms Based on Heterogeneous Public Big data
Sin-Seong Yu* ; Kippeum Choi* ; Hyun Myung** ; Hyo-Jung Oh***

Correspondence to: Hyo-Jung Oh Dept. of Library & Information Science, Jeonbuk National University, 567 Baekje-daero, Deokjin-gu, Jeonju, Jeollabuk-do, Korea (54896) Tel.: +82-63-270-3208, Email: ohj@jbnu.ac.kr

초록

병해충은 발병 전 예방 위주 관리가 필요하며, 최근 병해충과 토양의 상관성이 입증되면서 기존 연구와 다른 새로운 예측모델의 필요성이 대두되었다. 이에 본 논문에서는 이질(heterogeneous) 공공빅데이터 기반 농장별 병해충 예측모델을 제안한다. 이 모델은 기존 ‘진단’ 위주의 연구가 아닌 ‘예측’을 중심으로 하며, 기상 정보 뿐만 아니라 전국 농경지 정보 및 토양, 병해충 정보 등 다양한 빅데이터를 수집·정제하여 약 370만 데이터를 활용하였다. 특히 수집된 요인들의 상관관계를 분석하여 병해충 예측에 효과적인 자질만 선별하여 병해충 발생 여부 및 발생 병해충을 예측하였다. 제안된 방법은 최종적으로 병해충 종합관리(IPM; Integrated Pest Management)를 사용하여 ‘상생형’ 병해충 예측 및 방제 시스템을 위한 사전 연구로 활용될 것이다.

Abstract

Pest managements are required preventive care before the outbreak. Recently, the correlation between pests and soil has been proved, and then it has beed increased the need for new predictive models different from existing studies. In this study, we propose prediction model of pest according to individual farms based on heterogeneous public big data. The model is focused on ‘prediction’ rather than existing ‘diagnosis’ research. In addition, we collected and refined information of various big data such as farmland, soil, pest historic records, as well as weather information, and finally utilized total of over 3.7 million data. Especially, the correlation of the collected factors was analyzed to select only the effective qualities for predicting pests. A two-step model was proposed for the prediction of pests in this study: The proposed model will be ultimately used as a preliminary study for the pest prediction and control system of ‘win-win’ using IPM(Integrated Pest Management).

Keywords:

public big data, pest prediction, farm-map, machine learning, IPM(integrated pest management)

Ⅰ. 서 론

농업은 인류에게 중요한 기간산업이자 생명산업으로 미래에 가장 유망하고 잠재력이 뛰어난 산업으로 꼽히고 있다. 그러나 기후 및 농업환경 변화, 국제 교역 확대로 외래병해충 증가 등 병해충으로 인한 농작물 손실이 날로 증가하고 있다[1]. 최근 병해충 발병은 기상조건 외에도 토양의 상태와 밀접한 관련이 있음이 국내외 연구에서 입증되었으며[2][3], 토양과 병해충의 관계에 관한 연구가 활발히 이루어지는 추세이다. 병해충은 사람과 마찬가지로 발병하고 난 후에 더 많은 농약과 처리 과정이 수반되는데, 특히 발병 후 작물이 자라는데 직접적인 피해를 주는 토양 병해는 농가 경제에 큰 손해를 끼친다. 따라서 토양 병해의 특성상 발병 이후 치료보다 예방 위주의 관리가 필요하다[4].

최근 이와 같은 예방적 관점에서 병해충 종합관리(IPM, Integrated Pest Management, 이하 IPM) 방법이 각광을 받고 있다. IPM은 다양한 병해충 방제기술을 동원하여 병해충 발생량을 경제적 피해수준 이하로 유지함으로써 병해충 방제효과의 경제성을 확보하고 환경과 인축에 미치는 위험은 최소화 시키는 병해충 관리 전략을 의미한다[5]. 본 연구의 궁극적인 목적은 IPM 유형 중 예방적 경종기술의 실현을 위해 병해충 발병 전 해당 병해충을 예측하는 것을 목표로 한다.

한편, IPM 관련 선행연구[6]에서는 개인적인 IPM 사용은 인접농장에 악영향을 미칠 수 있음을 경고하였다. 이에 본 연구는 더 근본적으로 나의 농장뿐만 아니라 이웃의 농장까지 보호하기 위한 IPM 방제법을 추천을 위한 사전 연구로, 공공데이터를 활용한 농장별 병해충 예측 모델을 제안하고자 한다.

논문은 구성은 다음과 같다. 먼저 1장에서는 연구에 대한 배경과 목적, 연구의 필요성에 관해 기술하였고, 2장에서는 병해충 관리와 관련된 선행연구들을 살펴보고 본 연구와의 차이점을 밝힌다. 3장에서는 농장별 맞춤형 방제법 추천을 위한 2단계 병해충 예측모델을 설명하고, 본 연구에서 실제 수집한 이질(Heterogeneous) 공공빅데이터의 특성과 전처리 과정을 기술한다. 4장에서는 병해충 예측을 위한 기계학습 모델 선정 과정과 학습 결과에 관해 상세 기술한다. 마지막으로 5장에서는 연구의 결과에 대한 담론과 향후 연구 방향에 대해 논의한다.


Ⅱ. 관련 연구

최근 농업 관련 데이터의 축적과 기계학습 기법의 발달로 병해충을 사전에 예측하기 위한 기술들이 많이 개발되었으며, 특허, 논문, 사이트 등 다양한 분야에서 발표되었다.

우선 특허 분야에서 [7]은 병해충 징후 예찰 및 예측방법을 연구하였는데 병해충을 예측하기 위해 주로 ‘기상’ 데이터를 이용하였다. 일부 토양상태를 고려하긴 하였지만, 토양의 ‘수분’ 정보만을 활용하여 연구가 진행되었다. 또 [8]에서는 병해충 발생 예측 장치 및 방법을 제시하였는데 온실 내 시설 작물만을 연구대상으로 선정했다는 한계점이 있다.

논문 분야에서 [9]는 실시간 시간별 기상자료를 이용한 종합적인 병해충 발생 예측시스템을 연구하였는데, 이 역시 배와 사과 등 특정 작물로 연구대상으로 선정하였고 병해충 예측을 위해 단일변수로 ‘기상' 데이터만을 분석하였다. 이와 유사하게 [10]은 센서를 이용하여 ‘온습도’와 ‘토양’ 데이터를 수집하였지만, 광범위한 농장에서의 실현이 불가하여 온실 내 시설 작물만을 연구대상으로 선정하였다. [11]은 병해충 검색을 위한 이미지 검색 및 인식 통합시스템을 제안하였다. 이 연구에서는 유사도 기반의 이미지 검색 기술과 딥러닝 알고리즘을 사용한 영상 인식 기반의 검색 기술을 적용하여 병해충 농가에서 실시간으로 병해충으로 의심되는 작물을 촬영하고 검색하여 진단할 수 있게 하였다. 그러나 이들 연구는 병해충의 ‘진단’에 관한 연구로, 발병 이전 ‘예측’에는 활용할 수 없다는 한계가 있다.

병해충 관리 관련 웹사이트로는 [12]의 병해충예측지도가 있는데, 정보제공 기간이 제한적이고 9가지 작목에 한하여 병해충 예측이 가능하다. 또한, 기존 연구와 유사하게 병해충 예측을 위해 단일변수로 ‘기상' 데이터만을 분석하였다.

이를 종합하여 기존 연구와 차별되는 본 연구의 특징은 크게 세 가지로 볼 수 있다. 첫 번째, 병해충 관련 대부분 연구가 병해충의 ‘진단’, 즉 발병 이후를 다루고 있지만 본 연구는 병해충 발병 전 ‘예측’을 중점으로 한다. 두 번째, 대부분의 병해충 관련 연구가 단일변수 특히 ‘기상' 데이터만을 학습변수로 하여 진행되어왔다. 그러나 앞서 언급한 바와 같이 병해충 발병은 기상조건 외에도 토양의 상태와 밀접한 관련이 있다. 따라서 본 연구에서는 ‘기상' 데이터뿐만 아니라 ‘토질감정’, ‘화학성분’ 데이터 등 다양한 이질변수로 확장하여 병해충 예측을 하고자 한다. 세 번째, 기존 연구에서는 다양한 작물과 전국단위 농경지에 관한 연구가 진행되지 않았는데 이는 국지적 농장에 특화된 시설 작물을 위주로 연구를 하였기 때문이다.

따라서 본 연구에서는 연구대상을 특정 시설이나 특정 지역의 농장처럼 국지적 범위가 아닌 농림축산식품부와 농촌진흥청에서 공공데이터 포털을 통해 제공되고 있는 ‘전국 농경지 전자지도 팜맵(Farm-map, 농림축산식품부 팜맵, https://www.data.go.kr/dataset/15034381/fileData.do)의 지원정보를 이용하여 전국의 각 농장을 연구대상 범위로 확장하였다.


Ⅲ. 팜맵기반 병해충 예측 시스템

3.1 병해충 예측 연구 모델

그림 1은 본 연구의 궁극적인 ‘상생형’ 병해충 예측 및 방제 모델을 도식화 한 것으로 그 특징은 다음과 같다. 첫 번째, 이용자 농장의 위치 정보, 기상 정보, 토양 정보, 병해충 정보 등 이질 데이터를 수집·분석하여 농장정보를 파악한다. 두 번째, 이용자의 농장정보를 기반으로 농장별 병해충 발생 유/무와 농장 작황 작물에 발생할 병해충을 예측한다. 세 번째, 이용자의 농장과 인근 농장의 발생할 수 있는 병해충을 고려하여 IPM 방제법을 추천한다. 마지막으로 앞선 단계의 결과들을 시각화하여 제공한다. 본 논문에서는 이 중 첫 번째와 두 번째 결과(점선 박스)를 중심으로 기술한다.

Fig. 1.

'win-win' pest prediction and control model

구체적인 병해충 예측 모델의 학습 과정은 그림 2와 같이 2단계로, 1) 병해충 유/무를 예측하는 이진분류(Binary classification) 모델을 적용하는 단계와 2) 농장 작황 작물에 따라 세부 123개의 병해충 중 어떤 병인지를 예측하는 다중분류(Multi label classification) 모델단계로 진행하였다. 그림 3은 본 연구의 최종 목표인 나의 농장뿐 아니라 인근 농장까지 고려하려 피해를 최소화하는 IPM 유형에 따른 방제법 추천 모델이다.

Fig. 2.

Pest prediction model, (a) Pest occurred binary classification, (b) Pest multi-classification

Fig. 3.

Recommendation model for control methods according to IPM types

3.2 데이터 수집 및 전처리

3.2.1 이질 데이터 수집

표 1은 본 연구에서 활용한 이질 공공빅데이터를 정리한 것으로, 다양한 출처와 형식으로 구성되어 있어 이를 위한 정규화 및 보정 작업 등 전처리 작업이 수반된다. 구체적으로 살펴보면 첫 번째, 팜맵 정보는 특별시 및 광역시 8개와 도 9개의 농장데이터를 포함하고 있으며 지역별 위치정보를 비롯해 농장별 영상 지번 정보 등이 포함되어있다. 두 번째, ‘기상’ 정보는 시간단위, 극단위, 일단위 등의 농업기상과 종관기상의 정보가 포함되어있다. ‘기상’ 정보 중 농업기상의 경우 농촌진흥청 농업기상정보(https://www.data.go.kr/dataset/3061366/fileData.do)에서, 종단기상의 경우 기상청 기상데이터(https://www.data.go.kr/dataset/15000765/fileData.do)에서 정보를 제공받았다.

Collection data

본 연구에서는 ‘기상’ 정보 중 시간단위와 극값 데이터는 편향된 결과가 나올 것을 우려하여 일단위를 선정하였다. 세 번째, ‘토양’ 정보는 농장별 토양의 성분 및 형질 등, 토질의 상태를 검정한 정보가 포함되어있다. 네 번째, ‘병해충’ 정보는 과거에 발생한 병해충과 발생지 이력 정보와 의심되는 사례를 조사한 정보 등 병해충 발생과 관련 정보가 포함되어있다.

본 연구에서는 개방된 공공데이터만을 사용했지만, 추후 스마트팜 확대에 따라 각 농장에서 IoT센서를 설치함으로써 실시간으로 기상, 토양, 작물의 상태 정보를 입력받아 확장할 계획이다.

3.2.2 데이터 전처리

수집된 이질 데이터의 전처리 과정은 다음과 같다. 우선 각 테이블을 SQLite를 이용하여 하나의 테이블로 통합하였고, Python 환경에서 NumPy와 Pandas를 이용하여 Raw data를 Feature Scaling 실시하였다. 데이터 전처리 과정을 거쳐 생성된 Structured data를 ScikitLearn과 TensorFlow, Keras로 병해충 예측모델을 학습시키고 확률 결과를 Pickle로 저장한다.

이 과정 중 이질 데이터 정규화 및 보정을 위해 다음 세 가지를 수행하였다. 첫 번째, 팜맵 정보, 기상 정보, 토양 정보, 병해충 정보의 수집데이터를 하나의 테이블로 통합하여 데이터 세트를 정리하였다. 두 번째, 결측값(Missing value)을 처리하였다. 세 번째, 이산형 변수는 one-hot-encoding을 통해, 연속형 변수는 단위 통일과 수치 보정(반올림 등)을 통해 정규화하였다. 최종적으로 55개 요인으로 구성된 총 3,746,403건의 데이터를 확보할 수 있었다.


Ⅳ. 병해충 예측 모델 학습

4.1 요인별 상관관계 분석

본격적인 학습에 들어가기에 앞서 수집된 표 1의 이질 데이터들의 요인별 상관관계를 확인하였다. 이는 병해충 발생과 밀접한 요인들을 뽑아내고 관련성이 떨어지는 요인들을 제거함으로써 예측 결과 정확도 뿐 아니라 학습 속도 등 효율을 높이기 위함이다. 그림 4는 요인별 상관관계 분석 결과이며, 관련성이 높은 요인부터 순차적으로 기존 55개 요인을 26개로 축소하였다.

Fig. 4.

Factor-specific correlation result

세부 요인을 ‘토양’과 ‘기상’ 요인으로 나눠 살펴보면, ‘토양’ 요인은 ‘실제비료마그네슘사용량’, ‘전기전도도’, ‘염기치환용량’, ‘유효규산농도’, ‘실제비료칼리사용량’, ‘질산태질소용량’, ‘실제비료석회사용량’, ‘유효인산농도’, ‘석회소요량’, ‘산도’, ‘유기물함량’, ‘암모니아태질소용량’ 총 12개이며, ‘기상’ 요인은 ‘평균지면온도’, ‘최고기온’, ‘최저기온’, ‘최저초상온도’, ‘일강수량’, ‘평균현지기압’, ‘평균상대습도’, ‘최대풍속’, ‘일사량’, ‘습도’, ‘기온’, ‘토양수분’, ‘지중온도’, ‘초상온도’ 14개이다. 이 26개의 요인이 병해충 예측에 주요 영향을 미치는 요인으로 파악되었고, ‘토양’ 요인이 ‘기상’ 요인의 개수와 유사함에 따라 토양과 병해충의 상관성을 다시 확인할 수 있었다.

4.2 모델 학습

병해충 예측을 위해서 병해충 예측모델 학습이 필요하다. 이에 본 연구에서는 앞서 선별된 26개 요인 데이터를 기반으로 기계학습 기법의 성능을 비교한 후, 가장 높은 성능을 가진 모델을 조합하여 연구를 진행하였다. 병해충 예측모델 학습 방법별 정확도 결과는 그림 5와 같다.

Fig. 5.

Accuracy by model learning method

정확도 결과에 있어서 MLP와 RF의 방법이 가장 정확도가 높았고 근소한 차이를 보였다. MLP는 손실(loss) 함수 갱신을 수행하는 확률적 경사 하강법(SGD, Stochastic Gradient Descent)에 기반한 학습방법이며 RF는 의사결정트리(T)에 기반한 알고리즘으로 변수 중요도(I) 평가를 파라미터로 활용하는 모델이다. 아래는 각각 MLP와 함수식[13]과 RF의 함수식[14]이다.

MLP:ww-ηαRww+αLossw(1) 
RF:Qx,j=kIy,xTk,B(2) 

본 연구에서는 MLP와 RF를 조합하여 사용하는 앙상블 기법(Ensemble learning)을 활용하였다. 또한, 모델의 과적합(Overfitting)을 방지하고 성능을 높이기 위해 학습데이터와 테스트데이터를 구분하였다. 학습데이터와 테스트데이터의 비율은 8:2로 설정하였다. 그 결과 데이터 세트 총 3,746,403건 중 학습데이터는 2,997,121건, 테스트데이터는 749,281건으로 구분되었다. 그 외에 과적합 방지를 위해 Batch Normalization과 Dropout을 사용하였다.

모델 학습은 그림 2(a)와 같이 병해충 발생 여부를 예측하는 이진분류로, 26개의 자질을 입력받아 이진 분류를 수행, 병해충 발생 유/무의 확률이 출력된다. 이후 발생 여부에 따라 구체적인 병해충 명을 예측하는 다중분류모델(그림 2(b))은 작물마다 발생 가능한 병해충이 다르므로 기존 제시된 26개 요인에 본인 농장에서 작황 중인 ‘작물 유형’이 추가된 27개의 속성으로 모델 학습을 실시하였다.

모델 학습에 사용한 파라미터 값은 다음과 같다. 우선 병해충 발생여부를 위한 이진분류의 입력층 Dense는 30, input_dim은 26, activation은 ‘relu’로 설정하였고, SGD의 경우 lr을 0.01로 하였다. 출력층에서는 Dropout을 0.5로 설정하였고, Dense는 1, activation은 ‘sigmoid’로 설정하였다. 그 후 batch_size 64, epoches 10으로 설정하고 학습을 진행하였다. 병해충 다중분류 모델에서 입력층의 Dense는 32, input_dim은 27, activation은 ‘relu’로 설정하였고, 출력층에서 Dense는 123, activation은 ‘softmax’를 설정하였다. 그 후 batch_size 128, epoches 10으로 설정 후 학습을 진행하였다. 최종적으로 본 연구에서는 작물 유형 23종에서 발생한 123개의 병해충에 대해 학습을 실시하였다.

4.3 모델 학습 결과

1단계 병해충 유/무를 예측하는 이진분류 모델의 학습결과를 평가하기 위해 분류성능평가지표(Confusion matrix)를 사용하였고, 결과는 표 2와 같다.

Results of assessment of whether or not pests have occurred

앞서 요인별 상관관계 분석 결과(그림 4 참조)에 의해 선별된 자질 26개를 활용한 최적 학습 모델 평가 결과, 정밀도(Precision)가 98.57%, 재현율(Recall)이 94.23%, 정확도(Accuracy)는 93.56%로 평가되었다. 정밀도는 모델이 병해충 발생이 했을 것이라고 판단한 것 중 “true”인 경우를, 재현율은 실제 병해충이 발생한 경우를 얼마나 잘 맞췄는지를 평가한 수치이다. 정확도는 실제 병해충 발생이 “true”인 경우를 “true”라고, 발생하지 않은 경우를 “false”를 “false”로 예측한 경우를 평가한 비율이다. 일반적으로 병해충 발생 예측의 경우 정밀도보다는 재현율이 더 중요한데 이는 앞서 언급한 바와 같이 병해충이 발생하기 전에 발병여부를 예측하는 것이 발병 이후 후속조치보다 처리 비용과 작물에 미치는 영향이 크기 때문이다.

표 2와 같이 기존 선행연구에서와 같이 기상 관련 자질(43개)를 사용한 모델과 토양 관련 자질(12개)을 개별로 사용했을 경우와 비교하여 제안된 모델이 더 예측률이 높은 것을 확인할 수 있다. 특히 재현율이 타 모델에 비해 높게 나타난 것은 매우 의미있는 결과이다.

반면 전반적으로 재현율보다 정확도가 높게 나타났는데, 이는 애초 학습데이터에 병해충이 발생하지 않은 정상 환경의 데이터가 더 많은 불균형 문제(Biased problem) 특성 때문이다. 후에 병해충 발생 데이터가 충분히 축적된다면 개선될 것으로 생각된다.

다음으로 123개 병해충 다중분류 모델 예측 정확률을 분석한 결과, 70.35%의 정확도를 보였다. 그림 6은 23종의 작물 유형 중 대상 작물을 ‘논벼’로 설정하고 학습한 결과를 예시한 것으로, 각각의 발생할 병해충의 예상 확률을 내림차순으로 정렬한 결과이다. 그림에서 나타나듯, 수집된 기상 및 토양 데이터에서 ‘흰잎마름병’이 가장 확률이 높게 나타났다. 이러한 확률정보를 통해 우선적으로 방제가 필요한 병해충을 확인할 수 있다. 또 향후 이웃의 작물 정보 및 예상 병해충 정보를 종합적으로 고려해 해당 병해충의 방제법을 접목함으로써 IPM의 예방적 경종기술을 실현할 수 있다.

Fig. 6.

Results of 'rice's study on pests


Ⅴ. 결론 및 향후 과제

병해충 피해 증가는 곧 농민의 경제적 손실뿐 아니라 토양의 훼손, 작물 수급의 어려움 등 국가 전체의 피해로 이어진다. 따라서 발병 전에 예방을 잘 해야 농장의 피해와 농약 사용량을 줄일 수 있다. 본 연구는 이질 공공빅데이터를 기반으로 기계학습을 통해 토양, 기상, 병해충 간의 상관관계를 파악하여 병해충을 예측하는 모델을 제안하였다.

본 연구를 통해 기대되는 효과는 다음과 같다. 우선 국가 차원으로 국가 병해충 예측 및 관리체계 확립을 할 수 있다. 예측 결과를 토대로 지자체에서는 적절한 방제법과 시기를 미리 공지할 수 있고, 농업 생산력 향상을 도울 수 있다. 또한, 농가 차원으로 작물의 병해충을 예방하기 위한 선제적 조치가 가능하다. 주기적으로 여러 농약을 혼용해서 살포하던 관행에서 예측 결과를 통해 적절한 시기에 올바른 농약을 사용하여 방제할 수 있다.

향후 연구 과제로는 분석 고도화를 위해 학습변수를 다양화하고 시계열 분석과 통계 기법을 추가해야 한다. 또한, ‘병해충에 저항성 강한 품종’과 ‘농약허용물질목록관리제도(PLS, Positive List System, http://www.nongsaro.go.kr/portal/ps/psz/psza/contentMain.ps?menuId=PS04352)’의 데이터를 추가한다면 그림 3과 같이 본인의 작황 작물 뿐 아니라 인근 농장의 작물에도 피해가 적고 효과적인 방제법을 추천할 수 있다. 나아가 그림 1과 같이 본 연구에서 산출된 학습모델을 효과적으로 활용하기 위해서는 지도 시각화를 통해 웹사이트를 시범화하고 모바일 어플리케이션으로 구현하는 등 서비스 확대가 필요하다.

Acknowledgments

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 한국연구재단 – 재난안전플랫폼기술개발사업의 지원을 받아 수행된 연구임(No. NRF-2016M3D7A1912703).

이 논문은 2019년 ‘농식품 공간데이터 분석활용대회’에 출품한 아이디어를 확장, 보완한 연구임

References

  • Yong-Hwan Lee, "Focus - National Pest Management System - One-stop Treatment of Pest Prediction, Prediction and Diagnosis", Life and Agrochemicals, Vol. 277, pp. 22-25, May 2012.
  • R. Kasten Dumroese, “Review of Forest Nursery Pests”, Native Plants Joural, Vol. 13, No. 3, pp. 16-19, Jun. 2012. [https://doi.org/10.3368/npj.13.3.257]
  • Chang-Gil Kim, "Evaluation of Soil nourishment Management Policy in Korea", KREI, pp. 1-105, Mar. 2014.
  • Choong-Hoe Kim and Yong-Ki Kim, "Present Status of Soilborne Disease Incidence and Scheme for Its Integrated Management in Korea", Research in plant disease, Vol. 8, No. 3, pp. 146–161, Dec. 2002. [https://doi.org/10.5423/RPD.2002.8.3.146]
  • Eun-woo Park, Young Jin Koh, Sung-Chul Yun, Chuleul Jung, Ki Woo Kim, Ki Seok Do, and Haeng Geum Lee, "Strategic approach for crop management R&D in the context of climate change", IPET, pp. 1-76, Jan. 2013.
  • Susmita Dasgupta, Craig Meisner, and David Wheeler, "Is Environmentally Friendly Agriculture Less Profitable for Farmers? Evidence on Integrated Pest Management in Bangladesh", Review of Agricultural Economics, Vol. 29, No. 1, pp. 103-118, Mar. 2007. [https://doi.org/10.1111/j.1467-9353.2006.00332.x]
  • THE IMC, Disease and Insect Pest Signs Predicting Method, Korea Patent 1016618460000, Sep. 26, 2016
  • KT Corporation, Apparatus and Method for Predicting Disease and Pest of Crops, Korea Patent 1020140186382, Dec. 22, 2014
  • Eun Woo Park, Yong Uk Shin, Wee Soo Kang, Dong Hyuk Lee, Young Sub Park, and Dong Su Sohn, "An integrated disease and insect pest forecasting system using realtime hourly weather data", The Korean Society of Agricultural and Forest Meteorology Academic Presentation Papers, Vol. 2005, No. 2, pp. 71-73, Sep. 2005.
  • Yeo Jin Lee, Da Woon Jeong, Seong Joon Yoo, Yeong Hyeon Gu, Zhegao Piao, Helin Yi, and Jong Han Park, "An Integrated Image Retrieval and Recognition System for Detecting Diseases and Insect Pests", The Journal of Korean Institute of Next Generation Computing, Vol. 13, No. 4, pp. 100-111, Aug. 2017.
  • Eun-Cheon Lim, Je-Jun Kim, Chang-Sun Shin, Choon-Bo Shim, and Jeong-Hoon Lee, "Implementation of a Multimedia Pest Prediction Management System for Mobile Users", The Korea Contents Association Academic Presentation Papers, Vol. 5, No. 1, pp. 1-5, Jun. 2007.
  • NCPMS: https://ncpms.rda.go.kr/npms/SpaceDistributionSearchR.np, . [accessed: Mar. 08, 2020]
  • F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A.Passos, D. Cournapeau, M. Brucher, M. Perrot, and E. Duchesnay, "Scikit-learn: Machine learning in Python", The Journal of Machine Learning Research, Vol. 12, pp. 2825-2830, Dec. 2011
  • Leo Breiman, "Random Forest", Machine Learning, Vol. 45, pp. 5-32, Oct. 2001. [https://doi.org/10.1023/A:1010933404324]
저자소개
유 신 성 (Sin-Seong Yu)

2019년 2월 : 전북대학교 문헌정보학과(문헌정보학사)

2019년 3월 ~ 현재 : 전북대학교 기록관리학과 석사과정

관심분야 : 전자기록, 빅데이터정보처리

최 기 쁨 (Kippeum Choi)

2016년 8월 : 전북대학교 프랑스학과(문학사)

2017년 ~ 2019년 : 전북대학교 신한류창의인재양성사업단 연구원

2019년 9월 ~ 현재 : 전북대학교 기록관리학과 석사과정

관심분야 : 전자기록, 콘텐츠, 빅데이터정보처리

명 현 (Hyun Myung)

1993년 2월 : 원광대학교 원예학(농학사)

1995년 8월 : 원광대학교 조경학(조경학석사)

1998년 3월 : 청주대학교 도시환경계획(공학박사)

1998년 4월 ~ 현재 : 전북대학교 생태조경디자인학과 교수

관심분야 : 도시환경계획, 빅데이터정보처리

오 효 정 (Hyo-Jung Oh)

2008년 : 한국과학기술원 컴퓨터공학과(공학박사)

2000년 ~ 2015년 : 한국전자 통신연구원 지식마이닝연구실 책임연구원

2015년 ~ 현재 : 전북대학교 문헌정보학과 부교수

관심분야 : 정보검색, 질의응답, 빅데이터정보처리

Fig. 1.

Fig. 1.
'win-win' pest prediction and control model

Fig. 2.

Fig. 2.
Pest prediction model, (a) Pest occurred binary classification, (b) Pest multi-classification

Fig. 3.

Fig. 3.
Recommendation model for control methods according to IPM types

Fig. 4.

Fig. 4.
Factor-specific correlation result

Fig. 5.

Fig. 5.
Accuracy by model learning method

Fig. 6.

Fig. 6.
Results of 'rice's study on pests

Table 1.

Collection data

수집데이터 건수
팜맵 정보 특별시 및 광역시 8개, 도 9개 11,987,461
기상 정보 농업기상_종관기상 12,294,901
농업기상_시간단위 11,059,877
농업기상_극값_시간단위 23,559,880
종관기상_시간단위 7,412,461
농업기상_일단위 472,980
농업기상_극값_일단위 472,979
종관기상_일단위 307,819
토양 정보 팜맵_토질검정_관계 2,900,847
토양검정_화학분석 2,834,354
병해충
정보
융복합_병해충 2,435,277
병해충_조사지점 8,567
병해충_조회 3,341,286
전처리 이후 활용데이터 3,746,403

Table 2.

Results of assessment of whether or not pests have occurred

Precision Recall Accuracy
Proposed method (26 features) 98.57% 94.23% 93.56%
only weather (43) 97.86% 92.15% 90.97%
only soil (12) 99.24% 88.18% 87.87%