Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 16, No. 7, pp.15-25
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Jul 2018
Received 06 May 2018 Revised 12 Jul 2018 Accepted 15 Jul 2018
DOI: https://doi.org/10.14801/jkiit.2018.16.7.15

화상 감시 카메라 시스템의 최적 구성에 관한 연구

이구연* ; 김화종**
*강원대학교 컴퓨터정보통신공학과 교수,
**강원대학교 컴퓨터정보통신공학과 교수
Optimal Configuration of Surveillance Camera System
Goo Yeon Lee* ; Hwa-Jong Kim**

Correspondence to: Goo Yeon Lee, Dept. of Computer and Communications Engineering, Kangwon National University, 1, Gangwondaehak-gil, Chuncheon-si, Gangwon-do, 24341, Korea Tel: +82-33-250-6394, E-mail: leegyeon@kangwon.ac.kr

초록

본 논문에서는 화상 인식 서버 기반의 감시 카메라 시스템에서 프레임 폐기율과 서버의 활용도를 기반으로 성능 분석을 수행한다. 각 감시 카메라의 상태를 인식상태와 유휴상태로 나누어 서로 다른 프레임 전송률을 적용함으로써 서버의 처리 용량에 따른 최적의 화상 프레임 수와 수용 가능한 카메라 수 등에 대한 분석을 수행한다. 또한 네트워크를 통하여 전달되는 화상 프레임의 수 및 서버의 가동률, 감시 효과 등의 복합적인 비용이 반영된 운영 가치 함수를 정의하며 이에 기반한 최적의 시스템 설계 연구를 수행한다. 연구 결과는 서비스 도메인의 여러 비용 요소에 따라 최적의 설계 파라미터를 도출할 수 있도록 하는 기반 이론을 제공할 수 있으며, 화상 감시 카메라 시스템의 효율적인 운영을 위하여 유용하게 활용될 것으로 판단된다.

Abstract

In this paper, we study a performance analysis of a surveillance camera system with image recognition server based on frame discard rate and server utilization. The states of surveillance cameras are divided into recognition and silence states to analyze the parameters such as the optimal number of image frames and cameras based on processing capacity of the recognition server. Also, we define the value function that reflects the number of image frames transmitted through the network, the operation rate of the server, and the surveillance effect, and conducts an optimal system design study based on the defined value function. The result of the analysis can provide the bases that can derive the optimal design parameters according to various cost factors of the service domain and it will be useful for effective operation of the evolving surveillance camera systems.

Keywords:

surveillance system, CCTV, image, recognition, network, value function

Ⅰ. 서론

영상 기반의 감시(Surveillance) 시스템은 CCTV 방식 시스템으로부터 웹카메라, 그리고 PTZ(Pan-Tilt-Zoom) 기능의 지능형 카메라 및 사설 네트워크 또는 공용 네트워크를 기반으로 한 감시 카메라 시스템 등 다양한 형태로 진화되어 오고 있다.

특히 네트워크 기반의 감시 카메라 시스템은 중앙 감시 센터에서 각 지역별로 설치된 다수의 카메라로부터 영상 정보를 수신 받아 모니터 하고, 특이사항에 대한 검출 및 이에 대한 대처 프로세스를 갖추는 등의 기능을 구비한 고도의 중앙 집중형 감시 시스템으로 비즈니스 영역에서 많이 구축되어지고 서비스 되어지는 시스템이다.

중앙 집중형 감시 시스템의 경우 넓은 지역에 걸쳐 많은 감시 카메라를 설치하고 이를 사설 네트워크로 구축하여 연결하는 경우가 가능하다. 이러한 경우에 트래픽의 수용이나 전달 지연 측면에서 양질의 감시 시스템 서비스를 제공할 수 있으나, 비용적인 측면에서 비효율적인 경우가 많아, 특수한 환경 또는 요구가 있는 경우에만 가능하다. 최근에는 인터넷을 포함한 양질의 공중 네트워크가 사회 전반에 걸쳐 폭 넓게 보급되어 언제 어디서나 네트워크 서비스를 이용할 수 있는 상황이다. 이러한 환경에서 감시 카메라 네트워크도 공중 네트워크를 기반으로 구축하는 것이 빠른 구축 시간 및 시스템 구성의 용이한 변경, 그리고 비용적인 측면에서 효율적이다.

일반적으로 시스템을 구축, 운영할 때 성능과 비용에 대한 분석에 기반하여 최소의 비용으로 최대의 효과를 낼 수 있도록 하는 최적의 시스템 구성을 설계할 필요가 있다. 성능과 비용 분석시에는 직접적으로 투입되는 자원의 양 및 지불되는 비용뿐만 아니라, 시스템의 도입 및 운영에 따른 효과 등 추상적인 척도도 정량화 하여 반영해야 한다. 이는 본 연구에서 다루고자 하는 중앙 집중형 감시 시스템의 경우에도 동일하게 적용되며, 따라서 여러 성능 및 비용 요소들을 고려한 최적의 시스템을 설계하기 위한 연구가 필요하다.

기본적으로 중앙 감시 센터는 감시 카메라들로부터 가급적 많은 화상 프레임을 전송받을 때 효과적으로 감시 기능을 수행할 수 있다. 하지만 공중 네트워크를 이용한 감시시스템의 경우 전달되는 화상 프레임의 수에 따라 감시 시스템 운영자가 네트워크에 적지 않은 비용을 지불해야 하므로 무조건 많은 프레임의 전송을 요청할 수는 없게 된다.

감시의 특성상 움직이는 물체 및 사물의 이동 등을 감시하는 경우이므로 영화를 보듯이 초당 수십 프레임의 화상 정보가 필요하지는 않으며, 특히 움직임이 없을 때에는 초당 한 프레임 또는 0.5 프레임 정도의 정보로서도 충분한 감시기능을 수행할 수 있으며, 움직임이 포착된 경우에도 초당 3~10 프레임 정도의 화상 정보로서 충분한 경우가 많다. 물론 감시 환경의 특성이나 민감도에 따라 초당 전송 프레임의 수를 조절할 수 있게 된다. 이에 중앙 감시 센터는 각 카메라에 대하여 움직임이 있어 초 당 많은 프레임을 전달하는 인식상태(Recognition State) 및 초당 적은 프레임을 전달하는 유휴상태(Silence State)로 그때 그때 설정하여 운영하면 네트워크를 통해 전달하는 화상 프레임의 수를 최적화 할 수 있게 된다.

본 연구에서는 공중 네트워크 기반의 다수의 감시 카메라가 연결된 중앙 집중형 감시 시스템을 고려한다. 시스템 운영자는 화상인식 시스템의 처리 용량에 맞추어 네트워크를 통하여 전달되는 화상 프레임 수를 최적화할 필요가 있으며, 또한 적당한 화상 카메라 수의 설계가 필요하므로, 본 논문에서는 이에 필요한 이론적인 분석 결과를 제시한다.

또한 감시 시스템 운영자는 수용 가능한 화상카메라의 수, 전송되는 화상 프레임의 수, 화상 인식 서버의 가동률 및 버려지는 화상 프레임수, 감시 효과 등에 따른 복합적인 비용을 생각해야 한다. 즉, 감시 시스템 운영자는 화상 인식 서버의 처리용량에 맞추어 시스템의 여러 비용 요소들을 반영한 복합적인 가치 척도에 기반한 최적의 시스템을 설계할 필요가 있으므로 본 연구에서는 이에 필요한 가치 함수 정의 및 이를 이용한 감시 카메라 시스템의 최적 구성 도출에 대한 기반 이론을 제시한다.


Ⅱ. 관련 연구

CCTV 시스템의 성능에 관한 연구는 주로 화상 인식의 정확성이나 또는 화상 프레임의 전송시 품질, 전송 프레임 수, 네트워크 대역폭, 보안 기능에 관한 내용이 주로 연구되어 왔다.

[1]에서는 CCTV 시스템에서의 네트워크 대역폭 및 제한된 처리자원에 기반하여 어떤 카메라의 화상 데이터를 저장할 지에 대한 최적의 스케줄링에 대한 연구를 수행하였다. 그리고 제안한 스케줄링에서 연속된 화상 프레임간의 지터를 최소화하기 위한 연구를 수행하였다. 또한 [2]에서는 감시에 필요한 효율적인 프레임수에 대한 연구가 진행되었다.

[3]에서는 사용자와 서버가 같이 연동하여 HTTP 상에서 동적으로 스트리밍을 제공하는 방식을 제안하였는데, 이 방식에서는 사용자에게 현재의 채널 자원 정보를 제공함으로써 다음 세그먼트의 해상도 등을 예상하고 결정할 수 있게 하였다. [4]의 연구에서는 감시 시스템이 5G 이동통신망에 접속하여 일반 다른 트래픽과 공유하여 전송될 때 비디오 세그멘트의 화질 및 사이즈에 대한 동적 선택 알고리즘에 대한 연구를 수행하였다. 이 연구에서는 카메라와 네트워크의 트래픽 정도에 기반한 가용 대역폭을 평가하여 다음에 보낼 화상 프레임의 크기를 결정하는 연구를 수행하였다. [5]에서는 네트워크 기반의 지능화된 분산 감시 시스템의 응용에 대한 기능을 연구하였으며, 또한 공항 등과 같은 공공장소에서의 효율적이고 안전한 환경을 만들 수 있게 하는 지능적인 인식 시스템을 연구하였다. 또한 [6]의 연구에서는 CCTV 사이트들의 통합관리를 위하여 제약사항을 갖고 있는 SNMP를 대신하여 RESTful 웹서비스를 기반으로 한 R4CSM를 정의하여 CCTV 사이트의 통합관리 시스템을 설계 및 구현하였다.

[7]에서는 CCTV 화상 이미지에 대한 여러 가지 안면 인식 알고리즘에 대한 평가 연구를 수행하였으며, [8]에서는 감시 카메라 시스템의 보안 측면에 대하여 연구하였다. [9]의 연구에서는 CCTV 시스템에서의 안면인식에서 나타나는 프라이버시에 관한 연구를 수행하였고, 프라이버시 침해 방지를 위한 프레임워크를 제시하였다. 그리고 [10]에서는 감시 시스템의 네트워킹, 시각화, 경계지역 보안 등을 이용한 적응형 알고리즘을 통하여 보안 기능의 향상 방법을 연구하였다.

위와 같은 여러 연구에도 불구하고 본 연구에서 다루고자 하는 CCTV 시스템에 대한 화상 인식 서버, 네트워크 대역폭 사용량, 카메라의 개수, 감시 효과 등을 전체적으로 고려한 최적 구성에 대한 연구는 거의 이루어지지 않은 상태이다.


Ⅲ. 분석 모델

본 연구에서 고려하고 있는 중앙 집중형 감시 카메라 시스템은 그림 1과 같다.

그림 1에서의 감시 카메라 시스템의 동작과정은 다음과 같다. N개의 화상 감시 카메라가 공중 네트워크를 통하여 중앙 감시 센터에 연결되어 있다. 각 화상 카메라는 정해진 프레임 전송률로 화상 프레임을 중앙 감시 센터로 전송한다.

Fig. 1.

Central surveillance camera system

중앙 감시 센터는 도착한 화상 프레임에 대하여 움직임이 인식된 경우에 해당 화상 카메라를 인식상태로 설정하고, 그렇지 않은 경우 유휴상태로 설정 한다. 인식상태로 설정된 경우 움직임 인식이 진행된 상태이며 중앙 감시 센터는 해당 화상 카메라의 프레임 전송률을 R = Rrec (frames/sec)로 지정하여 전달한다. 유휴상태의 경우 움직임 인식이 되고 있지 않는 상태이며 이 경우 프레임 전송률을 R = Rsil (frames/sec)로 지정하여 전달한다. 해당 감시 카메라는 전달받은 전송률로 화상 프레임을 전송한다. 단 RrecRsil의 값보다 큰 값을 갖는 것 (Rrec > Rsil)이 일반적이다.

그림 2는 감시 카메라의 인식상태와 유휴상태간의 전이과정을 보여준다[11]. 그림 2에서 각 화상 카메라의 인식상태 및 유휴상태는 번갈아 발생하고 있으며, 이러한 상태전이 과정은 다른 카메라와 독립적으로 이루어진다고 가정한다. 이러한 가정은 감시카메라가 가까운 거리에 집중적으로 설치되고 있는 경우에는 적합하지 않지만, 본 연구에서는 넓은 지역에 화상 카메라가 어느 정도 거리를 두고 분산되어 배치되어 있다고 가정한다. 이러한 경우에 각 카메라의 상태 전이들은 상호 독립적으로 동작한다고 간주 할 수 있다. 만약 여러 카메라가 근거리에 배치되어 있는 경우가 있다면, 근접한 화상 카메라들의 배치 토폴로지 정보가 필요하며, 이 토폴로지에 대하여 카메라간의 거리와 위치, 그리고 물체의 이동 속도에 기반하여 서로 간의 상관관계를 도출한 후 본 연구의 이어지는 분석과정을 적용할 수 있다. 분석의 편의상 모든 카메라는 동일한 상태특성을 갖는다고 가정한다.

Fig. 2

Transitions between recognition state and silence state of surveillance cameras

그림 2에서 인식 상태 구간의 길이를 r.v. trec로 나타난다고 가정한다. 인식 상태 구간의 기대(평균) 길이는 E(trec)로 표시할 수 있다. 여기서 E(・)는 기대치를 나타낸다. 또한 유휴 상태 구간의 길이를 r.v. tsil로 나타난다고 가정한다. 마찬가지로 유휴상태 구간의 기대(평균) 길이는 E(tsil)로 표시할 수 있다. 또한 화상 인식 서버의 초 당 처리 용량(프레임 수)은 C라고 가정한다. 일반적으로 감시시스템은 실시간 감시가 효과적이므로 중앙 감시 센터는 이러한 실시간성을 보장할 수 있도록 약간의 대기열을 가지고 있다고 가정한다.

이 대기열의 길이에 따라 지연 완충 효과가 다소 나타날 수 있으나, 본 분석에서는 편의상 초단위로 세어 화상인식 시스템의 처리 용량 C를 넘어서서 도착하는 프레임은 버려진다는 가정으로 근사화한다.

위의 가정으로부터 i번째 화상 카메라가 인식 상태에 있을 확률 Prec 및 유휴 상태에 있을 확률 Psil을 아래와 같이 구할 수 있다.

Prec=E(trec)E(trec)+E(tsil)(1) 
Psil=1-Prec=E(tsil)E(trec)+E(tsil)(2) 

위의 식으로부터 N개중에 k개의 카메라가 인식상태에 있을 확률 Pk를 다음과 같이 구할 수 있다.

Pk=NkPreck1-PrecN-k(0kN)(3) 

위의 식으로부터 다음과 같은 관계식을 구할 수 있다.

인식상태의 평균 카메라수=NPrec(4) 
유휴상태에 있는 평균 카메라수=NPsil=N(1-Prec)(5) 
초당 최소 총 전송 프레임수(P0의 확률로 발생)=NRsil(6) 
초당 최대 총 전송 프레임수(PN의 확률로 발생)=NRrec(7) 

운영 측면에서 (6)의 프레임수는 서버의 처리 용량 C보다 같거나 작아야 하며, 또한 C(7)의 프레임 수보다 같거나 작아야 한다. 즉 다음의 관계가 성립하도록 설계해야 한다.

NRsilCNRrec(CRrecNCRsil)(8) 

또한 초당 평균적으로 전송되는 총 프레임 수는 다음과 같이 주어진다.

초당 평균 총 전송 프레임수=NPrecRrec+N(1-Prec)Rsil(9) 

서버의 처리 용량 CNRrec과 같도록 설계할 때 서버가 최대용량을 수용하므로 서버에서 처리되지 않고 버려지는 프레임은 없게 된다. 그러나 이 경우 (9)에서의 초 당 평균 총 전송 프레임 수인 NPrecRrec + N・(1 - Prec)・Rsil에 대하여 평균적으로 초당 다음의 프레임수만큼의 서버의 처리용량 낭비가 있게 된다.

Cwaste=C-NPrecRrec-N(1-Prec)Rsil(10) 

그러므로 서버에서 처리되지 않고 버려지는 프레임을 일부 허용함으로써 서버의 가동률을 높이는 연구가 필요하다. 이에 서버의 처리용량과 버려지는 프레임 수, 화상 카메라의 전송률의 관계에 대한 분석이 필요하다. 서버의 처리 용량 C로서 평균적으로 처리할 수 있는 인식 상태에 있는 카메라의 수 m은 다음에서 구할 수 있다.

C=mRrec+(N-m)Rsil(11) 

여기서 m은 정수이어야 하므로 다음과 같이 구할 수 있다.

m=C-NRsilRrec-Rsil(12) 

여기서 xx보다 같거나 또는 작은 정수 중 가장 큰 값을 나타낸다. 그러므로 서버에서 처리되지 않고 버려지는 평균 프레임 수의 기대 값은 다음과 같이 구해진다.

Fdiscarded=k=m+1NPk[(kRrec+(N-k)Rsil)-C](13) 

먼저 본 중앙 집중형 감시 카메라 시스템의 성능 척도로서 다음 두 가지 요소를 고려한다. 첫째로 서버에 도착했으나 서버에서 처리되지 않고 버려지는 프레임수를 서버의 처리 용량 대비 나타낸 수치인 DR(Discard Ratio)이다. 이는 버려지는 프레임인데도 불구하고 네트워크를 통해 전달된 프레임으로써 시스템 운영자는 쓸데없이 네트워크에 비용을 지급하게 되는 프레임들로서 이 수치가 커질수록 비효율적인 측면이 증가한다고 볼 수 있다. 다른 하나는 서버의 활용 비율로서 서버 용량 C에 대하여 실제 서버가 처리하는 프레임 수의 비율 ρ로 나타낸다. 이 비율이 높은 경우는 서버의 가동률이 높아서 서버가 효과적으로 운영이 되는 상황이며, 반대로 이 비율이 낮은 경우는 서버의 가동률이 낮아서 주어진 서버 능력에 비해 비효율적으로 운영하는 상황이 된다[11].

먼저 DRFdiscardedC로서 정의하며 다음과 같이 구할 수 있다.

DR=k=m+1NPk[(kRrec+(N-k)Rsil)-C]C=k=m+1NNkPreck1-PrecN-k[kRrec+(N-k)RsilC-1](14) 

그리고 ρ식 (15)와 같이 구할 수 있다[11].

ρ=1C[k=0mPk[(kRrec+(N-k)Rsil)]+k=m+1NPkC]=1C[k=0mPk[(kRrec+(N-k)Rsil)]+(1-k=0mPk)C]=1-k=0mPk[1-kRrec+(N-k)RsilC]=1-k=0mNkPreck1-PrecN-k[1-kRrec+(N-k)RsilC](15) 

다음으로 본 연구 결과에 대하여 몇 가지 예를 들어 설명한다. 그림 34C=100, Rrec=5, Rsil=1 일 때 Prec가 0.1, 0.2, 0.3, 0.4 및 0.5와 같이 변함에 따른 NDR 그리고 Nρ의 관계를 나타낸 그래프이다.

Fig. 3.

Relation between N and DR when C=100, Rrec=5, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 4.

Relation between N and ρ when C=100, Rrec=5, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

그림 3에서 볼 수 있듯이 DR=0이 되도록, 즉 서버에서 처리되지 않고 버려지는 화상 프레임이 없도록 설계할 경우, 화상 카메라 수는 N=20개로 제한된다. 그러나 이 때 서버의 활용도 ρPrec가 0.1, 0.2, 0.3, 0.4 및 0.5일 경우 28%, 36%, 44% 52% 및 60%에 불과한 값을 갖게 된다. 즉 서버의 활용도가 낮아 많이 놀게 되는 상황이 발생한다. 따라서 서버의 활용도를 높이기 위하여서는 DR을 어느 정도로 허용해야 한다. DR=0.01(1%)로 할 때 Prec가 0.1, 0.2, 0.3, 0.4 및 0.5일 경우 각각 N은 64, 49, 40, 34 및 29의 값을 갖게 되어 최대 설치 가능한 카메라의 수가 커지게 된다. 이때의 서버 활용도는 88.8%, 87.2%, 87.1%, 87.4% 및 86.4%의 값을 갖게 된다. 즉 서버에서 처리되지 않고 버려지는 프레임의 수를 서버 처리용량 기준 1%를 허용함으로써 서버 활용도가 86%~89%로 크게 증가하게 된다. DR=0.1(10%)로 하는 경우를 살펴본다. 이 경우 Prec가 0.1, 0.2, 0.3, 0.4 및 0.5의 값을 가질 때 최대 설치 가능한 카메라의 수 N은 77, 60, 49, 41 및 36의 값을 갖게 된다. 이때의 서버 활용도도 각각 98.7%, 98.2%, 97.9%, 97.6% 및 98.2%의 값을 갖게 됨으로써 거의 100%의 값을 갖게 된다.

다른 예로서 C=100, Rrec=3, Rsil=1 일 때 Prec가 0.1, 0.2, 0.3, 0.4 및 0.5와 같이 변함에 따른 NDR 그리고 Nρ의 관계를 그림 56에 나타내었고, 또한 C=100, Rrec=10, Rsil=1일 때 Prec가 0.1, 0.2, 0.3, 0.4 및 0.5와 같이 변함에 따른 NDR 그리고 Nρ의 관계를 그림 78에 나타내었다.

Fig. 5.

Relation between N and DR when C=100, Rrec=3, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 6.

Relation between N and ρ when C=100, Rrec=3, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 7.

Relation between N and DR when C=100, Rrec=10, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 8.

Relation between N and ρ when C=100, Rrec=10, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

그림 5에서는 Rrec가 3으로 Rsil:Rrec=1:3의 비율로 인식상태의 프레임수가 그림 3의 경우보다 상대적으로 작은 상황을 나타낸다. 초당 3 프레임인 경우는 감시기능의 목적달성은 가능하나 디테일한 연속 장면을 표현하기에는 다소 부족한 경우이다. 이 경우 DR=0.01(1%)로 할 때 Prec이 0.1, 0.2, 0.3, 0.4 및 0.5의 경우 N은 각각 80, 68, 59, 52 및 47의 값을 가지므로 최대 설치 가능 카메라의 수가 그림 3Rrec=5인 경우보다 큰 값을 갖게 된다. 즉 인식상태의 전송 프레임수를 작게 하는 대신 유휴상태와 인식상태의 프레임 수 차이의 줄어드는 효과로 인하여 같은 DR을 허용하는 경우에 수용 가능한 카메라의 수가 증가하게 된다. 또한 이때의 서버 활용도도 각각 95.2%, 94.3%, 93.5%, 92.9% 및 93.3%로 구해져 대략 93%~95%의 값을 갖게 되어 그림 4Rrec=5보다 크게 증가하게 된다(그림 6).

반대로 그림 7Rrec=10인 경우는 Rsil:Rrec=1:10의 비율로 인식상태의 프레임수가 그림 3의 경우보다 상대적으로 큰 상황을 나타낸다. 초당 10 프레임인 경우는 연속적인 동영상만큼은 안되지만 감시기능의 목적은 충분히 달성할 수 있는 프레임수이다. 이 경우 DR=0.01(1%)로 할 때 Prec이 0.1, 0.2, 0.3, 0.4 및 0.5일 때 N은 각각 40, 26, 20, 16 및 14의 값을 갖게 되므로 최대 설치 가능 화상 카메라의 수가 그림 3Rrec=5인 경우보다 훨씬 작은 값을 갖게 된다. 즉 인식상태의 전송 프레임수를 크게 하는 대신 유휴상태와 인식상태의 프레임 수 차이가 커지는 효과로 인하여 같은 DR을 허용하는 경우에 수용 가능한 카메라의 수가 크게 감소하게 된다. 또한 이때의 서버 활용도도 그림 8에서 각각 75%, 72%, 73%, 73% 및 76%가 되어 그림 4Rrec=5보다 크게 감소하게 됨을 알 수 있다.


Ⅳ. 운영가치 함수 및 최적 구성

앞선 연구 결과 분석에서 감시 카메라 수에 따른 DR 및 서버의 활용도 그리고 상태에 따른 전송 프레임수 등의 관계를 살펴보았다. 그러나 현실에서 감시카메라 시스템을 설계할 때에는 적용 도메인의 특성 및 설치 목적, 그리고 예산 및 여러 비용 요소를 고려하여 설계하게 된다. 다음은 설계시에 고려할 여러 요소를 나열한 내용이다.

  • • 감시 카메라 시스템의 모니터링 효과 및 서버의 활용도
  • • 수용 가능한 카메라의 대수
  • • 공중 네트워크를 사용함으로써 네트워크에 지불해야하는 프레임 전송 비용
  • • 서버에 도착했으나 처리되지 못하고 버려지는 낭비 프레임의 수
  • • 인식상태 및 유휴상태에서의 초당 전송 프레임 수

위의 요소들은 감시 카메라 시스템이 설치되어 운영될 서비스 환경에 따라 중요도가 다르고 그에 따라 설계 결과가 달라지게 된다. 감시 카메라 시스템의 모니터링 효과가 아주 민감하고 중요한 경우에는 다른 요소들의 자원을 충분히 낭비적으로 사용하여 모니터링 효과를 극대화할 수 있을 것이다. 서버의 활용도가 낮은 상태로 설계 결과가 나오면 낮은 용량의 서버를 구입하여 비용을 절감하는 것을 고려할 수 있게 되며, 네트워크에 전송되는 프레임에 대한 지불 비용이 문제가 되는 경우에는 네트워크 공급자와의 네트워크 사용 비용에 대한 비용 함수를 따져봐야 된다. 네트워크 사용 비용은 정액제로 하는 경우도 있지만 종량제로 하는 경우도 있으며, 아니면 혼합 형태로 비용이 결정되는 경우가 가능하다. 이러한 네트워크 사용 비용 함수가 어떤 형태로든 주어지면 이에 맞추어 여러 파라미터의 최적화가 가능하다. 또한 설치 가능한 카메라 대수도 중요한 고려 요소가 되며, 이는 DR을 어느 정도 허용하느냐에 따라 카메라 대수가 결정 될 수 있다.

이에 본 연구에서는 위에 나열한 여러 요소들을 종합적으로 판단하기 위한 감시 카메라 시스템의 운영가치 함수 E를 다음의 일반적인 식으로 정의한다.

E=f(ρ)+g(N)+h(Rsil,Rrec)-j(DR)(16) 

여기서 f(ρ)는 화상 인식 서버의 활용도에 대한 함수로서 서버의 용량을 100% 활용하는 경우에 최댓값을 갖는다. g(N)은 수용가능한 카메라의 수에 대한 함수로서 화질이나 서버의 활용도, DR의 값과는 별도로 독립적인 가치를 갖게 된다. h(Rsil, Rrec)는 각 상태별로 전송되는 프레임 수에 대한 함수로서 모니터링 하는 연속 화상의 품질에 대한 만족도에 대한 가치를 나타낸다. 또한 j(DR)은 서버에서 처리되지 않고 버려지는 프레임의 비율로서 네트워크 자원의 낭비에 따른 비용을 나타낸다. 적용 도메인에 따라 각 f, g, h, j 함수의 관계식이 주어지게 되면 이에 따라 식 (14), (15), (16)의 관계 및 다음의 알고리즘을 통하여 C, Prec, Rrec, Rsil에 따른 최적의 E 및 그 때의 NDR, ρ 값을 구할 수 있게 된다.

Given the values of C, Prec, Rrec and Rsil

Let E = - ∞

FOR N with increment 1 from Eq. (8)

Calculate DR and ρ from Eq. (14), (15)

Calculate temp_E from Eq. (16)

IF temp_E > E

E = temp_E

Recode values of N, DR and ρ

endIF

endFOR

f(ρ), g(N), h(Rsil, Rrec), j(DR)의 함수식은 감시 카메라 시스템이 설치되는 환경이나, 장비 및 네트워크 사용 비용 함수에 따라 결정되나, 본 연구에서는 다음의 간단한 관계식을 예로 들어 결과를 분석한다. 실제로 특정 적용 도메인이 분석되면, 도메인에 맞는 다양한 관계식이 나올 수 있으며, 어떠한 관계식의 경우에도 본 논문의 분석과정을 그대로 적용시켜 결과를 구할 수 있다.

f(ρ)=Cρρ(17) 
g(N)=CNN(18) 
h(Rsil,Rrec)=CsilRsil+CrecRrec(19) 
j(DR)=CDRDR(20) 

표 1식 (16)~(20)의 가치함수에 따른 최적구성의 예를 보여준다. 각각 C=100, Rsil=1, Cρ=10, CN=0.1, Crec=1, Csil=1 및 CDR=10 그리고 Rrec=10, 5, 3일 때의 경우에 대하여 분석하였다.

An example of optimal configuration based on the value function when Cρ=10, CN=0.1, Crec=1, Csil=1 and CDR=10

표 1에서 볼 수 있듯이 Rrec가 증가함에 따라 E값이 증가함을 알 수 있다. 이는 Rrec가 증가하면 화면 해상도가 높아져 그만큼 만족도가 올라가기 때문이다. 다만 화상 프레임수가 증가함에 따라 DR값이 커지게 되어 E값을 상쇄시키는 방향으로 영향을 끼치게 된다. 또한 이에 대한 보상작용으로 카메라수가 줄어들게 된다. 이와 같은 여러 변수들 간의 상호 관계는 각 요소의 계수 값에 따라 결정된다. 또한 Prec가 커질수록 인식상태의 카메라의 비율이 많아지게 되면서 수용 가능한 카메라의 수가 급격히 감소하는 것을 볼 수 있다. 수용 가능한 카메라수가 줄어들게 되면, 인식상태와 유휴상태간의 변동폭이 줄어들게 되고 따라서 DR값이 현저하게 줄어들게 됨을 알 수 있다.


V. 결론

본 연구에서는 공중 네트워크 기반의 다수의 감시 카메라가 연결된 중앙 집중형 감시 시스템에서 감시카메라 네트워크를 설계할 때의 기반이 되는 여러 성능 요소들 사이의 관계를 분석하였다.

고려한 성능 요소들은 감시카메라 시스템에서의 화상인식서버의 처리 용량과 설치 가능한 카메라의 대수 그리고 서버의 활용도 및 서버에서 처리되지 못하고 폐기되어지는 프레임 수이며, 분석 결과를 통하여 구체적인 여러 요소들 간의 트레이드오프 관계를 설명하였다. 또한 운영가치함수를 정의하여 서비스 도메인의 여러 비용요소에 따라 최적의 설계 파라미터를 도출할 수 있도록 하는 기반 이론을 제공하였다. 이러한 본 논문에서의 연구결과는 최근 광범위하게 보급되고, 또한 진화되고 있는 화상 감시 카메라 시스템의 효과적인 설계 및 운영을 위하여 크게 유용하게 활용될 것으로 판단된다.

Acknowledgments

이 논문은 2018년도 정부(과학기술정보통신부)의 재원으로 정보통신기술진흥센터의 지원을 받아 수행된 연구임(No. 2018-0-00261, IoT 환경에서 일반개인정보보호규정에 부합(GDPR Compliant)하는 개인정보 관리 기술 개발)

References

  • K. J. Lin, T. K. Hou, and R. J. Chiu, "Jitter-Constrained Camera Scheduling in CCTV Surveillance Networks", 2016 IEEE International Conference on Signal and Image Processing (ICSIP), p650-654, Aug.), (2016. [https://doi.org/10.1109/SIPROCESS.2016.7888343]
  • H. Keval, and M. A. Sasse, "To Catch a Thief – you need at least 8 frames per second: The impact of frame rates on user performance in a CCTV detection task", Proc. of the 16th ACM int. conf. on Multimedia, p941-944, Oct.), (2008. [https://doi.org/10.1145/1459359.1459527]
  • E. Khorov, A. Krasilov, M. Liubogoshchev, and S. Tang, "SEBRA: SAND-Enabled Bitrate and Resource Allocation algorithm for network-assisted video streaming", in Proc. of IEEE WiMob, Rome, Italy, p1-8, Nov.), (2017. [https://doi.org/10.1109/WiMOB.2017.8115758]
  • E. Khorov, A. Kiryanov, and N. Zhirnov, "SAND-inspired Cross-layer Approach for CCTV in 5G Networks", 2017 International Conference on Engineering and Telecommunication (EnT), p33-37, Nov.), (2017. [https://doi.org/10.1109/ICEnT.2017.14]
  • M. Shah, and R. Garrad, "The Development of Large Scale Network-Based Multi-use CCTV Surveillance Systems", IEE Int. Symp. on Imaging for Crime Detection and Prevention, p15-22, Jun.), (2005.
  • S. D. Fan, Y. W. Cha, and C. H. Kim, "Design and Implementation of Integrated Management System for CCTV Sites", Journal of Korean Institute of Information Technology, Vol. 12(No. 10), p75-84, Oct.), (2014. [https://doi.org/10.14801/kitr.2014.12.10.75]
  • S. Fahad, S. U. Rahman, I. Khan, and S. Haq, "An Experimental Evaluation of Different Face Recognition Algorithms Using Closed Circuit Television Images", 2017 IEEE 2nd International Conference on Signal and Image Processing (ICSIP), p51-54, Aug.), (2017. [https://doi.org/10.1109/SIPROCESS.2017.8124504]
  • S. Yang, and J. Park, "An Efficient Access Control Mechanism for Secure Surveillance Systems", The Journal of Korea Information and Communications Society, Vol. 39B(No. 4), p228-233, Apr.), (2014. [https://doi.org/10.7840/kics.2014.39B.4.228]
  • B. J. Han, H. C. Jeong, and Y. J. Won, "The Privacy Protection Framework for Biometric Information in Network Based CCTV Environment", 2011 IEEE Conference on Open Systems, p86-90, Sep.), (2011. [https://doi.org/10.1109/ICOS.2011.6079313]
  • V. C. Banu, I. M. Costea, F. C. Nemtanu, and I. Bădescu, "Intelligent Video Surveillance System", 2017 IEEE 23rd International Symposium for Design and Technology in Electronic Packaging (SIITME), p208-212, Oct.), (2017.
  • Y. Shqairat, and G. Y. Lee, "Performance Analysis of Surveillance Camera System Based on Image Recognition Server", The Journal of Korean Institute of Communications and Information Sciences, Vol. 42(No. 4), p816-818, Apr.), (2017. [https://doi.org/10.7840/kics.2017.42.4.816]
저자소개
이구연 (Goo Yeon Lee)

1986년 : 서울대학교 전자공학과 (학사)

1988년 : KAIST 전기 및 전자 공학과(석사)

1993년 : KAIST 전기 및 전자 공학과(박사)

1993년 ~ 1996년 : 디지콤정보통신 연구소

1996년 : 삼성전자

2004년 7월 ~ 2005년 2월, 2010년 1월 ~ 2011년 1월 : 미국 Cornell 대학교 Visiting Professor

2012년 8월 ~ 2014년 2월 : 강원대학교 IT 대학 부학장

1997년 ~ 현재 : 강원대학교 컴퓨터학부 교수

관심분야 :데이터통신, 컴퓨터네트워크, 네트워크 보안, 차세대 인터넷, 이동통신, 네트워크 성능분석, 암호학, 정보보호관리체계

김화종 (Hwa-Jong Kim)

1982년 : 서울대학교 전자공학과 (공학사)

1984년 : KAIST 전기 및 전자과 (공학석사)

1988년 8월 : KAIST 전기 및 전자과(공학박사)

1988년 ~ 현재 : 강원대학교 컴퓨터정보통신공학과 교수

관심분야 : 데이터공유, 데이터분석, 인공지능, 머신러닝, 딥러닝

Fig. 1.

Fig. 1.
Central surveillance camera system

Fig. 2

Fig. 2
Transitions between recognition state and silence state of surveillance cameras

Fig. 3.

Fig. 3.
Relation between N and DR when C=100, Rrec=5, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 4.

Fig. 4.
Relation between N and ρ when C=100, Rrec=5, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 5.

Fig. 5.
Relation between N and DR when C=100, Rrec=3, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 6.

Fig. 6.
Relation between N and ρ when C=100, Rrec=3, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 7.

Fig. 7.
Relation between N and DR when C=100, Rrec=10, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Fig. 8.

Fig. 8.
Relation between N and ρ when C=100, Rrec=10, Rsil=1, and Prec=0.1, 0.2, 0.3, 0.4 and 0.5

Table 1.

An example of optimal configuration based on the value function when Cρ=10, CN=0.1, Crec=1, Csil=1 and CDR=10

C=100, Rrec=10, Rsil=1
Prec=10 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
E 25.14 23.05 22.09 21.67 21.31 21.16 21.31 21.31 21.48
N 59 40 29 23 19 16 14 12 11
DR 0.1483 0.1574 0.1272 0.1103 0.1018 0.0841 0.0655 0.0364 0.0314
ρ 0.9727 0.9626 0.9458 0.9477 0.9432 0.9399 0.9565 0.9476 0.9696
C=100, Rrec=5, Rsil=1
Prec=10 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
E 22.73 20.85 19.72 18.99 18.47 18.18 17.90 17.78 17.83
N 78 62 49 41 35 30 27 24 22
DR 0.0995 0.1253 0.0978 0.0885 0.0765 0.0511 0.0529 0.0350 0.0243
ρ 0.9925 0.9907 0.9802 0.9775 0.9735 0.9689 0.9731 0.9730 0.9877
C=100, Rrec=3, Rsil=1
Prec=10 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
E 22.19 20.85 19.85 19.11 18.55 18.09 17.75 17.48 17.31
N 89 77 66 58 53 47 43 39 36
DR 0.0696 0.0815 0.0653 0.0565 0.0676 0.0474 0.0437 0.0281 0.0186
ρ 0.9984 0.9965 0.9907 0.9875 0.9924 0.9866 0.9883 0.9859 0.9894