Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 21, No. 11, pp.23-37
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 30 Nov 2023
Received 08 Aug 2023 Revised 07 Nov 2023 Accepted 10 Nov 2023
DOI: https://doi.org/10.14801/jkiit.2023.21.11.23

딥러닝을 활용한 하이엔드 및 브랜드 아파트의 가격 프리미엄에 관한 연구

김규석* ; 이주원** ; 김경민***
*서울대학교 환경대학원 환경계획학과 박사수료, 한국폴리텍대학 분당융합기술교육원 데이터융합SW과 조교수
**서울대학교 환경대학원 환경계획학과 석사과정
***서울대학교 환경대학원 환경계획학과 교수
A Study on Price Premium of High-end and Branded Apartment Complex using Deep Learning
Kyuseok Kim* ; Joowon Lee** ; Kyung-Min Kim***

Correspondence to: Kyung-Min Kim Dept. of Environmental Planning, Graduate School of Environmental Studies, Seoul National University, Seoul, Korea Tel.: +82-2-880-9517, Email: kkim2@snu.ac.kr

초록

본 연구는 일반 아파트 대비 브랜드 아파트의 가격 프리미엄을 분석한다. 분석 대상 브랜드 아파트로는 1990~2000년대 초반 출시된 기존 브랜드 아파트뿐 아니라 2010~2020년대에 출시된 하이엔드 브랜드 아파트를 포함한다. 분석을 위해 부동산 시장 침체기인 2022년 1월부터 2023년 4월까지의 서울시 아파트 실거래가 전체 데이터를 활용한다. 본 연구는 아파트를 기존 브랜드 아파트군, 하이엔드 브랜드 아파트군, 전체 아파트군 세 개 그룹으로 나눈 뒤 실거래가를 비교 분석한다. 구체적인 방법으로는 우선 다중선형회귀분석을 통해 기존 브랜드 및 하이엔드 브랜드의 아파트 매매 가격에 대한 영향력을 분석한다. 이후 DNN 기반의 인공지능 모형을 활용해 실거래가격에 대한 예측을 진행하고 최신 기법인 H20 모듈 방법론을 통해 브랜드 해당 여부 등 각 변수의 인공지능 예측 모형에 대한 기여도를 확인한다.

Abstract

In this study, we analyze the price premium of branded apartment complex compared to ordinary apartments. Analyzed apartment brands include ordinary brands released in 1990s to early 2000s as well as high-end brands released from 2010s to 2020s. The study focuses on apartment transaction data of Seoul from January 2022 to April 2023, which was a period of real estate market downturn. We divided apartment complexes into three groups which are ordinary brand, high-end brand, and all apartments(including branded apartments and non-branded apartments) to examine the price premium of branded apartments using transaction data. First we conducted multiple linear regression analysis and examine the influence of high-end and ordinary brands on apartment transaction prices. After that, we used DNN based AI model to predict apartment transaction price and then using the latest H20 AI platform, we determine how much each variable including ordinary or high-end brand variable contributes to AI model prediction.

Keywords:

branded apartments, high-end brand apartment, linear regression, deep learning, real estate downturn

Ⅰ. 서 론

통계청의 ‘2022년 인구주택총조사 결과’에 따르면 대한민국의 총 가구 수는 2,202만가구이며, 친족가구, 비친족가구, 1인가구 등 일반가구는 2,145만가구로 전체의 97.4%를 차지한다[1]. 일반가구 중 아파트에 거주 중인 가구 수는 2016년 942만 가구(48.6%)에서 2021년 1,114만 가구(51.9%)로 매년 절대량과 비율이 꾸준히 증가하고 있는 추세이다[1].

이렇게 아파트 거주 인원이 증가하는 이유는 편리성, 쾌적성, 커뮤니티, 편의시설 등 환경적인 부분들에 대해서 비아파트보다는 아파트의 만족도가 더 높기 때문이다(S. H. Park et al., 2021)[2].

아파트의 수요가 증가함에 따라 비아파트 대비 아파트의 매매 가격도 덩달아 상승한다. 또한 아파트 중에서도 주변 환경에 따라 가격 차이도 존재한다. 예를 들어, 동일 구조이면서 동일 평형대의 아파트여도 초등학교, 지하철역, 마트 등 주변 시설과의 접근성에 따라 가격의 차이가 존재한다(K. M. Kim et al., 2022)[3].

아파트를 선택 시 고려하는 요인으로는 주변 시설과의 입지 여건, 우수한 경관, 내부 설계, 단지 내 시설뿐만 아니라 유명 브랜드도 영향을 미치는 것으로 나타났다(R114, 2022)[4].

기존의 아파트 매매 가격 형성 요인을 분석한 연구들은 기준금리, CPI 등의 거시경제 변수와 유치원, 초등학교, 버스정류장, 지하철역 등의 주변 시설까지의 접근성을 기준으로 한 연구들이 많았다. 또한, 아파트 브랜드를 포함한 연구임에도 해당 연구 데이터의 공간적 범위가 구 또는 동, 단지 등의 매우 국소적인 지역에 불과하였다.

기존 브랜드 아파트와 2010년 이후 출시된 하이엔드 브랜드를 구분해 발표한 논문은 현재까지 없다는 점도 주목할 필요가 있다. 아파트 시장에서 e편한세상(DL이앤씨), 롯데캐슬(롯데건설), 푸르지오(대우건설)와 같은 브랜드가 나오기 시작한 것은 1990년 대 말부터다. 이후 2010년대 중반부터는 건설사들이 기존 브랜드에 더해 아크로(DL이앤씨), 르엘(롯데건설), 푸르지오써밋(대우건설) 등 하이엔드 브랜드를 추가 출시했다.

본 연구는 부동산 시장 침체기의 아파트 실거래가 데이터를 전체 아파트군, 기존 브랜드군, 하이엔드 브랜드군 세 개 그룹으로 나눠 전체 아파트군 대비 기존 브랜드 및 하이엔드 브랜드 아파트군의 가격 프리미엄을 측정해보고자 한다. 여기서 전체 아파트군은 기존 브랜드, 하이엔드 브랜드뿐 아니라 브랜드가 없는 일반 아파트 등 전체 단지를 말한다. 연구 데이터의 시간적 범위는 2022년 1월부터 2023년 4월까지 16개월간이며, 공간적 범위는 서울특별시 25개구 실거래가 전체이다. 구체적인 분석 방법으로는 전통적인 방식인 다중 선형 회귀분석뿐 아니라 DNN 기반의 인공지능 모형을 활용한다. 우선 선형 회귀분석을 통해 기존 브랜드 및 하이엔드 브랜드의 아파트 매매 가격에 대한 영향력을 분석하고 DNN 기반 인공지능 모형을 통해 실거래 가격에 대한 예측을 진행한다. 이에 더해 최신 기법인 H20 모듈을 활용해 브랜드 해당 여부 등 각 변수의 인공지능 예측모형에 대한 기여도를 확인한다.

본 논문의 구성은 다음과 같다. 2장에서는 아파트 매매 가격 분석 또는 인공지능을 기반으로 아파트 매매 가격 예측에 관한 이론 및 선행 연구를 검토한다. 3장에서는 본 연구에서 활용하는 데이터와 연구 방법론에 대해서 설명한다. 4장에서는 본 연구의 결과를 분석하며, 마지막으로 5장에서는 결론 및 향후 연구 과제를 기술한다.


Ⅱ. 관련 연구

2.1 아파트 매매 가격에 영향을 미치는 환경적인 요인에 관한 연구

부동산 매매 가격에 영향을 미치는 요인에 대한 선행 연구는 다수 존재한다. 역세권 아파트 단지가 매매 실거래 가격에 어느 정도 영향을 미치는지에 대한 분석을 한 연구가 있다(Y. K. Oh et al., 2021)[5]. 이 연구는 2019년 1월부터 2020년 6월까지 거래된 용인시 기흥구, 수지구 4개의 역을 기준으로 선형 회귀분석을 수행하였다. 연구결과, 입지특성, 세대특성, 단지특성 등 계산식 아파트 여부를 제외한 18개의 독립변수는 단위면적(m2)당 매매가격인 종속변수에 영향을 주는 것을 알 수 있었다.

서울 아파트 가격에 영향을 주는 금리, 종합주가지수, 부동산담보대출 금리 등 주요 경제지표와의 연관성을 분석한 연구가 있다(J. I. Choi et al., 2017)[6]. 이 연구에서는 1991년 1월부터 2017년 7월까지 320개월간의 월별 자료를 활용하여 선형 회귀분석을 수행하였다. 분석결과, 종합주가지수와 담보대출 금리가 통계적으로 유의한 변수로 나타났다.

아파트 매매 가격에 영향을 미치는 요인에 대해 시공간적 영향력 변화에 대한 연구가 있다(H. Y. Hong et al., 2015)[7]. 이 연구는 2003년부터 2013년까지 11년간의 서울특별시 25개구의 데이터를 기반으로 선형 회귀분석을 수행하였다. 연구결과, 도심권, 서북권, 동북권이 비슷한 패턴을 보였으며, 동남권과 서남권이 비슷한 패턴을 보였음을 알 수 있었다. 또한, 아파트 가격에 영향을 미치는 요인은 시점마다 지속적으로 변화하고 있음을 알 수 있었다. 과거의 아파트 단지 내부에 역점을 뒀던 것에서 교육, 환경 등의 주변적인 요인들로 변화하고 있음을 알 수 있었다.

아파트 가격에 영향을 미치는 요인으로 도로 입지에 초점을 맞춘 연구가 있다(P. S. Choi et al., 2016)[8]. 이 연구는 2006년 1월부터 2016년 8월까지의 서울특별시 아파트 매매 거래 건과 2011년 1월부터 2016년 8월까지의 전세, 월세 거래 건을 기반으로 선형 회귀분석을 수행하였다. 연구결과, 매매 거래의 경우 ‘대로’와 ‘로’에 위치한 아파트가 ‘길’에 위치한 아파트에 비해 매매 가격이 각 17.8%, 8.6% 더 높아 큰 도로에 위치한 아파트일수록 가격이 더 높음을 알 수 있었다. 전세와 월세 거래의 경우에도 ‘대로’와 ‘로’에 위치한 아파트가 ‘길’에 위치한 아파트에 비해 각 7.8%, 6.0% 임대 가격이 더 높음을 알 수 있었다. 그러나 시간이 지날수록 그 영향력은 줄어 2016년에는 ‘로’에 위치한 아파트 가격이 ‘대로에 위치한 아파트 가격과 거의 차이가 없음을 알 수 있었다.

2.2 아파트 브랜드가 매매 가격에 영향을 미치는 영향력에 관한 연구

아파트 브랜드가 매매 가격에 영향을 미치는 연구가 소수 존재한다.

아파트 브랜드가 매매 가격에 미치는 영향에 대해 분양가 모형과 수익률 모형 등 두 가지로 나누어 분석을 진행한 연구가 있다(Y. H. Lee et al., 2022)[9]. 연구 데이터는 2019년부터 2020년까지의 부산광역시 마린시티 내에 있는 8개 아파트 단지로 하여, 회귀분석을 통해 분석하였다. 연구결과, 분양가 모형에서는 현대건설, HDC현대산업개발의 브랜드 순으로 유의하였고, 수익률 모형에서는 대우건설, 현대건설, HDC현대산업개발, 두산건설, 우신종합건설 순으로 유의함을 알 수 있었다. 이를 통해, 브랜드가 아파트 매매 가격에 유의한 영향을 미침을 알 수 있었다.

부산 해운대구를 중심으로 아파트 가격에 브랜드가 미치는 영향력에 대해 다중 회귀분석을 통해 분석한 연구가 있다(Y. M. Kang et al., 2020)[10]. 연구결과, 브랜드 아파트의 경우 비브랜드 아파트에 비해 브랜드에 따른 매매 가격의 차이뿐만 아니라 평(3.3m2)당 매매가격에도 차이가 있는 것으로 나타났다.

역세권 아파트 단지가 매매 실거래 가격에 어느 정도 영향을 미치는지에 대한 연구도 있다(C. K. Lee et al., 2011)[11]. 이 연구는 아파트 브랜드가 구매의사 결정에 얼마만큼 영향을 미치는가에 대해 전국을 대상으로 총 500개의 표본을 추출하여 이항 로짓 모형을 활용하여 분석하였다. 연구결과, 수도권 지역의 전문직, 고소득자 집단은 브랜드를 고려할 확률이 상대적으로 높았다. 특히, 아파트 브랜드는 비수도권 지역보다는 수도권 지역에서 더 중요한 이슈였음을 알 수 있었다.

명칭 변경 사례를 통해 아파트 브랜드 프리미엄을 분석한 연구도 있다(D. Hyun 2021)[12]. 이 연구는 4만 여개의 아파트 실거래가를 기반으로 이중차이분석을 시행해 아파트의 명칭 변화가 거래 가격에 미치는 영향을 살펴봤다. 기존 아파트 이름에 브랜드명을 넣어 변경한 경우 그에 따른 효과는 단기간 동안 해당 아파트에서만 국한되어 나타났다. 지역 주택 시장에는 가격 상승의 파급효과를 야기 하지는 않는 것으로 나타났다. 기존 아파트 브랜드에 관현 연구에서는 브랜드 자체에 따른 효과를 입지 등 다른 요소들로부터 명확하게 구분해내지 못한 반면 해당 연구에서는 가격 차이의 수준과 추세를 연속된 기간을 통해 비교해 브랜드 자체의 효과를 확인했다.

2.3 경기 침체에 따른 아파트 가격 변동에 대한 연구

최근 아파트 가격에 대한 연구는 부동산 가격 상승기를 주로 다뤘으며 부동산 침체기에 대한 연구는 많지 않다.

S. H. Kim et al. (2016)은 서브프라인 금융위기가 국내 주택시장에 미치는 영향을 분석했다[13]. 이 연구는 서울시 강남 및 강북지역 아파트 매매 가격지수, 주가, 회사채 수익률 등을 벡터오차수정모형을 비교 분석했다. 비교 시기는 금융위기 발생 이전인 2000년 1월까지(Model 1), 20008년 1월부터 2015년 10월까지(Model 2)로 구분했으며 분석 결과 경기 상승기 강남지역의 주택 시장은 주식만큼이나 매력적인 투자처로 작용한 것으로 나타났다. 반면 경기 하락기의 주택 시장은 전반적인 거시경제 흐름에 따라 움직였다.

K. O. Hwang et al. (2020)은 조선업 경기 변동이 울산아파트 매매가격에 미치는 영향에 대한 분석 연구를 진행했다[14]. 이 연구는 벡터오차수정모형을 활용해 2009년 8월부터 2019년 7월 기간까지 울산 지역의 아파트 가격 하락 요인을 분석했다. 분석 결과 울산의 아파트 가격 하락의 가장 큰 요인은 아파트 고유의 특성 자체에 따른 것으로 나타났다. 이밖에도 인구, 조선업황지수가 양(+)의 영향을 미치는 것으로 나타났다. 실업률은 음(-)의 영향을 미치는 것으로 나타났다.

2.4 머신러닝을 활용한 부동산 가격 예측에 관한 연구

부동산 가격, 지수 산출 및 예측과 관련된 선행 연구는 전통적인 회귀분석, 시계열 분석 방법을 활용한 경우가 많았으나 최근에는 머신러닝 기법을 활용하여 예측 정확도를 높이려는 시도가 늘고 있다.

S. W. Bae et al. (2018)은 SVM, RF(Random Forest), Gradient Boosting Regression Tree, DNN(Deep Neural Network), LSTM, 자기회귀이동평균모형, 벡터자기회귀모형, 베이지언 벡터자기회귀모형을 활용해 부동산 가격 지수를 예측했다[15]. 연구결과, 머신러닝 방법이 시계열 분석보다 우수한 예측력을 보였다. 또한, 시계열 분석 방법은 구조적인 변화나 외부 충격으로 급변하는 경우 시장 추세를 예측하기 어려운 것으로 판단됐다.

Y. Huang(2019)은 Decision tree, Boosting, RF, SVM 등 선형 및 비선형 기계학습 방법을 사용하여 주택 가치를 예측하는 연구를 하였다[16]. 데이터로는 미국 캘리포니아주 로스앤젤레스 3개 카운티의 최신 부동산 데이터를 활용했다. 분석 방법 중 Tree 기반 머신러닝 기법의 MSE(Mean Squared Error)을 활용한 결과 데이터양을 늘려감에 따라 0.21부터 그 값이 개선됐다.

T. H. Lee et al. (2019)은 RNN과 LSTM을 활용해 서울 아파트 가격 지수 예측 가능성을 평가하였다[17]. 2006년 1월부터 2017년 10월까지의 서울 중대형 아파트에 대한 월별 주택가격지수 자료를 활용했으며 임대 물가 지수, 부채 금리, 주가지수 등의 거시 경제 변수를 수집하여 분석했다. 분석결과 중대형 아파트 가격 지수는 LSTM의 RSME는 0.826으로 가장 우수한 것으로 나타났다.

A. Louati et al. (2021)는 사우디아라비아 리야드 북부 지역에 위치한 5,946개 토지 데이터를 활용해 기계학습 기반의 Decision tree와 RF(Random forest) 방법론을 통해 가격 예측을 시도했다[18]. 연구결과, RF 방법론에 따른 예측 오차율이 선형 회귀분석이나 Decision tree를 활용한 분석 결과의 예측 오차율보다 낮게 나타났다.

D. Tchuente et al. (2021)는 Geocoding을 통해 획득한 지리적 위치 좌표를 분석 데이터로 포함하는 지 여부가 예측 정확도에 영향을 미치는지를 분석하였다[19]. 연구 데이터로는 프랑스 정부에서 제공하는 5년간의 부동산 거래 데이터를 활용했다. 연구 방법론은 RF, AdaBoost, Gradient boosting이었다. 연구결과, 위치 좌표를 포함하는 경우가 포함하지 않는 경우보다 예측 오차율이 개선된 것으로 나타났다.

2.5 본 연구의 차별점

본 연구는 선행 연구와 비교해 다음과 같은 차별점이 있다. 첫째, 본 연구는 부동산 침체기인 2022년 1월부터 2023년 4월까지 최신의 부동산 실거래 데이터를 활용한다. 구체적으로는 부동산 매매 가격이 떨어지는 침체기에서의 하이엔드 및 브랜드 아파트의 가격 프리미엄에 대해 분석을 한 연구이다. 둘째, 전통적인 분석 방법론인 다중 선형 회귀분석을 통해 각 변수의 연관성 및 기여도를 분석하고, DNN 기반의 인공지능 모형을 통해 미래를 예측하는 연구이다. 셋째, 인공지능 모형 중에서도 최신 기법을 활용해 각 변수의 인공지능 예측 모델에 대한 기여도까지 확인해 볼 수 있는 최신 기술 기반의 연구이다.


Ⅲ. 연구 방법

1절에서는 본 연구에서 활용하는 데이터와 변수설정 기준에 대해 설명하고 2절에서는 연구 방법론에 대해서 기술한다.

3.1 연구 데이터

본 연구는 부동산 시장 침체기를 배경으로 한다. 그림 1의 한국부동산원 통계 자료에 따르면 서울을 기준으로 주택 매매 가격 지수가 보합 또는 하락을 겪은 최근의 시기는 2022년 1월부터 2023년 4월까지이다.

Fig. 1.

Housing price index growth rate

따라서 본 연구의 데이터는 표 1과 같이 국토교통부 부동산 실거래가 공개시스템에서 제공하는 2022년 1월부터 2023년 4월까지 16개월간의 서울특별시 전체 아파트 단지의 실거래가 기록을 활용한다.

Range of data

아파트 브랜드 데이터는 한국기업평판연구소에서 공개하는 월별 아파트 브랜드 순위를 활용한다. 아파트 브랜드는 기존 브랜드와 하이엔드 브랜드 2가지로 나뉜다. 한국기업평판연구소는 아파트 브랜드에 대한 소비자들의 활동 빅데이터를 참여 지수, 미디어 지수, 소통 지수, 커뮤니티 지수 등으로 나눠 점수를 매긴 뒤 그에 따른 아파트 순위를 공개한다[20]. 기존 브랜드는 월별 20위까지, 하이엔드 브랜드는 월별 7위까지 순위별로 공개한다.

그림 2는 2022년 1월부터 2023년 4월까지 아파트 브랜드 순위 10위 이내의 것을 도식화 한 것이다. 힐스테이트는 해당 기간 동안 꾸준히 1위를 기록하였으며, 그 외 푸르지오, 자이, 롯데캐슬, e편한세상은 10위 이내에 항상 등장하였다. 그러나 래미안 등의 11개 브랜드는 시기에 따라 10위권 안팎을 넘나드는 사실을 확인할 수 있었다. 따라서 본 연구에서는 16개월간 10위 이내에 8회 이상(50%) 등장하는 브랜드를 활용한다.

Fig. 2.

Apartment brand rankings

본 연구에서 활용하는 9개의 기존 브랜드는 표 2와 같이 힐스테이트, 푸르지오, 자이, 롯데캐슬, 더샵, e편한세상, 래미안, 아이파크, 위브이다.

Apartment brand rankings

하이엔드 브랜드는 표 3과 같이 아크로, 위브 더제니스, 디에이치, 르엘, 써밋, 트리마제, 푸르지오 써밋으로 총 7개이다.

List of high-end brands

본 연구는 선행연구에서 제시한 CPI, 금리 등과 같은 거시경제 변수와 아파트 단지별 주변 환경, 주요 시설까지의 거리, 층, 면적 등 미시경제 변수를 활용한다. 표 4는 본 연구에서 활용하는 변수별 정의를 나타낸 것이다. TP는 만원 단위의 아파트 실거래 가격, SIZE는 m2 단위의 전용면적, FL은 층이다. DDC부터 DSS까지의 8가지 변수는 각 해당 아파트 단지로부터 가장 가까운 어린이집, 초등학교, 중학교, 고등학교, 마트, 병원, 지하철역까지의 도보 거리를 의미한다. CPI는 소비자 물가지수, BIR은 기준금리, TTY는 10년 국고채물 금리이며, DHA는 표 3과 같이 7개 하이엔드 브랜드 아파트 여부를 나타내는 더미변수, DBN은 표 2와 같이 하이엔드가 아닌 9개의 기존 브랜드 아파트 여부를 나타내는 더미변수 이다.

Definition of variables

기존 브랜드 아파트와 하이엔드 브랜드 아파트를 나타내는 더미변수는 아래 표 5의 기준에 따른다. 조건 1은 표 2(기존 브랜드) 또는 표3(하이엔드 브랜드)에 따른 브랜드 아파트 해당 여부를 판단한다. 조건 2는 준공년도 5년 이하 아파트를 신축 아파트로 정의하는 일반적인 통념에 따라 설정했다. 본 연구에서 활용하는 더미변수인 DHA와 DBN은 표 5의 두 가지 조건을 모두 만족시킬 때 1로 표현한다.

Definition of ordinary brand and high-end brand

본 연구에서 활용하는 모형은 아래 식 (1), (2)과 같다. 식 (1)의 모형은 전체 데이터를 기준으로 기존 브랜드와 하이엔드 브랜드의 영향력을 측정하기 위해 DHA와 DBN 변수를 포함하였다.

TPi=β0+β1SIZEi+β2FLi+β3DDCi+β4DIGi +β5DESi+β6DMSi+β7DHSi+β8DMTi +β9DHPi+β10DSSi+β11CΠi+β12BIRi +β13TTYi+β14BY+β15DHAi+β15DBNi+ε(1) 

식 (2)의 모형은 기존 브랜드군, 하이엔드 브랜드군, 전체 아파트군 등 각 그룹에 따라 개별 변수가 아파트 매매가격에 미치는 영향력의 차이를 확인한다.

TPi=β0+β1SIZEi+β2FLi+β3DDCi+β4DKGi +β5DESi+β6DMSi+β7DHSi+β8DMTi +β9DHPi+β10DSSi+β11CΠi+β12BIRi +β13TTYi+β14BYi+ε(2) 

3.2 연구 방법론

본 연구에서는 전통적인 분석 방법론인 다중 선형 회귀분석(Multiple linear regression analysis)을 수행하여 각 변수들의 유의성과 영향력을 파악한다. 이후 DNN 기반의 인공지능 모형을 수행하여 실거래가 예측에 대한 정확도를 알아본다. 여기에 더해 최신 기법인 H20 모듈을 활용해 브랜드 해당 여부 등 각 변수의 인공지능 예측 모형에 대한 기여도를 확인한다. 이때 데이터는 기존 브랜드군, 하이엔드 브랜드군, 전체 아파트군(기존 브랜드, 하이엔드 브랜드, 일반 아파트 등 전체 포함) 등 3개 그룹으로 나누어 분석을 진행한다.

DNN 기반의 인공지능 모형을 통해 예측된 값은 식 (3)과 같이 예측 절대 오차율인 MAPE(Mean Absolute Percentage Error)를 통해 모형의 예측 정확성을 산출한다. 이때 적용되는 모형은 식 (1)과 같으며 데이터 또한 전체 데이터를 활용한다.

MAPEi=100ni=1nAi-FiAi(3) 
  • Ai : Actual Value
  • Fi : Forecasted Value

DNN 기반의 인공지능 모형을 수행함에 있어 학습 데이터와 검증 데이터는 전체 데이터를 전처리 후 7:3(15,410개:6,604개)으로 임의 분할하여 활용한다. 그리고 정확성이 높은 설정 값을 파악하기 위하여 각 설정별로 10회씩 반복수행하여 정확도를 검증한다.

본 연구에서 활용하는 DNN 기반의 인공지능 모형은 독립변수가 n개 일 때, output의 size를 1씩 줄여나가는 n개의 hidden layer로 구성된다. 뉴런 또한 n부터 1까지 1개씩 줄여나간다. 그리고 각 layer별 활성화 함수는 다중 선형회귀 모형에서 주로 활용되는 ReLU(Rectified Linear Unit)로 설정한다.

이 모형의 하이퍼 파라미터는 아래 표 6과 같다. Batch size는 최적의 정확도를 얻기 위하여 1로 고정하고 Epoch는 10으로 설정하며, 학습률 등의 기타 설정은 기본값으로 한다.

Configuration of the DNN model


Ⅳ. 연구 결과

4.1 기술 통계

표 7은 전체 아파트 데이터 23,023건 중 취소된 거래 1,009건(4.38%)을 제외한 22,014건에 대한 변수별 통계값이다.

Descriptive statistics of the entire apartment data(n = 22,014)

표 8은 본 연구에서 활용하는 22,014건의 데이터 중 기존 브랜드 아파트의 매매 거래 건인 1,627건(7.39%)에 대한 변수별 기술 통계이다.

Descriptive Statistics of the Ordinary Brand Apartment Data(n = 1,627)

표 9는 본 연구에서 활용하는 22,014건의 데이터 중 하이엔드 브랜드 아파트의 매매 거래 건인 62건(0.28%)에 대한 변수별 기술 통계이다.

Descriptive Statistics of High-end Apartment Data(n = 62)

아래 그림 23은 위 세 가지의 데이터 그룹에 대한 변수별 평균값을 도식화 한 것이다. 그림 2는 전용면적(SIZE), 층(FL), 준공년도(BY) 및 8가지의 주변 환경, 주요 시설까지의 거리 변수를 그래프로 표현한 것이다.

Fig. 3.

Mean values of apartment group variables

전체 아파트 데이터의 평균 전용면적(SIZE)은 69.1m2, 기존 브랜드 아파트는 72.6m2, 하이엔드 브랜드 아파트는 89.3m2로 집계됐다.

이는 브랜드의 가치가 높은 그룹일수록 평균 전용면적도 커진다는 것을 보여준다. 준공년도의 평균값의 경우 기존 브랜드 아파트는 2019.8, 하이엔드 브랜드 아파트는 2019.6으로 비슷하다. 전체 아파트 데이터는 2004.7로 기존 브랜드 및 하이엔드 브랜드 아파트와 약 15년의 차이를 보인다. 그 외에 주변, 환경 시설까지의 거리를 보면 중학교(DMS), 고등학교(DHS)를 제외한 나머지 6개의 변수는 하이엔드 브랜드 아파트, 기존 브랜드 아파트, 전체 아파트 순으로 가까움을 알 수 있다.

그림 4는 아파트 그룹별 평균 매매 가격을 그래프로 표현한 결과다. 전체 아파트 데이터의 평균 매매 가격은 9억 8,106만원, 기존 브랜드 아파트의 평균 매매 가격은 12억 496.1만원, 하이엔드 브랜드 아파트의 평균 매매 가격은 30억 1,654.4만원으로 집계됐다.

Fig. 4.

Average transaction price by apartment groups

이는 전체 아파트 평균 매매 가격에 비해 기존 브랜드 아파트가 약 23%, 하이엔드 브랜드 아파트가 약 207% 더 비싸다는 것을 의미한다.

4.2 다중 선형회귀 분석 결과

표 10은 전체 아파트 실거래 데이터에 대해서 식 (1)의 연구모형을 적용하여 선형 회귀분석을 수행한 결과이다. 수행 결과, 활용된 16개의 독립변수 모두 유의수준인 p-value의 값이 0.001 보다도 작아 유의한 것으로 나타났다. SIZE, FL, DDC, DKG, DHS, DHP, CPI, TTY, DHA, DBN은 그 수치가 높아지면 매매 가격도 상승하는 것으로 나타났다. 여기서 전용면적이 1평(3.3m2) 커질수록 5,508.228만원이 증가, 층수가 1층 높아질수록 1,299.07만원 증가한 것으로 나타났다. 표 3에 따른 하이엔드 브랜드 아파트라면 16억 2,500만원 증가, 표 2에 따른 기존 브랜드 아파트라면 1억 9,080만원이 증가하는 것으로 나타났다.

Results of linear regression analysis for the entire dataset(n = 22,014)

그 외 어린이집, 유치원, 고등학교, 병원까지의 거리는 멀어질수록 가격이 낮아지는 모습을 보였다. 다만 아파트의 평균 매매 가격 9억 8,106만원에 대해 100m 당 어린이집, 유치원, 고등학교, 병원까지의 거리가 멀어짐에 따라 하락한 아파트 매매 가격은 각각 약 1,204만원(1.23%), 2,210만원(2.25%), 297만원(0.30%), 2,192만원(2.24%)으로 매매 가격에 대한 영향력은 미미한 수준으로 볼 수 있다.

그 외의 변수인 DES, DMS, DMT, DSS를 분석한 결과 거리가 멀어질수록 아파트 매매 가격이 낮아지는 것으로 나타났으며, BY도 최근일수록 가격이 낮아지는 것으로 나타났다. 이 변수들 중 준공년도에 대해서는 1년 당 약 146.6만원(0.149%)이 차이 나는 만큼 매매가격에 미치는 영향은 매우 적음을 알 수 있다.

표 11은 기존 브랜드 아파트 실거래 데이터에 대해서 식 (2)의 연구모형을 적용하여 선형 회귀분석을 수행한 결과이다. 수행 결과, 활용된 14개의 독립변수 중 FL, DDC, DES, DHP, TTY, BY 등 6개를 제외한 9개의 독립변수는 p-value의 값이 0.001 보다도 작아 유의한 것으로 나타났다.

Results of linear regression analysis for ordinary branded apartments(n=1,627)

유의한 독립변수 중 SIZE, DKG, DHS, CPI는 그 값이 올라갈수록 매매 가격도 상승하는 것으로 나타났다. 이 중 전용면적은 1평 커질수록 매매 가격이 5,765만원 증가하며, 층수는 1층 높아질수록 매매가격이 272만원 증가하는 것으로 나타났다. 그리고 유치원까지의 거리와 고등학교까지의 거리는 그 거리가 100m 늘어날 때 아파트 매매가격이 각각 6,629만원, 2,111만원 늘어났다. 다만 이는 기존 브랜드 아파트의 평균 매매 가격인 12억 496만원, 하이엔드 브랜드 아파틔 평균 매매가격인 30억1,654만원에서 각각 약 5.5%, 1.8% 비중을 차지하는 수준으로 그 영향력이 크지 않음을 알 수 있다.

표 12는 하이엔드 브랜드 아파트가 속해 있는 강남3구(강남, 서초, 송파)와 광진구, 동작구, 성동구 등 6개 지역구에 대해 식 (1)의 연구모형을 적용하여 선형 회귀분석을 수행한 결과이다. 수행 결과, 활용된 16개의 독립변수 중 DMT, TTY 등 2개를 제외한 14개의 독립변수는 유의한 것으로 나타났다. 유의한 독립변수 중 SIZE, FL, DDC, DKG, CPI, DHA, DBN은 그 값이 올라갈수록 매매 가격도 상승하는 것으로 나타났다. 이 중 어린이집까의 거리와 유치원까지의 거리는 그 거리가 멀어질수록 가격이 올라간다는 점에서 기존 연구들과의 상반되는 차이점은 있다. 즉, 100m가 멀어지면 아파트 매매가격은 각각 1,589만원, 1,935만원씩 상승한다는 특이점이 있으나, 이는 해당 6개 지역구의 평균 매매 가격인 15억 9,949만원의 1.0%, 1.2%에 해당하는 수준으로 그 영향력은 매우 미미하다고 볼 수 있다. 전용면적의 경우 1평 커질수록 매매 가격은 1,892만원이 증가하며, 층수는 1층 높아질수록 1,988만원 증가하는 것으로 나타났다.

Results of linear regression analysis for high-end brand apartments in the specified districts(n = 6,372)

하이엔드 브랜드 아파트는 전체 아파트(기존 브랜드, 하이엔드, 일반 아파트 등 전체 포함) 대비 13억 518만원의 가격 프리미엄이 있으며, 기존 브랜드 아파트는 3억 8,383만원의 가격 프리미엄이 있는 것으로 나타났다. 다만 하이엔드 브랜드가 속해 있는 지역구인 성동구, 동작구, 광진구 및 강남 3구로 한정해 봤을 때는 하이엔드 브랜드의 가격 프리미엄은 소폭 줄어든다.

하이엔드 브랜드 아파트의 평단가는 1억 792만원으로 성동, 동작, 광진 및 강남 3구 지역 아파트의 평단가인 약 6,364만원 대비 약 69.6% 비싸다. 이 평단가를 기준으로 면적별 매매가를 산출한 결과, 하이엔드 브랜드 아파트 25평의 매매가는 26억 9,800만원으로 관련 지역구 전체 아파트 평균 매매가인 15억 9,100만원과 비교했을 때 약 11억 700만원 더 높다.

DES, DMS, DHS, DSS BIR, BY 변수의 경우에는 그 값이 올라갈수록 매매 가격도 하락하는 것으로 나타났다. 특히 준공연도는 10년 더 최근일수록 오히려 7,594만원 하락하는 것으로 나타났다. 그러나 이 부분의 경우 지역구 전체 아파트 평균 매매 가격 15억 9,949만원의 4.7%에 불과한 수준으로 준공년도가 매매가격에 미치는 영향은 다소 적음을 알 수 있다.

그림 5는 위 세 개의 데이터 그룹에서 공통적으로 유의한 변수들의 계수값을 비교한 결과이다. 전용면적인 SIZE 변수, 소비자 물가지수인 CPI 변수는 전체 아파트군에서 기여도가 가장 컸다. 이어 기존 브랜드군, 하이엔드 브랜드군 순이었다. 층 변수인 FL의 아파트 매매가격에 대한 영향력은 기존 브랜드 아파트 그룹보다는 전체 아파트 또는 하이엔드 아파트 브랜드 그룹에서 더 크게 나타났다.

Fig. 5.

Comparison of coefficient values for significant variables across data groups

중학교까지의 거리인 DMS 변수와 유치원까지의 거리인 DKG 변수는 데이터 그룹별 변수의 부호가 상이함을 알 수 있다. 특정 환경, 시설까지의 거리는 멀어질수록 매매 가격이 내려가는 경향을 보이기 때문에 일반적으로 부호가 음수지만 DMS 변수에서는 하이엔드 브랜드 아파트 그룹의 계수가 양수, DKG 변수에서는 전체 데이터와 기존 브랜드 아파트의 계수가 양수로 나타났다.

다만 하이엔드 브랜드 아파트 그룹의 DMS 변수의 계수는 양수이지만 샘플 데이터가 매우 적어 신뢰성을 확보하기 어려웠다. 또 DKG 변수의 전체 아파트 그룹과 기존 브랜드 아파트 그룹의 계수는 절대값이 작아 매매 가격대비 상대적 영향력이 미미함을 알 수 있다. 지하철역까지의 거리인 DSS 변수의 계수는 세 데이터 그룹에서 공통적으로 음수이며 브랜드 가치가 높을수록 그 절대값이 커지는 경향을 보였다. 또한, 기준금리인 BIR 변수의 계수도 세 데이터 그룹에서 공통적으로 음수였다. 하이엔드 브랜드 아파트 그룹에서의 BIR 변수의 절대값은 다른 두 그룹보다 훨씬 더 커 기준금리에 따라 아파트 매매가격의 변동이 훨씬 심하다는 사실을 확인할 수 있다.

4.3 DNN 기반의 인공지능 모형 분석 결과

표 13은 전체 아파트 실거래 데이터에 대해서 표 6의 DNN 기반 인공지능 모형을 적용하여 10회 반복 수행 후 그 정확도를 검증한 결과이다. 수행 결과, MAPE의 평균값은 2.12, 최소값은 1.16, 최대값은 5.03으로 매우 높은 수준의 정확도를 보임을 알 수 있다.

MAPE measurement results for the AI-based DNN model

4.4 인공지능 모델에서의 변수별 중요도

그림 6는 전체 아파트 실거래 데이터에 대해서 각 변수의 DNN 기반의 인공지능 모형에 중요도를 시각화 한 것이다.

Fig. 6.

Importance of each variables

이 그래프는 중요도의 비중이 가장 큰 사이즈 변수를 1.0으로 할 때, 다른 변수들의 중요도를 상대적으로 나타낸 것이다. SIZE와 BY 변수는 80.5% 이상의 비율로 중요성이 있음을 알 수 있다. 이는 선형 회귀분석에서의 변수별 계수의 절대값의 크기순과 일치함을 알 수 있다. 하이엔드 브랜드 더미변수인 DHA는 기준금리 변수인 BIR보다 그 영향력이 컸으며, 기존 브랜드 더미변수인 DBA는 10년 국고채 금리보다 그 영향력이 더 큼을 알 수 있었다.


Ⅴ. 결 론

5.1 연구 결론

본 연구는 부동산 시장 침체기에 하이엔드 및 브랜드 아파트의 가격 프리미엄에 대해 분석하였다. 연구 데이터의 시간적 범위는 2022년 1월부터 2023년 4월까지 16개월이며, 공간적 범위는 서울특별시 25개구 실거래가 데이터 전체이다. 데이터는 기존 브랜드 아파트군, 하이엔드 브랜드 아파트군, 전체 아파트군 세 개 그룹으로 나눈 뒤 실거래가를 비교 분석한다. 구체적인 방법으로 DNN기반의 인공지능 모형과 전통적인 방식인 다중선형회귀분석을 활용한다. 우선 다중선형회귀분석을 통해 기존 브랜드 및 하이엔드 브랜드의 아파트 매매 가격에 대한 영향력을 분석한다. 이후 DNN 기반의 인공지능 모형을 활용해 실거래가격에 대한 예측을 진행하고 최신 기법인 H20 모듈 방법론을 통해 브랜드 해당 여부 등 각 변수의 인공지능 예측 모형에 대한 기여도를 확인한다.

연구 결과는 선형 회귀분석을 통해 분석된 결과 네 가지와 인공지능을 통해 분석된 결과 두 가지로 정리된다.

첫째, 힐스테이트, 푸르지오, 자이, 롯데캐슬, 더샵, e편한세상, 래미안, 아이파크, 위브 등 9개의 기존 브랜드 아파트는 전체 아파트군과 비교했을 때 약 1억 9,080만원의 가격 프리미엄이 있다.

둘째, 아크로, 위브 더제니스, 디에이치, 르엘, 써밋, 트리마제, 푸르지오 써밋 등 7개의 하이엔드 브랜드 아파트는 전체 아파트군 대비 약 16억 2,500만원의 가격 프리미엄이 있다.

셋째, 하이엔드 브랜드 아파트는 기존 브랜드나 그 외의 아파트에 비해 소비자 물가지수나 기준금리에 더 큰 영향을 받는다.

넷째, 전체 아파트군, 기존 브랜드 아파트군, 하이엔드 브랜드 아파트군 등 모든 데이터 그룹에서 지하철역과의 거리가 멀어질수록 아파트 가격에 부정적인 영향을 미치며, 그 정도는 브랜드의 가치가 상승함에 따라 더 큰 것으로 나타났다.

다섯째, DNN 기반의 인공지능 모형을 통해 실거래가격에 대한 예측을 수행한 결과, MAPE 평균은 2.12로 예측력이 매우 우수함을 알 수 있었다.

여섯째, 최신 기법인 H20 모듈 방법론을 활용한 결과 전용면적 및 준공년도 변수의 인공지능 예측 모델에 대한 기여도는 다른 변수 대비 상대적으로 큼을 알 수 있었다.

본 논문은 부동산 시장 침체기에 아파트 브랜드가 매매 가격에 미치는 영향에 대해 선형 회귀분석을 통해 분석하고, DNN 및 H20 기반의 인공지능 모형을 통해 예측을 진행해 기존 브랜드 및 하이엔드 브랜드의 영향력에 대해 살펴보았다. 이를 통해, 아파트 매매 가격을 분석함에 있어 브랜드를 독립변수로 포함시켜야 한다는 것을 확인할 수 있었다.

5.2 연구의 보완점 및 추후 연구

본 연구에서는 하이엔드 브랜드 아파트의 샘플수가 적어 그 신뢰성 확보에 한계가 있었다.

추후 연구에서는 연구 데이터의 시간적 범위를 부동산 시장 침체기뿐만 아니라 상승기, 보합기 등 전체 범위로 넓혀 하이엔드 브랜드 아파트의 샘플수를 더 확보하고 아파트 브랜드의 가치에 대해서 시점별로 세분화 하여 확인해 볼 수 있을 것이다. 연구에서 활용된 분석 모형은 추후 아파트 매매 가격을 예측하는 도구로서 활용할 수 있을 것으로 기대한다.

References

  • Statistics Korea, https://kostat.go.kr/, [accessed: Jun. 01, 2016]
  • S. H. Park, N. J. Kim, and H. Y. Park, "Comparative Analysis on Factors Affecting Residential Satisfaction of Public and Private Rental Housing", Journal of The Residential Environmental Institute of Korea, Vol. 19, No. 4, pp. 149-166, Dec. 2021. [https://doi.org/10.22313/reik.2021.19.4.149]
  • K. M. Kim, K. S. Kim, and D. S. Kim, "A Study on the Index Estimation of Missing Real Estate Transaction Cases Using Machine Learning", Journal of the Economic Geographical Society of Korea, Vol. 25, No. 1, pp. 171-181, Mar. 2022. [https://doi.org/10.23841/egsk.2022.25.1.171]
  • R114, https://m.r114.com/, [accessed: Jun. 01, 2016]
  • Y. K. Oh, S. I. Lee, and S. J. Yoo, "An analysis on apartment price in representative metro station spheres in Yongin-City – Bundang Line vs Shin-Bundang Line -", Residential Environment Institute of Korea, Vol. 18, No. 2, pp. 147-158, Jun. 2021. [https://doi.org/10.22313/reik.2021.19.2.147]
  • J. I. Choi and O. D. Lee, "Analysis of the Relationship between Seoul Apartment Price and Major Economic Indicators", Korean Real Estate Academy Review, No. 71, pp. 147-158, Dec. 2017.
  • H. Y. Hong and J. H. Lee, "A Time Series and Spatial Analysis of Factors Affecting Housing Prices in Seoul, Vol. 16, No. 2, pp. 87-108, Jun. 2015. [https://doi.org/10.23129/seouls.16.2.201506.87]
  • P. S. Choi and I. S. Min, "An Empirical Evaluation of Road Location on Housing Transaction Prices", Journal of Real Estate Analysis, Vol. 2, No. 2, pp. 61-76, Nov. 2016. [https://doi.org/10.30902/jrea.2016.2.2.61]
  • Y. H. Lee and S. W. Shin, "The Effect of Contractor Brand on Apartment Presale Price and Investment Return – Focusing on U-dong, Haeundae-gu, Busan", Journal of the Residential Environment Institute of Korea, Vol. 20, No. 2, pp. 1-16, Jun. 2022. [https://doi.org/10.22313/reik.2022.20.2.56]
  • Y. M. Kang and J. Y. Suh, "A Study on the Valuation Ratio of Brand in Real Price – A Case Study of Udong and Banyeodong in Busan Metropolitan City-", The Studies in Regional Development, Vol. 52, No. 1, pp. 93-120, Jun. 2020. [https://doi.org/10.35526/srd.2020.52.1.005]
  • C. K. Lee, E. J. Kim, and Y. H. Kwon, "A Analysis for the effect of Apartment Brand on Consumer’s purchase behaviors", The Journal of the Korean Urban Management Assocation, Vol. 24, No. 3, pp. 73-88, Sep. 2011.
  • D. Hyun, "A Brand Pemiun on Apartment Prices : Evidences from Renaming Cases", Journal of the Korean Real Estate Analysis Association, Vol. 27, No. 1, pp. 21-35, Mar. 2021. [https://doi.org/10.19172/KREAA.27.1.2]
  • S. H. Kim and J. J. Kim, "An Analysis on the Influence of the Financial Market Fluctuations on the Housing Market before and after the Global Financial Crisis", Journal of the Korea Academia-Industrial Cooperaion Society, Vol. 17. No. 4, pp. 480-488, Apr. 2016. [https://doi.org/10.5762/KAIS.2016.17.4.480]
  • K. O. Hwang and D. J. Jeong, "An Analytical Study on the Effects of the Changing Shipbuilding Business on Apartment Sales Prices in Ulsan", Journal of Real Estate Analysis, Vol. 6, No. 2, pp. 21-35, Jun. 2020. [https://doi.org/10.30902/jrea.2020.6.2.21]
  • S. W. Bae and J. S. Yu, "Predicting the Real Estate Price Index Using Machine Learning Methods and Time Series Analysis Model", Housing Studies Review, Vol. 26, No. 1, pp. 107-133, Feb. 2018. [https://doi.org/10.24957/hsr.2018.26.1.107]
  • Y. Huang, "Predicting Home Value in California, United States via Machine Learning Modeling", Statistics, Optimization & Information Computing, Vol. 7, No. 1, pp. 66-74, Jan. 2019. [https://doi.org/10.19139/soic.v7i1.435]
  • T. H. Lee and M. J. Jun, "Prediction of Seoul House Price Index Using Deep Learning Algorithms with Multivariate Time Series Data", SH Urban Research & Insight, Vol. 8, No. 2, pp. 39-56, Aug. 2018. [https://doi.org/10.26700/shuri.2018.08.8.2.39]
  • A. Louati, R. Lahyani, A. Aldumaykhi, and S. Otai, "Price Forecasting for Real Estate Using Machine Learning : A Case Study on Riyadh City", Concurrency and Comutation, Vol. 34, No. 6, Mar. 2021. [https://doi.org/10.1002/cpe.6748]
  • D. Tchuente and S. Nyawa, "Real estate price estimation in French cities using geocoding and machine learning", Annals of operations research, Vol. 308, pp. 571-608, Jan. 2022. https:/doi.org/10.1007/s10479-021-03932-5.
  • Brand Reputation Index, https://brikorea.com/, [accessed: Jun. 01, 2016]
저자소개
김 규 석 (Kyuseok Kim)

2011년 2월 : 한국항공대학교 정보통신공학(공학사)

2019년 8월 : 아주대학교 정보통신공학(공학석사)

2019년 6월 : LG전자(주) 선임연구원

2020년 2월 : ㈜LG유플러스 책임연구원

2019년 9월 ~ 현재 : 서울대학교 환경계획학과 박사수료

2020년 ~ 현재 : 한국폴리텍대학 분당융합기술교육원 데이터융합SW과 조교수

관심분야 : 데이터 수집, 데이터 분석, 머신러닝, 딥러닝, 도시계획, 근거리 무선통신, 상황인지

이 주 원 (Joowon Lee)

2016년 2월 : 한양대학교 영어영문학(학사)

2016년 1월 ~ 2022년 7월 : 서울경제신문 취재기자

2022년 9월~ 현재 : 서울대학교 환경대학원 환경계획학과 석사과정

관심분야 : 데이터 수집, 데이터 분석, 도시계획, 부동산

김 경 민 (Kyung-Min Kim)

1995년 2월 : 서울대학교 지리학(학사)

2002년 5월 : UC Berkeley School of Information 정보 시스템 전공(석사)

2008년 6월 : Havard University 도시계획 · 부동산 전공(박사)

2002년 5월 : Oracle, US 소프트웨어 엔지니어

2001년 1월 : Hyosung Data Systems 소프트웨어 엔지니어

2009년 ~ 현재 : 서울대학교 환경대학원 환경계획학과 교수

관심분야 : 도시계획, 부동산 시장 분석, 인공지능, 머신러닝

Fig. 1.

Fig. 1.
Housing price index growth rate

Fig. 2.

Fig. 2.
Apartment brand rankings

Fig. 3.

Fig. 3.
Mean values of apartment group variables

Fig. 4.

Fig. 4.
Average transaction price by apartment groups

Fig. 5.

Fig. 5.
Comparison of coefficient values for significant variables across data groups

Fig. 6.

Fig. 6.
Importance of each variables

Table 1.

Range of data

Classification Content
Temporal range January 2022 to April 2023
Spatial range All apartments in Seoul

Table 2.

Apartment brand rankings

Brand Construction firm Average rank
Hillstate Hyundai 1
Prugio Daewoo 2.44
Xi GS 2.94
Lotte Castle Lotte 4.81
The Sharp Posco 5.47
ePyeonhansesang DL E&C 5.88
Raemian Samsung C&T 6.00
I-Park HDC Hyundai development 7.60
We‘ve Doosan 8.80

Table 3.

List of high-end brands

Brand Construction firm
Acro DL E&C
We’ve the Zenith Doosan
The H hyundai
Le|el Lotte
Summit Hoban
Trimage Doosan
Prugio Summit Daewoo

Table 4.

Definition of variables

Variable Definition
TP Transaction Price[10,000won]
SIZE Size[m2]
FL Floor[F]
DDC Distance to Daycare Center[m]
DKG Distance to Kindergarten[m]
DES Distance to Elementary School[m]
DMS Distance to Middle School[m]
DHS Distance to High School[m]
DMT Distance to Mart[m]
DHP Distance to Hospital[m]
DSS Distance to Subway Station[m]
CPI Consumer Price Index
BIR Base Interest Rate
TTY 10 Year Treasury Yields
BY Built Year
DHA Dummy variable for High-end Apartment
DBN Dummy variable for Branded Apartment

Table 5.

Definition of ordinary brand and high-end brand

Condition Content
1 Brands that correspond to Table 2 or Table 3
2 With a difference of 5 years or less based on the completion year from contract month

Table 6.

Configuration of the DNN model

Variable Value
Batch size 1
Epoch 10

Table 7.

Descriptive statistics of the entire apartment data(n = 22,014)

Var. Mean STD.DEV Min. Max.
TP 98,106 83,564 6,700 1,450,000
SIZE 69.1 34.6 11.3 309.7
FL 9.6 6.4 -1 64
DDC 473.1 918.7 0 8,300
DKG 714.0 893.2 0 9,100
DES 796.5 883.2 79 8,900
DMS 995.1 866.4 134 8,600
DHS 1,166.3 931.9 105 9,100
DMT 574.6 890.5 0 8,100
DHP 633.4 913.3 0 8,300
DSS 929.7 905.7 111 7,800
CPI 107.9 2.0 104.0 110.1
BIR 2.6 0.9 1.3 3.5
TTY 3.3 0.4 2.5 4.3
BY 2004.7 11.7 1961 2023
DHA 0.0028 0.0530 0 1
DBN 0.0739 0.2616 0 1

Table 8.

Descriptive Statistics of the Ordinary Brand Apartment Data(n = 1,627)

Var. Mean STD.DEV Min. Max.
TP 120,496 58,375 27,000 501,750
SIZE 72.6 16.5 14.8 161.5
FL 12.1 7.6 1 45
DDC 293.8 320.0 121 4,400
DKG 567.3 305.3 4,700 104
DES 600.0 276.5 104 4,600
DMS 873.6 403.6 208 4,600
DHS 1,050 530.2 121 6,400
DMT 407.2 295.5 19 4,700
DHP 490.5 429.2 61 4,800
DSS 839.0 382.2 121 4,400
CPI 108.6 1.8 104.0 110.1
BIR 2.9 0.9 1.3 3.5
TTY 3.4 0.3 2.5 4.3
BY 2019.6 1.9 2017 2023

Table 9.

Descriptive Statistics of High-end Apartment Data(n = 62)

Var. Mean STD.DEV Min. Max.
TP 301,654 180,602 60,000 1,300,000
SIZE 89.3 34.6 40.2 264.5
FL 15.7 10.3 1 47
DDC 205.5 166.2 22 553
DKG 506.5 221.6 246 963
DES 740.9 164.3 378 958
DMS 865.5 189.9 397 1,100
DHS 1,408.3 1,324.8 373 3,700
DMT 358.1 118.0 167 568
DHP 489.8 237.7 132 1,900
DSS 610.3 139.9 230 1,200
CPI 108.1 2.1 104.0 110.1
BIR 2.7 0.9 1.3 2.5
TTY 3.3 0.3 2.5 3.9
BY 2019.8 1.1 2018 2022

Table 10.

Results of linear regression analysis for the entire dataset(n = 22,014)

Variable Coefficient t-test
Adj. R2 = 0.549
* : p < 0.05, ** : p < 0.01, *** : p < 0.001
Intercept 144,400 -1.975
SIZE 1,669.16*** 144.63
FL 1,299.07*** 21.30
DDC 12.0392*** 6.557
DKG 22.1031*** 15.037
DES -15.2379*** -9.493
DMS -8.1042*** -7.370
DHS 2.9731*** 3.951
DMT -14.3270*** -8.050
DHP 21.9267*** 18.116
DSS -20.1645*** -22.706
CPI 1,307.6657*** 1.718
BIR -9,382.5264*** -5.953
TTY 2,970.4195*** 2.202
BY -146.6200*** -3.882
DHA 162,500*** 22.614
DBN 19,080*** 12.112

Table 11.

Results of linear regression analysis for ordinary branded apartments(n=1,627)

Variable Coefficient t-test
Adj. R2 = 0.501
* : p < 0.05, ** : p < 0.01, *** : p < 0.001
Intercept 2,402,000 -2.230
SIZE 1,746.9915*** 27.497
FL 272.6183 1.953
DDC -5.1725 -0.992
DKG 66.2910*** 13.889
DES -5.6090 -1.064
DMS -32.8037*** -10.035
DHS 21.1093*** 8.766
DMT -26.2669*** -4.087
DHP 0.4578 0.148
DSS -29.0845*** -8.942
CPI 5,672.5667*** 2.625
BIR -27,510*** -5.913
TTY -6,682.0125 -1.686
BY -1,443.3129 -1.716

Table 12.

Results of linear regression analysis for high-end brand apartments in the specified districts(n = 6,372)

Variable Coefficient t-test
Adj. R2 = 0.590
* : p < 0.05, ** : p < 0.01, *** : p < 0.001
Intercept 896717.2 3.32303
SIZE 1892.535*** 80.50886
FL 1988.272*** 14.90063
DDC 15.89567*** 3.538543
DKG 19.3505*** 6.351365
DES -27.2707*** -7.38977
DMS -10.0345*** -3.76695
DHS -4.80295*** -2.9723
DMT 5.853858 1.303046
DHP 19.8227*** 6.518046
DSS -11.7311*** -4.47764
CPI 6242.67** 3.230683
BIR -22398*** -5.68065
TTY 1053.963 0.307312
BY -759.442*** -7.89631
DHA 130518.1*** 14.06644
DBN 38383.77*** 8.684855

Table 13.

MAPE measurement results for the AI-based DNN model

Var. Mean STD.DEV Min. Max.
MAPE 2.12 1.14 1.16 5.03