Korean Institute of Information Technology
[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 20, No. 5, pp.89-97
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 May 2022
Received 06 Apr 2022 Revised 20 May 2022 Accepted 23 May 2022
DOI: https://doi.org/10.14801/jkiit.2022.20.5.89

사용자 데이터 활동 기반 서비스 활성화 촉진체계를 위한 데이터 공유 및 보상의 개념적 모형 개발:바이오데이터 서비스를 중심으로

이용호* ; 김은진**
*한국과학기술정보연구원 책임연구원
**한국과학기술정보연구원 책임연구원(교신저자)
A Study on the User Benefit Model of Data Sharing Activity to Enhance Service Usage
Yongho Lee* ; Eunjin Kim**

Correspondence to: Eunjin Kim Korea Institute of Science and Technology Information Tel.: +82-42-869-0821, Email: kimej@kisti.re.kr

초록

데이터 중심 사회로의 전환에 따라 바이오 분야에서도 연구데이터 댐 구축 및 서비스가 추진 중이다. 데이터 등록과 활용이 연구자 중심으로 선순환되도록 하기 위해서는 사용자 중심의 서비스 활성화 촉진체계가 필요하다. 본 연구에서는 바이오 데이터 전주기에 대해 파악하고 기존 연구를 바탕으로 체계 정의 및 연구자 참여 행위 분석을 통해 연구자 데이터 활동 기반의 사용자 참여 활성화 체계를 제안하였다. 결과적으로 4가지의 사용자 활동 분류에 따라 사용자 활동 점수를 부여하여 경쟁하는 게이미피케이션 체계를 수립하였다. 데이터 공유, 교류, 제3자 활용에 의해 점수가 부여되도록 하여 공공영역에서 효과적으로 작동하는 공동체 요소를 강화하는 방식을 활용하였으며 데이터 공유에 대한 유무형의 보상은 획득 점수에 따른 분석인프라의 활용 연계 및 연구커뮤니티의 평판을 통한 인정욕구의 충족으로 연결하였다.

Abstract

The transition of data-centric R&D are being addressed as significant agenda in the R&D sector and research data dam construction plans and services are being developed in the bio sector. Therefore, in order to create a virtuous cycle centered on researchers, this study proposed an activity-based user participation activation system through activity-specific analysis. As a result, we developed a gamification based score system and assigns user scores based on service activity. The scoring was done using a method that reinforces the element of community gamification that works well in the public domain by sharing data, exchanging data, and using data in research by other users. The access of analysis infrastructure according to the score obtained and the satisfaction of the need for recognition through the reputation of the research community were linked to the tangible and intangible rewards for data sharing activities.

Keywords:

data dams, bio-research data, user scoring system, data life cycle, facilitation system

Ⅰ. 서 론

인공지능, 빅데이터, 초연결 등으로 촉발된 지능화 혁명 또는 그 이상의 변혁적 전환으로 설명되는 4차 산업혁명은 COVID-19의 등장과 함께 산업 및 사회 수용주기가 빨라지는 양상을 나타내고 있다. 이러한 양상으로 비대면·디지털 경제로의 전환이 가속화되고 있는 것 또한 주지의 사실이다.

이래형(2020)의 연구에서 지적한 바와 같이 비대면 네트워크를 통해 물리적 소통을 보완하는 것이 일반적인 추세가 되면서, 서로 주고받는 데이터의 양적 팽창이 일어나고 있으며 팽창된 데이터는 한곳에 뭉침으로서 그 자체로 새로운 부가가치와 혁신을 기대할 수 있다[1][2]. 지능화가 전반적으로 확산되는 현 시점에서 이러한 데이터 집중화는 연구개발 부문에서도 자연스러운 현상이 되고 있다.

연구개발 과정에서 산출되는 연구데이터는 연구결과에 대한 검증 도구로 활용되는 수준을 넘어 재사용을 통해 연구 기간, 비용의 단축 및 데이터 융합을 통한 새로운 연구로의 활용가능성을 인정받고 있다.

연구 데이터의 학술적·경제적 가치에 대한 관심 증가로 다수의 국가에서 연구데이터의 보존 및 활용에 대한 다양한 정책을 추진하고 있다. 미국의 NIH, NSF 등 연방기관은 데이터 정책과 규정을 마련하여 시행중으로 NIH는 2003년부터 연간 50만 달러 이상의 연구 과제에 대해 데이터관리 계획 제출을 의무화하였으며, 2017년부터는 세계 최대 바이오 데이터센터(NCBI)를 운영중에 있다. NSF는 2011년 1월 이후 모든 연구과제의 DMP 제출을 의무화하도록 규정하고 있다. 영국은 자연환경연구위원회를 구성하여 연구데이터 관리체계를 구축하였고, 유럽은 2018년 5월부터 GDPR 규정을 통해 자국민 데이터의 해외 이전을 제한하여 데이터 보호를 강화하고 있다[1].

특히 바이오 분야는 유전체 분석기법 및 ICT 발전으로 데이터를 활용한 개인별 맞춤의료(정밀의료)로 패러다임이 전환되면서 바이오 데이터의 축적과 활용이 매우 중요해지고 있다. 유전체 해독, 인공지능 등의 기술발달과 연구 데이터 축적기술의 발전은 빅데이터를 활용한 연구의 확산을 가져오고 있는데 개인 의료정보와 생활건강 정보 및 유전체 정보를 종합적으로 연계하여 난치성 질환 치료제, 개인 맞춤형 의약품 등 다양한 신약과 정밀의료 서비스가 개발되는 등 데이터가 촉발하는 새로운 바이오 연구의 부흥기가 마련되고 있다.

주요 선진국은 대규모 프로젝트를 통해 데이터의 대량생산과 축적을 통한 규모의 경제를 실현하고 있으며 최근에는 분야별 축적·활용 단계에서 이종간 연계·통합의 단계로 넘어가고 있다.

미국은 연방 데이터 전략(’20)을 통해 모든 연방 데이터의 표준화, 품질관리 및 상호운용을 추진하고 있으며 유럽은 유럽생물정보센터(EBI)를 통해 국제 데이터 연합체 중심의 데이터를 통합하고 있다.

우리 정부에서도 데이터 축적·활용의 중요성을 인식하여 바이오 헬스 산업 혁신전략(’19), 제3차 국가생명연구자원 관리·활용 기본계획(’20~’25), 생명연구자원 빅데이터 구축전략(’20)을 통해 국가 바이오 빅데이터를 축적하여 활용토록 하는 정책을 추진하고 있으며 특히「생명연구자원 빅데이터 구축전략」(’20)을 통해 국가 바이오 연구개발 데이터를 한 곳에서 연계·활용토록 하는 통합 체계를 마련하고[3] 2021년부터 국가 바이오데이터스테이션 서비스를 시범적으로 운영하고 있다.

국가바이오데이터스테이션(K-BDS, Korea-Bio Data Station)은 부처·사업·연구자별로 흩어져 있는 바이오 연구데이터를 통합·수집·제공하는 플랫폼으로서 정부에서 지원하는 바이오 분야 연구개발사업을 통해 생산되는 연구데이터(생화학분석, 이미지(영상), 임상 및 전임상, 오믹스, 분자구조, 표현형 정보)를 통합 수집해 고품질의 데이터가 연구현장에서 활용될 수 있는 기반을 마련하는 바이오분야의 데이터댐 역할을 수행한다. K-BDS는 현재 국가생명연구자원정보센터(KOBIC)와 한국과학기술정보연구원(KISTI)이 참여해 개발하고 있다.

시범운영 기간의 데이터 서비스 모델은 바이오 분야 국가연구개발사업 연구데이터센터와의 연계 및 등록 데이터 제공을 중심으로 추진되며, 데이터 가시화, 협업 및 활용환경은 향후 구축될 예정이다. 2022년 5월 현재 데이터 축적은 바이오 국가연구개발사업의 데이터를 중심으로 데이터 보유기관의 등록활동을 통해 이루어지며 개별 연구자 등록 및 활용을 활성화시킬 다양한 사업이 추진될 예정이다.

데이터 서비스 모델과 데이터 기반 연구 프로세스를 매칭하면 그림 1과 같이 표현할 수 있다.

Fig. 1.

Linkage diagram between K-BDS data service and data intensive research flow

연구데이터 서비스의 취지 및 장점에도 불구하고 개별 연구자가 기존 연구 방식을 전환하여 K-BDS를 통해 데이터를 등록하고 데이터를 활용하기 위한 참여 유인이 마련되었다고 할 수는 없다.

앞서 언급한 선진국 사례에서 확인된 바와 같이 주요국들은 데이터 수집 활성화와 관련하여 의무 등록 정책을 시행하여 수집 거버넌스를 완성한 상태이다.

시범 운영 기간 동안의 데이터 활용 모델은 서비스 운영주체의 하향식 데이터 제공 이후 데이터 품질의 우수성에 의존한 연구자 활용의 일방향 방식으로 설계되어 있다. 데이터 활용 활성화는 데이터를 탐색하여 사전 연구를 진행하고 연구 주제 및 내용에 다시 반영하는 지속적 활동을 통해 이루어지는 것으로 데이터 품질과 같은 단일 제공 요소로 활성화되기 어려운 측면이 존재한다. 따라서 연구자가 데이터 기반 연구로의 전환, 정보탐색 및 획득 채널의 변경, 연구 데이터로서의 K-BDS 데이터 편입 등 기존 연구방식을 전환하고 추가로 K-BDS의 통합 데이터를 활용하며, 나아가 본인의 연구 데이터를 공유하는 활동으로 사이트 활성화에 기여하도록 하기 위해서 다양한 참여 동기를 부여하는 촉진체계 마련이 필요하다. 이러한 사용자에 대한 복합적 유인이 포함된 데이터 활용 촉진 체계의 설계 및 반영을 통해 연구자 중심의 데이터 활용 생태계를 조성해야 데이터 서비스의 지속가능한 성장이 담보될 수 있을 것이다.

본 연구의 구성은 다음과 같다. 먼저 관련 문헌 연구를 통해 데이터의 공유(기여) - 보상에 대한 영향요인을 살펴보고 선행연구 분석을 포함하여 연구자 참여 활성화 체계에 대한 방향성을 제시한다. 이를 바탕으로 촉진체계 목표 및 방식 등을 정의하고 시스템상 사용자 참여 행위 분석을 통해 활성화 체계를 설계한다. 마지막으로 설계 내용에 대한 실무적 시사점, 연구의 한계 및 연구방향을 제시한다.


Ⅱ. 서비스 활성화 촉진체계 설계

2.1 관련 문헌 연구

국가바이오데이터 스테이션과 같이 데이터 생산주체와 소비주체가 동일한 서비스는 서비스 주체가 중심이 되는 일방적 데이터 공급과 활용 촉진 정책으로는 사용자층이 확대되기 어려운 한계가 존재한다. 따라서 서비스 주체에 의한 일방향적 유인책을 보완할 수 있도록 사용자 참여에 의해 데이터 축적 및 활용 활성화가 이루어지도록 하는 유인책 마련이 수반되어야 한다.

데이터 생태계에서의 축적과 활용은 온라인 지식 네트워크의 체제와 동일하다. 온라인 지식 네트워크에서도 본인의 지식을 공유하거나 필요 지식 활용을 꺼려하는 상황이 발생하곤 하는데[4], 이는 지식 공유에 참여하는 상대방을 알지 못하는 것에서 오는 신뢰 문제, 필요 지식만을 취해가는 무임승차 행위에 대한 부정적 인식에서 비롯되는 경우가 많다[5]. 따라서 본 연구에서 목표하고자 하는 데이터 활용 생태계 조성을 위해서는 이를 해결하는 실질적인 노력과 체계 마련이 필요하다.

Nahapiet and Ghoshal[6]은 조직 내 지식공유를 설명하기 위하여 사회적 자본 관점을 제시하고, (1)개인 사이의 구조적인 유대나 관계(구조적 자본 structural capital)가 존재할 때, (2)개인이 공유된 지식을 이해하고 제공할 인지적 능력(인지적 자본 cognitive capital)이 있을 때, (3)개인 간의 유대관계가 강하고 긍정적 성격을 띠고 있을 때(관계적 자본 relational capital) 지식의 통합과 공유는 촉진될 것이라고 주장한 바 있다. 이러한 부분은 데이터 축적과 활용에서도 마찬가지로 적용될 수 있다.

한편 Wasko and Faraj[7]의 연구는 온라인을 통한 조직 외부의 개인간 지식공유 활동을 사회적 자본요인으로만 설명하는 데는 한계가 있으며, 이러한 사회적 자본요인이 개인적 동기요소와 통합되어 설명될 때 더 큰 설명력을 갖는다는 것을 밝혔다. 이 외에도 많은 연구에서 지식 공유활동에 영향을 미치는 다수의 연구가 있으나 이는 사용자를 대상으로 한 설문조사를 통해 지식기여-보상의 영향요인을 실증적으로 분석하여 유의미한 요인을 파악하는 데 초점을 맞추고 있으며 체계의 실질적 설계와는 다소 거리가 있다. 특히 민간 서비스를 대상으로 하여 실질적 보상 연계가 모호한 공공부문으로 일반화하기에는 무리가 있으므로 본 연구에서는 이를 감안하여 설계에 적용할 필요가 있다.

한편 서비스 이용에서의 개인적 동기요인을 부여하는 방법으로 비게임분야에 적용하는 게이미피케이션에 대한 학술적 논의가 있다[8]. 게이미피케이션은 브랜드, 상품, 서비스 등에 도전과 놀이, 성취와 그에 따른 보상 등의 게임 요소를 가미해 고객들이 흥미를 가지고 능동적으로 상품과 서비스를 이용하게 만드는 것으로 현재 많이 활용되고 있는 개념이다[9]. 서비스에 게이미피케이션을 적용한다는 것은 사용자가 서비스 이용 행위를 일종의 게임 속에서 유저들간의 경쟁으로 인식하도록 하여 해당 서비스에 몰입하여 꾸준한 소비가 일어나도록 유도하는 것이다. 온라인 사이트 이용에서 흔히 볼 수 있듯이 방문 횟수, 후기 작성 수, 구매 실적과 같은 고객들의 활동 정도에 따라 포인트를 적립하고, 누적된 점수에 따라 활동 순위나 고객의 등급을 매겨 이에 따른 혜택이나 경품 등을 제공하는 것이 이에 해당한다.

본 연구의 목적인 공공서비스에서의 체계 설계와 관련하여 구유리, 이선민[11]은 공공·정책영역에서 게이미피케이션 활용을 위해 기존 문헌 분석을 통해 6가지 게이미피케이션 요소(도전, 성취, 자기표현, 공동체, 지위, 경쟁)를 도출하였으며 그 과정에서 그들이 속한 사회집단에 대한 이타심과 연대감을 자극하는 공동체 요소가 강조되고 있음을 밝힌 바 있다. 단, 효용성 탐색에 대한 기초 연구인 관계로 사용자 활동 분석을 통한 실제적 보상체계 설계가 다루어지지 않은 점이 있다.

기존 문헌연구를 기반으로 본 서비스의 서비스 활성화 촉진체계 구성 및 설계에 적용할 시사점과 방향성은 다음과 같이 정리할 수 있다.

첫째, 온라인상에서 제3자가 활용할 디지털 제공물(Offering)에 대해서는 데이터 신뢰를 위해 제공자 신분과 역량에 대한 정보를 제공한다.

둘째, 무임승차 행위에 대한 부정적 인식을 차단하기 위해 사용자 유입시 데이터 축적 활동을 유발하는 구조적 장치(데이터 등록의무 등)를 마련한다.

셋째, 제공물을 활용할 사용자가 원 제공자에 대해 질의가 가능한 환경을 제공한다.

넷째, 서비스 게이피케이션을 구현하기 위하여 사용자 활동에 대한 점수를 부여하고 사용자들이 이를 잠재적인 경쟁으로 인식하도록 한다. 사용자 점수에 따른 유형 또는 무형의 보상을 부여하는 방안을 제공한다. 무형의 보상은 공공영역에서 효과적으로 나타나고 있는 공동체 게이미피케이션 요소를 자극하는 방향으로 설계한다.

2.2 촉진체계의 정의 및 설계

효과적인 데이터 생태계 선순환을 위한 활용 활성화 개념모형 설계를 위해 체계 수립의 목표 및 효과에 대한 정의를 포함하여 4단계의 분석 절차로 정리하였으며 이는 그림 2와 같다.

Fig. 2.

Research flow

촉진체계는 데이터 전 주기의 사용자 활동별로 점수를 부여하고, 이를 기반으로 유·무형의 사용자 보상을 제공하는 체계로 정의한다. 이 때 사회적 자본 확보 관점에서 사용자간 신뢰 및 연대를 위한 사용자 인증, 정보교류 환경 및 개인적 동기를 부여하는 보상 체계를 제공하도록 한다.

두 번째로 서비스 내 사용자 활동은 표 1과 같이 데이터 사이클의 주요 흐름에 따라 위계를 나누어 분석하였다. 제시된 활동은 관리자 활동을 제외하고 데이터베이스와 관련한 서비스 내의 모든 활동을 대상으로 분석하였다. 즉 데이터 등록, 검색 및 제3자 활용과 관련하여 발생할 수 있는 모든 사용자 활동을 서비스 구축보고서 및 홈페이지 서비스를 기준으로 파악하여 위계를 구분하였다.

User activity analysis (illustrative)

데이터 등록 활동은 이중 가장 많은 비율을 차지한다. 바이오 데이터는 유전체, 분자구조, 생화학분석, 표현형 및 화학 반응 정보 등 연구 분야별로 그 세부 등록형태와 양식이 다르다. 표준 등록 양식상 활동별로 연관된 데이터 유형과 파일크기를 정리하였다.

참고로 표준등록양식은 국가생명연구자원정보센터에서 2020년도에 완성한 연구분야 공통 데이터 표준 7건 및 분야별 표준 44건을 포함한 총 52건의 데이터 표준 등록 양식을 활용하였다[10]. 전체 데이터 표준 분류은 표 2와 같다.

Biodata standards

세 번째로 사용자 활동의 계층 구조를 정리하여 그림 3과 같이 도식화하였다. 사용자 활동은 크게 데이터 등록 관련 활동(Data activity), 등록 데이터의 질의 및 피드백을 중심으로 하는 네트워킹 활동(Networking activity), 분석 클러스터 환경에서 데이터 분석을 수행하는 분석활동(Analyzing activity), 시스템 사용상의 피드백 활동, 데이터의 제3자 연구 활용 활동과 관련 세부 활동으로 분류하였다. 단 현재 제공하고 있는 서비스 기능 뿐 아니라 향후 제공할 분석 인프라 활동 및 데이터 제공시 발생할 사용자간 데이터 관련 피드백 등 네트워킹 활동도 포함하였다.

Fig. 3.

Hierarchy by user activities in data service

마지막으로 세부 활동별 중요도를 판단하여 평점화 작업을 수행하였다. 연구 과정에서 산출되는 데이터를 중심으로 수행하는 해당 활동을 통해 집계되는 연구자 단위의 평점은 연구 활동의 효과성과 파급효과를 측정할 수 있는 대리지표로 작용할 수 있으며 연구집단 내 인정·신뢰의 총합으로 간주할 수 있는 평판점수로 연결할 수 있다. 따라서 연구자가 얻게 되는 인정과 신뢰도 점수의 총합을 사용자 개인별로 매기고 이를 비교·확인하여 동기 부여의 수단으로 삼는다.

점수 부여 기준은 가장 기초적인 활동을 기본 점수로 설정하고 활동별 적정 비례 관계에 따라 배점을 설정하는 것이 핵심이다. 본 연구에서는 활동 중 가장 기본적인 사용자 정보 등록 활동을 기준점(Anchor point)로 정의하여 10점을 부여하고 타 활동 수행시 필요한 물리적 투입시간을 가늠하여 이를 비교한 상대 점수를 기재하는 방법으로 표 3과 같이 기준을 마련하였다.

Scoring criteria by user activity (illustrative)

점수 부여체계는 사용자 활동 데이터가 미비한 상태에서 전문가 판단에 의해 수립하였으므로 향후 사용자 활동 로그 분석을 통해 점수 부여 방식을 재조정하는 것이 필요하다.

획득 점수에 대한 보상체계는 다음과 같이 구성하였다. 유형의 보상은 바이오 데이터 분석에 필요한 초고성능컴퓨팅 계산자원을 제공하는 혜택과 연결한다. 바이오데이터 스테이션 사업을 통해 구축한 바이오 빅데이터 분석용 컴퓨팅 인프라(19노드/1노드당 CPU 128 core, GPU A100 40GB) 계산자원 배분시 일정 기준 이상의 사용자 활동 점수를 획득한 사용자에게는 가점을 부여한다. 향후 사용자 활동 점수체계가 활성화되면 축적된 점수는 계산자원 노드시간으로 전환, 활용하는 방식도 고려할 수 있다. 무형의 보상은 사용자 활동유형별로 사용자 배지를 단계별로 획득하도록 하고 점수 축적에 따라 사용자 등급이 높아지도록 제공한다.

데이터 공유 및 데이터의 제3자 활용에 따라 축적되는 사용자 활동 점수는 연구활동의 활성화 정도 및 학술적 신뢰도를 나타내는 평판점수(Reputation score)화 되어 게이미피케이션의 소속감 고양 및 커뮤니티 인정 욕구의 충족으로 연결될 수 있다. 이상의 내용을 종합한 프레임워크를 개념도로 나타내면 그림 4와 같이 나타낼 수 있을 것이다.

Fig. 4.

Conceptual framework of data sharing and reward


Ⅲ. 결론 및 향후 과제

본 연구에서는 생산과 소비의 주체가 동일한 연구자 중심의 데이터 공유·활용 서비스에서 제안된 방법을 통해 바이오 데이터 제공, 네트워킹, 데이터 활용 결과로 나타나는 커뮤니티 내 인정과 신뢰도를 지표화하여 연구자의 평판 점수간 상호 비교할 수 있는 방법 및 체계를 제시하였다. 본 활용 촉진 체계를 통해 사용자 스스로 서비스 활용의 내적 동기부여가 이루어지는 선순환 구조가 가능해진다. 따라서 향후 서비스 개편시 제시한 촉진 체계를 구현함으로써 본격적인 서비스 활성화를 기대해 볼 수 있을 것이다.

본 연구에서 제시한 프레임워크에 따라 실제 사례에 적용하여 논리적 타당성 및 적용가능성을 확인하는 작업이 필요하나 사용자 데이터의 미비로 이를 확인할 수 없다는 점이 연구의 한계로 지적된다. 따라서 향후 체계 도입에 따라 사례 분석을 포함하여 실제 데이터를 근거로 한 점수 체계의 조정 작업이 추후 연구 과제로 진행될 필요가 있다.

본 서비스 활성화 체계는 유입된 사용자 고착(Lock-in) 효과 및 향후 데이터 축적에 따라 사용자가 증가하는 데이터 네트워크 효과를 극대화하는데 효과적일 수 있으나 연구자 신규 유입 유인으로 작동하기에는 한계가 존재한다.

따라서 연구자가 기존의 데이터 획득, 공유 채널을 전환하는 제도적 유인책과 보완적으로 활용되어야 할 것이다. 예를 들어 데이터 성과물을 연구성과물로서 인정하거나 또는 연구데이터의 등록을 국가 연구개발사업 평가시 가점으로 인정하는 것들이 정책 수단의 사례가 될 수 있을 것이다.

Acknowledgments

이 논문은 과학기술정보통신부 재원으로 수행된 「데이터 스테이션 구축 및 운영(플랫폼 구축 및 툴 개발)(N-22-NM-CA01-S01)」의 연구비 지원을 받아 수행된 연구임.

References

  • E. Shin, S. Sohn, J. Suh, and Y. Kim, "Considerations for Data Rights in Publicly Funded Research", Policy Research, Science and Technology Policy Institute, 2019.
  • R. Lee, "Survival Strategies for Data Business in the Post-COVID Era", Journal of Technology Innovation, Vol. 28, No. 4, pp. 165-175, Nov. 2020. [https://doi.org/10.14386/SIME.2020.28.4.166]
  • Ministry of Science and Technology Information and Communication, Multi-Agencies, Big Data Strategy for Biological Research Resources, 2020.
  • D. Constant, L. Sproull, and S. Kiesler, "The Kindness of Strangers : The Usefulness of Electronic Weak Ties for Technical Advice", Organization Science Vol. 7, No. 2, pp. 119-135, Apr. 1996. [https://doi.org/10.1287/orsc.7.2.119]
  • N. Nohria and R. G. Eccles, "Face-to-Face : Making Network Organizations Work", In Networks and Organizations : Structure, Form, and Action, Harvard Business School Press, pp. 288-308, 1992.
  • J. Nahapiet and S. Ghoshal, "Social Capital, Intellectual Capital, and Organizational Advantage", Academy of Management Review, Vol. 23, No. 2, pp. 242-266, Apr. 1998. [https://doi.org/10.5465/amr.1998.533225]
  • M. M. Wasko and S. Faraj, "Why Should I Share? Examining Social Capital and Knowledge Contribution in Electronic Networks of Practice", MIS Quarterly, Vol. 29, No. 1, pp. 35-57, Mar. 2005. [https://doi.org/10.2307/25148667]
  • A. Han, "A Systematic Literature Review of Research Trends in Domestic Gamification", The Journal of the Korea Contents Association, Vol. 18, No. 5, pp. 566-578, May 2018.
  • K. Doo, "Case Study on Using Gamification as an Effective Marketing Strategy", Journal of Digital Convergence, Vol. 18, No. 2, pp. 395-401, 2020.
  • Korea Bioinformation Center, Current Status of Standardization of Bio Research Data Registration Form in 2021, 2021.
  • Yoori Koo and Sunmin Lee, "Developing UX Design Strategies for the Better Engagement of the Public through the Use of Gamification in the Public Service and Policy Sector", Archives of Design Research, Vol. 30, No. 4, pp. 87-106, Nov. 2017. [https://doi.org/10.15187/adr.2017.11.30.4.87]
저자소개
이 용 호 (Yong-Ho Lee)

1999년 : KAIST 산업경영학과 공학사

2001년 : 서울대학교 협동과정 기술경영전공 공학석사

2013년 : 서울대학교 산업공학과 공학박사

2003년 ~ 현재 : 한국과학기술정보연구원 책임연구원

관심분야 : 기술혁신, 기술정보분석, 바이오정책연구

김 은 진 (Eunjin Kim)

2009년 2월 : 서울대학교 경영정보학 전공 경영학 박사

2009년 9월 ~ 현재 : 한국과학기술정보연구원 책임연구원

관심분야 : 데이터플랫폼, 디지털 혁신, 과학기술정보정책

Fig. 1.

Fig. 1.
Linkage diagram between K-BDS data service and data intensive research flow

Fig. 2.

Fig. 2.
Research flow

Fig. 3.

Fig. 3.
Hierarchy by user activities in data service

Fig. 4.

Fig. 4.
Conceptual framework of data sharing and reward

Table 1.

User activity analysis (illustrative)

Activity
(level 1)
Activity
(level 2)
Activity
(level 3)
Data type Data size
(S/M/L)
User registration User registration N/A Text S
Data registration Project registration User profile Text S
Program information Text S
Project information Text S
Output(paper, patent) info. Text S
Sample registration Sample type Text S
Sample characteristics Text S
Data registration
(by 52 data standards)
NGS metadata Meta info.(text) S
NGS files Raw data(fastq, md5) L
Microarray series Meta info.(text) S
Microarray sample detail Meta info.(text) S
Microarray Protocol Meta info.(text) S
Edit project/sample/data Edit info. N/A N/A
Submit Submit N/A N/A
Confirm registration Request certificate of data registration N/A  N/A 
Search Search Fulltext search N/A  N/A 
search by category N/A  N/A 
Download Meta info. download Meta info. download by project, sample, data Meta info. N/A 
Raw data download Raw data download (including meta info.) Raw data / Processed data N/A 

Table 2.

Biodata standards

Group Biodata standards(database)
Common data Nucleic acid NGS/Microarray/nucleocide sequence/Primer Data
Proteomics Microarray/proteomics Data
Metabolomics Metabolomics Data
Image brain MRI/fMRI/brain PET/Brain EEG/Brain iEEG/Brain MEG/Optical Microscope Data/Electron Microscope Data/Animal Bio Signal Data/MRI/PET/CT/ultrasonic data
Compound Compound Structure Information/Compound Efficacy Evaluation/Compound profiling /Bioassay Data
Etc other data
Specialized data for research Health Research Data On In Vitro Diagnostic Devices/Biomaterial Information For Medical Devices/Biological Signal Measuring Device Information/Health Data Information/Toxicity Test Data/Clinical Efficacy Data Of Anticancer Drugs/Research Information On Drug Repositioning/IND(Investigational New Drug) Data/Biomarker Data
Agrobio Livestock (Dairy Cattle) Characteristic Information/Livestock (Pig) Characteristics/Livestock (Chicken) Characteristics/Crop (Genetic Population) Feature/Livestock(Korean_Native) Characteristic Information/Crop(Variants) Feature/Crop(Variety) Feature/Crop(Resource) Feature /Crop(GMO) Feature/Crop(Genome Editing) Feature/Wild Plant(Resource) Feature/Wild Plant(Genetic Population) Feature/Characteristic Information Of Animal Stem Cell Lines/Chemical Pesticide Information/Bio Pesticide/Food Ingredient/Food Functional Data/Food Processing Data
Marine/Fisheries Marine (Plants) Feature/Marine (Animal) Feature/Marine (Genetic Scissors) Feature/Aquaculture Data/Aquatic Animal Disease/Aquatic Live Food Feature Information/Aquatic Feed Feature Information
Environmental Insect Distribution Data

Table 3.

Scoring criteria by user activity (illustrative)

Activity Detailed activity Scoring criteria
Data activity User info. project/sample meta info. registration 10 points if all items are filled
Meta info. registration 100 points
Raw file upload
*get extra points by file size
100 points plus 10 points when a user uploads data exceed average size by area
confirmation of submit and registration -
Networking activity Q&A activities with respect to ‘My’ data questioning/answering/confirming answer 10 points per one feedback activity, respectively
Analyzing activity Using analysis cluster 30 points after using analysis cluster
Feedback Suggestions for system development 10 points
Satisfaction survey 20 points
Using data in research Data views 1 points per view
Download counts 2 points per downloading
Using data in research(acknowledgement) 500 points