Korean Institute of Information Technology

Home

The Journal of Korean Institute of Information Technology - Vol. 21 , No. 10

[ Article ]
The Journal of Korean Institute of Information Technology - Vol. 21, No. 10, pp. 171-184
Abbreviation: Journal of KIIT
ISSN: 1598-8619 (Print) 2093-7571 (Online)
Print publication date 31 Oct 2023
Received 30 Jun 2023 Revised 31 Aug 2023 Accepted 03 Sep 2023
DOI: https://doi.org/10.14801/jkiit.2023.21.10.171

국가R&D정보서비스 적용을 위한 ChatGPT 뉴스기사의 PEST 분야별 이슈 탐색
나혜인* ; 이병희**
*한국과학기술정보연구원 NTIS센터 학생연구원, 과학기술연합대학원대학교 과학기술경영정책학과 박사과정
**한국과학기술정보연구원 NTIS센터 책임연구원, 과학기술연합대학원대학교 과학기술경영정책학과 교수(교신저자)

Exploring PEST Issues in ChatGPT News Articles for the Application to the National R&D Information Service
Hye-In Na* ; Byeong-Hee Lee**
Correspondence to : Byeong-Hee Lee NTIS Center, Korea Institute of Science and Technology Information Tel: +82-42-869-1724, Email: bhlee@kisti.re.kr

Funding Information ▼

초록

최근 주목받고 있는 대화형 인공지능 챗GPT의 등장으로 다양한 분야에서 디지털 전환이 가속화되고 있다. 챗GPT는 텍스트 생성 및 요약, 자동 번역, 콘텐츠 생성, 프로그램 코드 작성 등 폭넓게 활용될 수 있다. 과학기술 분야에서도 챗GPT 기능이 탑재된 국가R&D정보서비스에 대한 이용자들의 수요가 증가하고 있다. 이에 본 연구에서는 국가R&D정보서비스에 챗GPT의 잠재적 적용 방향을 도출하기 위해 뉴스기사를 대상으로 PEST 분야별 텍스트 마이닝을 활용하여 거시적 환경 변화와 챗GPT의 이슈 토픽에 대한 탐색적 분석을 수행하였다. PEST 분석 결과, 챗GPT의 활용 및 규제, 교육에 미치는 영향, 반도체 산업의 성장, 챗봇 서비스 개발 경쟁 등 다양한 이슈가 도출되었다. 본 연구는 뉴스 데이터를 기반으로 거시환경 변화에 따른 챗GPT의 영향과 이슈 토픽을 파악하여 향후 국가R&D정보서비스의 적용 방향을 제시했다는 점에서 의의가 있다.

Abstract

The emergence of ChatGPT, a conversational AI chatbot that has attracted attention recently, is accelerating digital transformation in various fields. ChatGPT can be widely used for text generation, text summarization, translation, content creation, and program code writing. There is an increasing demand for national R&D information service equipped with ChatGPT functions in the science and technology field. In this study, text mining by PEST fields is used in news articles to explore the analysis of macro-environmental changes and issue topics of ChatGPT, aiming to derive potential application directions of ChatGPT in national R&D information service. The results of the PEST analysis present various issues in the use and regulation of ChatGPT, its impact on education, the growing semiconductor industry, and the competition in the development of chatbot services. The significance of this study is that it suggests the future directions for the development of the national R&D information service based on the identified impact and issue topic of ChatGPT through news data analysis.


Keywords: ChatGPT, news article, PEST analysis, text mining, national R&D information service

Ⅰ. 서 론

2022년 11월말 OpenAI에서 출시한 대화형 인공지능 챗봇(AI Chatbot)인 챗GPT는 질의에 대한 답변뿐만 아니라 텍스트의 요약 및 생성, 번역, 콘텐츠 생성, 프로그램의 코드 작성 등 혁신적 기능을 갖춰 폭넓게 활용될 수 있다[1]. 기존의 챗봇이 주어진 정보를 바탕으로 간단한 질의응답의 대화를 했다면, 챗GPT는 이용자들이 입력한 텍스트의 의미를 이해하고 분석할 뿐만 아니라 이전 대화의 내용을 기억하여 인간과 유사한 수준의 의사소통이 가능하다. 그러나 챗GPT를 활용하는 것에 대해 거짓 정보를 생산하거나 최신 정보를 답변하지 못하는 한계점도 있다. 이에 사이버 범죄의 악용과 보안 위협, 정보 유출, 결과물의 잘못된 사용 등으로 발생될 수 있는 문제에 대한 대응방안의 필요성도 제기되고 있다.

최근 과학기술정보통신부는 국가과학기술 방향을 제시하는 「제5차 과학기술 기본계획(’23∼’27)」을 발표하면서 인공지능(AI)을 차세대 통신, 첨단로봇제조, 양자 기술과 더불어 디지털 전환의 필수 기반기술로 선정하였다[2]. 인공지능은 학습능력 개선과 활용성을 중심으로 바이오 및 제조 산업의 난제를 해결하는 AI솔루션 개발을 단기 목표로 설정하였다. 장기 목표는 고도화된 인지·판단·추론 기반의 의사결정 능력을 구현하는 세계 최고 수준의 인공지능 기술 강국으로 도약하는 것이었다. 특히, 챗GPT와 같은 생성형 AI기술은 타 전략분야와 융합하거나 양자보안을 비롯한 위성통신, 메타버스 기술과 접목하여 활용될 필수기반 기술 역할을 할 것으로 기대된다.

우리나라 국가연구개발(R&D)에 관한 사업, 과제, 연구자, 성과 등 과학기술 정보를 종합적으로 제공하는 국가R&D정보서비스(NTIS)는 매년 정기적으로 이용자 간담회를 개최하여 서비스 개선사항을 반영하고 있다. 최근에는 챗GPT 등장으로 인해 촉발된 거시환경의 변화와 과학기술계 미치는 영향력으로 인해 국가R&D정보서비스에도 챗GPT 기능과 같은 서비스 수요가 증가하고 있다. 국가R&D정보서비스에서 운영하는 챗봇(엔디)은 연구과제 정보검색의 편리성을 넘어 챗GPT 기술을 적용하여 요약, 번역, 분석 등을 포함한 고도화된 국가R&D 정보 연계 및 분석 서비스로의 전환이 요구되는 상황이다. 이러한 점에서 이용자들의 챗GPT에 대한 관심은 높아지고 있으나, 국가R&D정보서비스에서는 아직 도입 초기 단계에 머물러 있다.

본 연구는 챗GPT 등장으로 인한 거시적 환경변화와 사회적 이슈를 전반적으로 탐색하고, 국가R&D정보서비스 적용을 위한 기초자료를 제공하고자 한다. 이를 위해 뉴스 빅데이터 분석방법을 활용하여 국가R&D정보서비스 고도화 및 챗GPT 도입을 위한 사전조사 차원에서 뉴스기사에서의 사회적 논의 흐름을 파악하고자 한다. 즉, 챗GPT 관련 뉴스기사를 수집하고 PEST(Political, Economic, Social, Technological) 분석과 텍스트 마이닝 기법을 결합한 방법으로 핵심 키워드와 이슈 토픽을 분석한다. PEST 분석은 기업이나 조직의 발전계획수립에 활용되는 전략적 도구이며, 본 연구에서는 챗GPT와 관련된 뉴스기사에서 언급된 정치·경제·사회·과학기술 측면의 다양한 이슈들을 분석하여 국가R&D정보서비스에 적용 가능한 전략 방향을 제시하고자 한다.

본 논문의 구성은 다음과 같다. 2장에서는 챗GPT 관련 동향과 PEST 분석방법, 국가R&D정보서비스에 챗GPT 기술 도입의 필요성을 살펴본다. 3장에서는 뉴스 데이터 수집과 연구방법에 대해 설명한다. 4장에서는 챗GPT 뉴스보도 현황과 PEST 분야별 분석 결과를 기술하고, 국가R&D정보서비스 적용을 위한 종합 및 시사점을 제안한다. 마지막 5장에서는 결론 및 한계점, 향후 연구 방향을 정리한다.


Ⅱ. 관련 연구
2.1 챗GPT 특징 및 동향

챗GPT는 생성 인공지능(Generative AI)으로 대표되는 ‘GPT(Generative Pretrained Transformer)-3.5’를 기반으로 개발된 대화형 인공지능 모델이다. 이는 알고리즘을 통해 학습시킨 대규모 데이터 세트에 근거하여 사용자의 질문에 적합한 새롭고 독창적인 콘텐츠를 생성한다. 인간과 유사한 수준으로 대화의 전체 맥락을 이해하므로 연결된 질문이 가능하여 텍스트를 매개를 사용자와 상호작용 하는 분야에서 새로운 기회를 제공할 것으로 기대된다.

챗GPT는 키워드 중심의 기존 정보검색 서비스를 대체할 정도의 발전된 성능을 보유하고 있다. 이는 다양한 도메인에 활용되어 AI챗봇 및 정보서비스 시장에서 혁신적인 변화를 이끌 것이다[3]. 그러나 챗GPT는 정보검색 결과 높은 정확성과 일관성을 바탕으로 명확한 근거가 필요한 분야나 최신성이 요구되는 분야, 수치 데이터를 계산하는 분야에서는 아직 보완되어야 할 부분들도 있다[4].

국내·외 챗GPT 관련 기업 동향은 표 1과 같다. 미국에서는 Microsoft, Google 등이 활발한 투자와 기술개발을 진행 중이며, 국내에서는 한국어 챗GPT 서비스를 개발하여 헬스케어와 산업계(B2B)를 중심으로 상용화를 진행하고 있다.

Table 1. 
Trends of domestic and foreign corporation related to ChatGPT
Corp. Trend Country
MS MS announced plans to invest about $10 billion in OpenAI in 2023. In March, it launched a service with ChatGPT on the Bing search engine. USA
Google Google has secured LaMDA technology and is commercializing Bard. USA
Meta Meta announced Make-A-Video, a feature that generates a video based on a given phrase. USA
Baidu Launched in March, Ernie Bot will be released as a stand-alone application and then integrated with existing search engines. CHN
Naver The the Large Language Model (LLM) 'HyperClova', developed in May 2021, will be used in major services. KOR
KaKao KoGPT, a Korean-specific large language model, has been released. Kakao is developing LLM in the field of digital healthcare. KOR
SKT In May 2022, SKT launched the world's first Korean GPT-3 commercialization service “A.”. KOR
KT “Mi:dm” is expected to be unveiled and commercialized in 2023. It will focus on industry-specific AI assistant services. KOR

최근 챗GPT에 관한 연구논문을 Dimensions 데이터베이스를 통해 1,006건을 수집하여 체계적 문헌 검토(Systematic literature review)를 위해서 논문의 제목과 초록에서 추출한 단어들의 동시출현관계를 VOSviewer 프로그램을 사용하여 시각화한 결과는 그림 1과 같다. ‘교육’, ‘학생’, ‘기회’, ‘영향’, ‘헬스케어’, ‘환자’, ‘수술’, ‘증상’, ‘사례’, ‘작가’, ‘전환’, ‘자연어 처리’, ‘대규모 언어모델’, ‘성능’, ‘시험’, ‘평가’ 등의 키워드들이 다른 단어들과 밀접한 연관 관계를 맺고 있는 것으로 보인다. 전체 키워드 군집(Cluster)은 4개로 구분되었고, ① 교육적 활용 및 영향, ② 의료 영역에서의 응용 및 활용성 검증, ③ 챗GPT가 생성한 텍스트와 실제 출판된 문서 비교·분석, ④ 질의응답 성능 평가 및 검증 등에 관련된 주제들을 형성하고 있다[5]-[7]. 이외에 마케팅, 법률자문, 기후변화 예측 등의 분야에서 챗GPT 연구가 진행되고 있다.


Fig. 1. 
ChatGPT research keyword co-occurrence network

2.2 텍스트 마이닝 및 PEST 분석

텍스트 마이닝은 많은 양의 텍스트 집합에 사용되며, 유용한 키워드를 추출하여 맥락 수준의 의미를 찾아 결과를 도출한다[8] 특정 주제를 도출하기 위해 키워드의 빈도분석, 네트워크 분석, 감성분석, 주제분석 등이 사용된다. 워드클라우드(Wordcloud)는 직관적으로 텍스트 구조를 파악할 수 있어 단어의 시각화 도구로써 사용된다. 그러나 단어들의 빈도수만으로 전체 문서의 주제를 파악하기 어렵다는 단점이 있다. 이에 토픽모델링의 확률적 알고리즘 모델을 통해 문헌 전체 주제와 각 문서별 주제비율, 각 단어들이 주제에 포함될 확률을 추정해 잠재된 의미구조를 분석할 수 있다[9]. 최근에는 뉴스 데이터를 이용해 최신 기술·산업·정책 등 사회적 이슈를 분석하여 동향 분석 연구에 활용되고 있다[10].

PEST 분석은 1967년 하버드 대학의 Francis J. Aguilar 교수가 기업경영분석에 처음 사용한 거시적 외부환경 분석기법으로 기업이나 조직의 미래 종합발전계획 수립에 전략적 도구로 사용되고 있다[11]. PEST 분석은 정치·정책(P), 경제(E), 사회(S), 과학·기술(T) 측면에서 영향을 주는 요인들을 분석 및 평가해 객관화하는 기법이다[12]. 이외에도 환경적(Environmental) 요인을 더한 STEEP 분석이나 법적(Legal) 요인을 포함하는 PESTLE 분석이 거시환경 분석에 활용되고 있다.

즉, 기업과 조직의 성과에 영향을 주는 외부환경 요인을 파악하는데 효과적인 분석도구로써 기회 및 위험요인을 도출하여 선제적인 대응전략을 수립하는데 유용하게 사용되고 있다.

과학기술 분야에서는 국가 과학기술 경쟁력 강화 및 산업 활성화를 위한 발전전략과 투자 우선순위 선정 과정에서 PEST 분석이 적용된다. 외부환경의 다양한 변화 요인과 추세를 파악하고, 내부역량을 보완하는 발전전략과 추진과제를 제안하는 연구가 활발하다. 핵융합 국가연구개발사업의 사례분석을 중심으로 과학기술 전략 수립[13], 군사작전에 인공지능 기술 적용 전략 및 추진과제 제안[14], 국내외 자율주행차 테스트베드의 환경 분석을 통한 K-City 발전전략 수립[15], 가상현실(VR) 산업 생태계 조성 및 활성화 방안[16] 등의 연구가 있다. PEST 분석과 토픽모델링을 혼합하여 뉴스기사나 소셜미디어의 이슈를 도출한 연구도 있다. 즉, 모바일 간편 결제 서비스 기업의 활성화 전략 수립[17], 에너지 정책 설계를 위해 전기자동차에 관한 Facebook 게시글의 관심 주제를 PESTEL로 분석한 연구[18] 등이 있다. 그러나 아직까지 챗GPT를 주제로 PEST 기반 동향 분석을 수행한 연구는 찾아보기 어렵다.

2.3 국가R&D정보서비스의 챗GPT 도입 검토

국가R&D정보서비스(NTIS)는 2008년 3월말부터 서비스를 시작해 국가R&D사업 전주기 프로세스에 따른 과학기술 정보를 통합하여 제공하고 있다. 그 동안 축적된 국가R&D 과제, 성과, 인력 데이터를 활용하여 인공지능 기반 서비스 고도화를 추진 중이다. 즉, 부처별 R&D 현황, 연구자-연구기관 연계정보, 연구실적 및 성과활용, 기술수요 등 데이터를 분석하여 이용자 맞춤 정보를 제공하고, 국가R&D사업 성과관리 및 활용 체계화, 국가R&D 현안별 기술·산업 동향 분석, 연구지식 공유 등을 지원하고 있다. 표 2는 국가R&D정보서비스에서 챗GPT 기술 적용이 필요한 분야를 검토한 결과이다.

Table 2. 
Review of improving national R&D information services related to ChatGPT
Function Service name
① Generation · Chatbot (ND)
② Retrieval &summarization · Integrated search
· R&D information summarization
· Outstanding R&D results
· Policy and technology trends
· National R&D laws & guidelines
③ Translation · Global R&D information search
④ Analysis · View R&D by issues
· R&D created by users
↓↓↓↓
Improvements
① · Speech recognition Q&A
    · Research proposal generation
    · Technology trend report generation
② · Speech recognition information retrieval
    · Sentence-level information retrieval
    · Comparison and analysis of search information
③ · Automatic translation
④ · Automated program coding support

국가R&D정보서비스 이용자들의 의견에 따르면, 챗봇(엔디), 통합검색 문장검색, 해외R&D정보 번역, 국가R&D정보 요약, 생성, 데이터 분석 코딩 등의 서비스 개선이 필요한 것으로 조사되었다[19]. 구체적으로 이용자들이 R&D정보에 쉽게 접근해 실시간 질의응답(Q&A)과 음성인식이 가능한 챗봇, 키워드 검색의 정보추출 방식에서 문장 단위 또는 대화형 통합검색 인터페이스, 장문의 연구과제 내용을 요약하여 비교·분석 및 결과 시각화, 특정 주제의 연구계획서 및 기술동향 문서 생성, 해외R&D 정보검색 및 자동번역, 데이터 분석이 용이한 자동 코딩 프로그램 등이 추가된 서비스 개선이 필요하다. 따라서 기존 국가R&D정보서비스에서 챗GPT 관련 기술을 도입하기 이전에 뉴스기사를 활용하여 챗GPT 등장으로 인한 거시적 환경변화와 공공여론의 담론 및 관심분야를 파악하고자 한다.


Ⅲ. 연구 방법
3.1 데이터 수집 및 정제

본 연구는 챗GPT 등장으로 인한 거시환경 변화를 분석하기 위해 주목받는 주제를 대상으로 이해관계자들의 의견을 종합하여 전달하는 뉴스기사를 활용하였다. 뉴스기사는 한국언론진흥재단의 ‘빅카인즈(BIGKinds)’ 뉴스 빅데이터 분석서비스를 통해 총 54개의 국내 언론매체에서 보도한 챗GPT 관련 기사를 수집하였다[20]. 챗GPT 출시일 2022년 11월 30일부터 2023년 5월 31일까지 제목 또는 본문에서 한글·영문 표기 ‘챗GPT/ChatGPT’ 키워드로 포함한 총 11,284건이 검색되었다.

PEST 분야별 뉴스를 추출하기 위해 빅카인즈의 통합분류코드를 이용하여 국제·문화·스포츠·미분류 기사, 중복기사, 인사·부고·동정 등 분석대상에 부합하지 않은 뉴스 2,122건을 모두 제외하였다. 이를 통해 최종적으로 총 9,162건의 뉴스 분석 데이터가 수집되었다. PEST 분야에 따라 정치 273건, 경제 2,666건, 사회(지역 포함) 1,150건, 과학·기술 5,073건으로 수집되었으며, 언론사 성격에 따라 종합지 4,620건과 경제지 4,542건으로 구분되었다.

수집된 데이터는 유의미한 결과를 도출하기 위해 빅카인즈에서 형태소 분석을 통해 뉴스 본문에서 추출된 명사를 대상으로 전처리 작업을 수행하였다. 먼저, 특수문자, 단순숫자, 한자어, 의미 없는 단어, 검색어인 ‘챗GPT/ChatGPT’ 등을 제거하였다. 다음으로 동의어 및 유의어를 통일하고, 중복된 단어를 통합했으며, 챗GPT와 무관한 단어는 삭제하였다.

3.2 분석 방법

본 연구의 절차는 그림 2와 같다. 국내 챗GPT 관련 뉴스기사의 주요 키워드와 이슈를 도출하기 위해 PEST 분석과 텍스트 마이닝 기법을 결합한 방법론을 적용하였다. 우선, 정치, 경제, 사회, 과학기술에 해당하는 뉴스기사를 분류하여 앞서 정제한 키워드를 대상으로 빈도를 분석하였다. 빈도 분석은 자주 사용된 단어의 출현한 빈도(Term Frequency)를 통해 PEST 분야별 기사에 출현하는 공통 키워드와 특별한 의미를 갖는 키워드를 비교하였다. 그리고 워드클라우드를 이용하여 어떤 단어가 가장 많이 등장했는지 시각적으로 표현하였다.


Fig. 2. 
Overall research process

텍스트 데이터의 주제 도출에 유용한 토픽모델링 기법 중 하나인 LDA 모델을 활용하여 분야별 뉴스 이슈 토픽을 도출하고, 챗GPT 기술을 적용하는데 고려해야 하는 외부환경 분석을 실시하였다. 데이터 분석에는 텍스트 분석이 가능한 오픈소스 프로그램 R을 활용하였다. 먼저, PEST 분야별 최적의 토픽 수(k)는 FindTopicsNumber 함수로 도출된 토픽 수의 범위를 변경하면서 실험을 반복하여 LDAvis 시각화 도구를 이용해 토픽 군집을 확인하였다.

토픽 수는 서로 중복되지 않는 군집을 형성하고, 토픽의 해석 가능성을 고려해 적절한 수치를 설정하였다. 그리고 PEST 분야별 뉴스기사를 구성하는 단어의 출현 확률과 각 뉴스기사에 토픽이 포함될 확률분포에 따른 군집화를 통해 이슈 토픽을 도출하였다. 토픽의 명칭은 각 토픽에 분류된 키워드와 뉴스기사 원문을 비교하여 어떠한 맥락에서 단어가 사용된 것인지 유추해 부여하였다.

또한, 토픽의 비중과 트렌드를 파악하여 사회적 변화 양상과 과학기술적 측면에서 영향력에 대하여 분석하였다. PEST 분야별 이슈 토픽과 앞서 챗GPT 기술 도입의 필요성이 제기된 국가R&D정보서비스개선사항을 종합하여 향후 챗GPT 기술을 적용하는 과정에서 고려할 시사점과 전략방향을 제안하였다.


Ⅳ. 연구 결과
4.1 뉴스 데이터 수집 결과

챗GPT 뉴스기사의 주별 빈도수를 집계한 결과는 그림 3과 같다. 2022년 12월 8일 처음 언론보도를 시작으로 2023년 1월 4주부터 급증해 2월 2주에는0 가장 많은 660건이 보도된 것으로 확인된다. 챗GPT 사용자가 전체 100만명이 된 시점과 월간 사용자수 1억명 이상을 달성한 이후 보도수가 증가한 것으로 나타난다. 그리고 챗GPT 기능을 탑재한 검색서비스 개시 시점과 신규 버전이 출시됐을 때 언론보도가 집중된 것을 알 수 있다. 5월의 기사 수는 2,086건(22.8%)으로 2월 2,335건(25.5%)에 비해 감소했으나 챗GPT에 관한 언론보도는 지속되고 있는 추세이다.


Fig. 3. 
ChatGPT news article coverage by week

4.2 뉴스 키워드 빈도 분석

챗GPT 관련 전체 뉴스에서 추출된 상위 100개의 단어들을 그림 4에서 워드클라우드로 시각화하였다. 뉴스에서 인공지능(8,488), 기업(5,678), 활용(5,149), 글로벌(4,855), 서비스(4,836), 생성(4,112), 미국(3,767), 정보(3,670), 시장(3,681), 데이터(3,595), 사람(3,281), 오픈AI(3,268), 설명(3,122), 투자(3,090), 대화(3,073), 챗봇(2,953), 공개(2,794), 산업(2,710), 출시(2,699), 학습(2,652) 등 상위 20개의 키워드가 공통적으로 등장한 것으로 확인된다. 이러한 키워드는 PEST 분야별 키워드 빈도 분석에도 상위권에 등장하며, 챗GPT 서비스의 공개 출시, 생성형 인공지능, 학습 데이터, 챗봇 서비스 활용, 수혜업종과 산업 분야, 증시의 투자 동향 등에 관련된 뉴스기사들이 주로 다뤄졌음을 알 수 있다.


Fig. 4. 
ChatGPT news keywords (top 100)

PEST 분야의 챗GPT 뉴스 키워드 빈도 분석의 결과(공통 상위 20위 제외)는 표 3과 같다.

Table 3. 
ChatGPT news keyword frequency by PEST field
Rank Political Economic Social Technological
1 parliament semiconductor education model
2 response growth student Google
3 support demand support search
4 assessment expansion school application
5 strengthening increase change Microsoft
6 expert stock price policy question
7 change rise field use
8 innovation support program platform
9 question product assessment user
10 meeting assessment innovation answer
11 interest Microsoft question support
12 science revenue interest expert
13 opinion Samsung expert competition
14 criticism model application language
15 strategy NVIDIA class image
16 election competition strengthening work
17 statement strategy case contents
18 communication Google capability assessment
19 work interest talent innovation
20 collaboration impact opportunity start-up
*Excluding common top 20 keywords from all news

정치·정책 분야는 챗GPT로 인한 변화와 혁신에 대한 국회의 대응, 지원, 평가 등에 관한 키워드를 통해 제도 개선을 위한 회의가 진행된 것으로 유추할 수 있다. 또한, 선거와 정치활동 과정에서 비판 및 소통의 도구로써 챗GPT를 활용한 것으로 파악된다. 경제 분야는 챗GPT 모델 개발과 적용을 위해 필요한 반도체 수요 확대와 시장 성장을 나타내는 키워드 빈도가 높다. 반도체 산업에서 글로벌 기업들의 전략적 우위 선점을 위한 경쟁 심화와 관련된 뉴스가 다수 보도된 것으로 확인된다. 사회 분야는 챗GPT 활용에 따른 교육 환경의 변화와 학교 현장 프로그램 혁신에 관한 키워드가 주를 이룬다. 즉, 교사와 학생이 수업에서 챗GPT를 적용한 사례가 증가해 혁심 능력 강화의 기회를 제공하는 보도를 포함한 것으로 파악된다. 과학기술 분야는 챗GPT 기술개발과 적용분야에 관한 키워드가 두드러진다. 또한, 기업들이 챗GPT를 활용한 언어모델, AI챗봇, 서비스 플랫폼 등을 개발 현황과 사용자들이 검색·이미지·콘텐츠 제작 등 업무에서 챗GPT를 사용하여 맞춤 정보를 얻는 접근성 및 활용성의 보도내용을 유추할 수 있다.

4.3 뉴스 이슈 토픽 분석

챗GPT 관련 뉴스의 정치·정책, 경제, 사회, 과학기술 4개 분야의 토픽모델링 결과는 표 4 ~ 표 7과 같다. PEST 분야의 전체 뉴스 비중과 토픽의 수는 정치·정책(P)은 273건(3%)에서 4개 토픽, 경제(E)는 2,666건(29%)에서 5개 토픽, 사회(S)는 1,150건(13%)에서 5개 토픽, 과학기술(T)은 5,073건(55%)에서 6개 토픽이 추출되었다. 챗GPT는 서비스 특성상 경제와 과학기술 관련 뉴스기사가 높은 비중을 차지하며, 최적의 토픽 수가 분야별로 다르게 도출되었다.

4.3.1 정치·정책(P) 분야

정치·정책 분야에서 도출된 결과를 표 4와 같이 제시하고, 뉴스내용을 기반으로 주요 키워드를 포괄하는 토픽의 명칭을 설정하였다. 챗GPT에 대한 ① 업무 활용 및 규제 법안 발의, ② 디지털 혁신 역량 강화를 위한 정책, ③ 정당과 정치인들의 선거활동 수단, ④ 글로벌 외교·안보에 대한 질의응답 등 4개 세부주제가 식별되었다.

Table 4. 
Results of ChatGPT political news topic analysis
Political (273 cases, 3%)
Topic Topic name / keyword C(%)
T1 Business use and Proposals for laws and regulations 108
(39%)
information, utilization, conversation, question, work, generation, regulation, chatbot, impact, bill
T2 Policies for digital innovation strength 62
(23%)
parliament, company, digital, innovation, field, education, competency, system, market, reform
T3 Political party and politician campaign tools 66
(24%)
election, criticism, party congress, political party, communication, service, utilization, competition, youth, promise
T4 Q&A on global diplomacy and security 39
(14%)
diplomacy, global, collaboration, threat, security, war, missile, solution, response, peace

주요 뉴스 내용을 살펴보면, 첫째, 공공행정 영역에서 챗GPT 사용을 장려하며 업무혁신을 촉진하고 있다. 즉, 연설문·보도자료·법안 초안 작성, 정부 및 지방자치단체의 신규 정책 발굴, 여론 동향 파악 등 의정활동에 활발히 활용된다. 반면에, 국내외에서 챗GPT의 거짓 정보 생성, 편향된 정보 전달, 개인정보 유출 등 잠재적인 피해 완화를 위해 규제의 필요성이 논의되고 있다. 국회에서는 인공지능 개발과 이용에 관한 기본원칙을 포함한 ‘인공지능책임법안’이 발의되었고, ‘인공지능 기업 지원법(인공지능산업 육성 및 신뢰 기반 조성 등에 관한 법률안)’ 제정이 추진이 중요하게 다루어지고 있다.

둘째, 정부는 디지털 일상화를 추진하기 위한 ‘신성장 4.0전략’을 수립하고 한국형 챗GPT 개발을 촉진하는 제도적 기반 및 지원체계를 발표하였다. 다양한 저작물을 학습 데이터로 이용할 수 있도록 저작권법의 개정, 중소기업·대학의 초거대AI 모델 활용 지원, 6G 조기 상용화를 위한 R&D 세부과제 추진계획이 포함한 것으로 확인된다.

셋째, 정당대회라는 정치적인 이벤트를 중심으로 선거활동에서는 챗GPT의 답변을 인용하거나 경제·산업·청년 정책 등 다양한 주제의 선거공약을 발굴하는 수단으로 활용하였다. 또한, 챗GPT를 도입해 대국민 소통 서비스를 민원 창구로 활용하겠다는 공약도 제시되었다. 마지막으로 토픽 4에서는 정상회담을 통해 챗GPT 관련 국제 규범과 정보 유통의 틀을 만들 것을 국제적으로 논의되었다. 핵·미사일 위협에 관한 국방·안보 현안 문제에 대한 국방부 의견과 챗GPT의 답변을 비교하고, 인공지능을 활용하는 국방혁신 추진계획을 추진하고 있다.

4.3.2 경제(E) 분야

경제 분야는 표 5와 같이 챗GPT를 활용하는 ① 디지털 혁신 산업 경쟁력 강화 정책, ② 고객 서비스 플랫폼에 적용, ③ 글로벌 기업의 생성AI 개발 투자 확대, ④ 반도체 산업의 성장, ⑤ 수혜기업 및 증시 동향에 관한 5개 세부주제가 식별되었다.

Table 5. 
Results of ChatGPT economic news topic analysis
Economic (2,666 cases, 29%)
Topic Topic name / keyword C(%)
T1 Policy for digital transformation strengthening and industrial competitiveness 374
(14%)
industry, support, utilization, company, strategy, innovation, policy, digital, competition, development
T2 Application in customer service platforms 547
(21%)
service, company, market, platform, generation, data, solution, customer, model, application
T3 Global companies' investment in general AI development 474
(18%)
company, person, OpenAI, generation, investment, Google, Microsoft, information, start-up, utilization
T4 Growth of the semiconductor industry 602
(23%)
semiconductor, demand, company, market, memory, Samsung Electronics, product, data, SKhynix, GPU
T5 Benefiting companies andstock market trends 669
(25%)
stock price, investment, company, stock market, semiconductor, revenue, growth, finance, expectation, impact

첫째, 챗GPT와 같은 인공지능 산업은 정부 정책이나 규제에 영향을 많이 받기 때문에 정치·정책 분야 토픽과 유사한 디지털 혁신 기술·산업 경쟁력 강화 지원에 관한 토픽이 도출되었다. 즉, 인공지능 생태계 기반 조성과 제도적 정비의 필요성에 관한 내용이 포함되었다. 챗GPT 활용을 위한 저작권법 개정, 인공지능 기업 지원법 제정, 신(新)성장 프로젝트 로드맵 등을 수립하여 추진하고자 하였다.

둘째, 기업은 경영지원, 사내소통, 고객응대, 연구개발(R&D), 마케팅 등 업무의 효율성을 제고하기 위해 챗GPT 기술을 적용하고 있다. 특히, 챗GPT는 비대면 고객의 맞춤 상담·응대·관리 서비스 고도화 측면에서 기존 AI 챗봇, AI 비서, 업무시스템 등에 접목하여 활용되고 있다. 챗GPT는 다양한 데이터를 학습하여 솔루션을 제공 가능하므로 전(全) 산업의 게임 체인저(Game changer)로서 급부상하면서 기업들은 고품질의 학습 데이터를 구축하는 것을 중요하게 여기고 있다.

셋째, 빅데이터와 AI 알고리즘을 보유한 글로벌 기업 및 스타트업들은 챗GPT에 대항하는 거대언어모델 개발을 위해 생성AI 시장에 투자를 확대하고 있다.

이는 챗GPT와 같은 사전 학습된 기반 모델을 특정 작업에 맞춘 미세조정을 통해 신규 AI 애플리케이션과 서비스로 응용 가능성이 높기 때문이다.

마지막으로 비중이 높은 토픽 4와 토픽 5를 통해 반도체 산업의 성장세에 주목할 만하다. 대용량의 학습 데이터를 빠르게 처리하는데 필요한 핵심기술로써 AI반도체는 고성능 그래픽처리장치(GPU) 보다 효율성이 높아 수요가 증가하는 추세이다. 챗GPT로 인한 최대수혜 업종인 AI반도체는 증시에도 많은 영향을 주고 있으며, 향후 시장 규모는 2026년까지 약 861억 달러까지 성장할 것으로 전망된다. 또한, 기존 반도체 기업뿐만 아니라 글로벌 빅테크 기업들도 AI반도체 개발 및 투자에 적극 참여하고 있어 기술경쟁이 심화될 것으로 예상된다.

4.3.3 사회(S) 분야

사회 분야는 표 6과 같이 챗GPT를 활용하여 ① 의학 전문지식 질의응답 및 시험평가, ② 교육 분야 활용의 긍정·부정 영향, ③ 교육·행정·업무 서비스의 디지털 기술 활용, ④ 인구·산업의 변화 및 위기 ⑤ 문화 분야와 노동 시장의 변화 등 5개 세부주제가 식별되었다.

Table 6. 
Results of ChatGPT social news topic analysis
Social (1,150 cases, 13%)
Topic Topic name / keyword C(%)
T1 Medical expertise Q&A and assessment 171
(15%)
person, question, answer, conversation, OpenAI, chatbot, information, doctor, exam, writing
T2 Positive and negative impacts of utilization in education 395
(34%)
education, student, utilization, school, learning, class, teacher, field, understanding, change
T3 Utilization of digital administrative services 314
(27%)
utilization, support, education, service, industry, work, information, digital, administration, strengthening
T4 Demographic crises and industrial changes 161
(14%)
policy, population, industry, environment, guide, system, change, innovation, crisis, competition
T5 Changes in the cultural sector and labor market 109
(9%)
opportunity, global, culture, utilization, jobs, company, market, explanation, industry, change

첫째, 토픽 1은 의학, 법률, 경영 분야 등 전문직 시험평가에 통과하는 뛰어난 성능을 보인 챗GPT에 관한 내용을 포함한다. 특히, 의료 현장에선 챗GPT의 실제 활용성을 검증하기 위해 의학 전문지식의 응답 성능 평가가 진행되고 있다. 챗GPT를 적용한 헬스케어 서비스 플랫폼을 통해 비대면 의료상담과 증상에 대한 진료 및 치료 정보를 제공할 수 있다. 챗GPT 답변의 정보의 질과 공감도도 의사에 버금가는 수준으로 진단과 처방의 의료행위를 보조하는 수단으로 높은 효율성과 보편적 의료서비스 접근성 향상에 도움이 되는 것을 알 수 있다.

둘째, 토픽 2는 챗GPT가 교육 현장에서 교수학습활동의 보조수단으로 활용되어 에듀테크 분야로 확대되는 측면을 포함한다. 학습자료 조사 및 작성, 어학학습, 코딩 생성 및 오류 찾기 등에 주로 활용되고 있다. 반면, 과제 표절, 논문 대필, 시험 부정행위 등 악용하는 사례도 늘고 있다. 이에 대학들은 챗GPT 활용 가이드라인과 윤리강령을 만들어 학생들이 챗GPT를 올바르게 사용하도록 하는 노력이 중요하고, AI기술 발전에 맞춰 교육체계를 어떻게 변화시킬지에 대해 중요하게 다루어지고 있다.

셋째. 지역과 사회문제 해결을 위한 디지털 행정서비스 업무에 챗GPT를 도입하여 주민 편의성과 행정 효율성 향상에 관한 토픽이 도출되었다. 지역사회의 소외계층, 장애인, 외국인, 민원인 등을 대상으로 하는 챗GPT 대민 공공서비스의 개선이 주요 내용으로 확인된다. 즉, 민원상담 콜센터, 행정정보 외국어 지원, 정책 자료조사, 연구용역 보고서 요약 등을 통해 지역별로 스마트 행정을 추진하는 것에 관심이 많은 것을 유추할 수 있다.

넷째, 챗GPT가 답변한 인구·산업 변화와 위기의 사회구조적 문제해결에 대한 내용이 이슈가 되었다. 챗GPT를 통해서 저출산, 고령화, 노동개혁 등 사회문제 해결방안의 아이디어를 찾는 경우가 늘어나고 있다. 특히, 저출산의 원인을 장시간 노동, 보육시설 부족, 양육비 증가 등으로 지적하고, 유급 육아휴직 제도, 유연한 근무방식, 저렴한 고품질 보육 서비스 등의 가족 지원 정책들을 해결책으로 제시하였다.

마지막으로 챗GPT의 등장과 함께 문화예술 활동 일자리에 대한 가치가 재평가되고 있다. 창의성과 상상력이 필요한 예술가, 작가, 음악가, 디자이너와 같은 직업군은 챗GPT를 창작의 도구로 활용할 수 있는 기회와 동시에 또 다른 창작활동의 경쟁자가 생기는 위기에 관한 의견이 분분하다. 또한, 챗GPT 활용으로 자동화가 쉬운 사무행정, 경리업무, 현금출납 등 일자리는 감소하고, 데이터 분석, 기계학습, 사이버 보안 등 직종은 수요가 증가해 노동시장의 변화를 가져올 것으로 예측된다. 서로 다른 직무와 융합되는 형태로 업무가 변화되고, ‘프롬프트 엔지니어링’과 같은 신규 직종이 창출될 것으로 보았다.

4.3.4 과학·기술(T) 분야

과학기술 분야는 표 7과 같이 ① 디지털 혁신을 위한 정책, ② 글로벌 기업의 AI챗봇 서비스 경쟁, ③ 정보보안 및 데이터 보호 규제, ④ 자연어 이해 능력 향상, ⑤ 플랫폼 기업의 서비스 도입, ⑥ 챗GPT의 산업적 영향 등 6개의 세부주제가 식별되었다. 전반적으로 과학기술 분야는 정치·정책 및 경제 분야와 중복된 토픽이 도출되었다. 즉, 챗GPT 활용 지원과 규제 정책, 플랫폼 기업들의 챗GPT 서비스 경쟁, 산업 환경의 변화와 긍정적 효과 및 부정적 영향 등의 주제들이 유사한 것으로 파악할 수 있다.

Table 7. 
Results of ChatGPT science & technical news topic analysis
Technological (5,073 cases, 55%)
Topic Topic name / keyword C(%)
T1 Policy for digital transformation 752
(15%)
utilization, industry, digital, support, expert, service, company, innovation, policy, Ministry of Science & ICT
T2 Competition of AI chatbot services 1,125
(22%)
Google, Microsoft, OpenAI, search, chatbot, generation, petition, Bard, investment
T3 Information security and data protection regulations 648
(13%)
information, regulation, generation, OpenAI, data, risk, protection, restriction, leakage, security
T4 Improving natural language understanding 905
(18%)
person, capability, learning, question, data, information, conversation, understanding, generation, alternative
T5 Adoption of ChatGPT services by platform companies 1,024
(20%)
service, company, generation, data, application, learning, model, platform, chatbot, user
T6 Industry impact of ChatGPT 619
(12%)
market, investment, service, platform, data, cloud, digital, semiconductor, infrastructure, metaverse

첫째, 토픽 1과 토픽 3에서는 챗GPT의 활용 및 규제에 관한 과학기술 정책 대응 방안을 공통으로 포함하고 있다. 정부·지자체·공공기관의 업무혁신, 인공지능 기업의 디지털 전환 지원, AI 응용산업 진흥을 위한 법·제도 개선안과 지원 정책에 관한 이슈가 두드러진다. 정보유출, 스팸 메일, 가짜뉴스 등 악성 콘텐츠가 생산되는 부정적인 위협요소를 줄이고자 챗GPT 사용 제한 및 규제에 대한 부분이 논의되고 있다. 토픽 3은 모델 학습 데이터의 한계, 정보의 편향성, 비윤리적인 문제 등 부정적 영향에 대한 선제적 대응에 관한 토픽이 추출되었다. 기업들은 악성코드 생성, 프로그래밍 언어 변환 등 정보보안을 우려하여 자체 생성형 AI 기술개발을 추진하고, 사이버 보안체계 강화에 집중하고 있다.

둘째, 토픽 2와 토픽 5는 많은 비중을 차지하며, 경제 분야 토픽과 유사하게 글로벌 IT 기업들의 AI 모델 자체 개발과 신규 챗봇 서비스 개발 경쟁에 관한 내용이 핵심이다. 마이크로소프트(MS)와 오픈AI는 검색엔진 빙(Bing)과 챗GPT를 서로 탑재하여 정보 생성과 실시간 최신 정보 검색 서비스를 제공한다. 구글은 이미지로 답변을 생성하고, 한국어를 지원하는 AI 챗봇 ‘바드(Bard)’를 공개하여 챗GPT와 더불어 생성AI 실용화 주도권을 선점하였다. 국내 네이버, 카카오 등 기업들은 의료·법 전문분야 특화 AI 모델 개발을 통해 경쟁력 강화에 노력하고 있다. 토픽 5는 챗GPT를 적용한 비즈니스 모델 개발이 확대되면서 신규 서비스 사례들이 이슈로 떠올랐다. 교육, 의료, 금융, 법률 등 분야와 챗GPT를 연계한 새로운 비즈니스 모델을 개발하고 있다. 또한, 실제 비즈니스 환경에 챗GPT의 도입을 위해 데이터의 정확도와 보안성 향상에도 집중하고 있다.

셋째, 챗GPT의 자연어 이해와 추론 능력 향상에 따른 인간 영역의 대체 가능성에 대한 기대와 우려를 언급한 보도내용을 포함한다. 이는 번역, 법률, 창작 등 업무 자동화와 노동시장의 변화, 감정인식 능력 향상과 사용자 경험 개선, 인간과 공존 가능한 방법으로 대체재가 아닌 보완재의 역할, 독창적인 추론 능력과 이에 대한 비판적인 시각 등 챗GPT 기술이 미치는 사회적인 논의들로 구성된다.

마지막으로 챗GPT가 영향을 줄 것으로 예상되는 콘텐츠와 IT 산업 동향에 관한 토픽이 도출되었다. 메타버스와 같은 공간적 특성에 대화형 인터페이스를 적용해 현장감 있는 맞춤형 가상경험을 제공해 서비스 향상이 가능할 것이다. 특히, 메타버스 가상세계에 필요한 콘텐츠 아이디어를 빠르게 제시하여 이용자의 니즈(Needs)에 맞춘 가상공간 디자인 개발 등을 지원할 수 있다. 그리고 경제 분야에서 도출된 ‘AI반도체 수요 및 투자 증가’ 토픽과 같이 강력한 컴퓨팅 파워가 요구됨에 따라 데이터 처리 및 연산 처리 능력을 갖춘 AI반도체 산업의 성장과 더불어 연산 및 추론과정에서 고성능 시스템을 운용하는데 필요한 그래픽처리장치(GPU)의 수요에 대응할 수 있는 제품 개발 및 전략의 필요성이 제기된다.

4.4 종합 결과 및 시사점

앞선 챗GPT를 둘러싼 뉴스기사에 나타난 PEST 분야별 공통 및 차별화된 토픽들과 적용 시사점의 연계성은 그림 5에서 보여준다. 거시적 환경 변화에 맞춰 국가R&D정보서비스를 고도화를 위한 챗GPT 기술 적용방향을 종합하여 정리하면 다음과 같다.


Fig. 5. 
ChatGPT news issue topics and application insights

첫째, 정치·정책(P) 측면에서는 무분별한 챗GPT 사용으로 인해 발생될 수 있는 저작권 침해, 개인·민감·보안 정보 유출 문제와 답변의 신뢰성·윤리성·혐오성 등 윤리적 문제들을 이해시키고, 주의사항을 공지해야 한다. 공공서비스 영역에서 제한하는 ‘비공개 정보’와 ‘개인정보’를 포함한 질문을 입력하지 않도록 안내하고, 국가R&D정보서비스를 이용하는 목적에 맞게 맞춤형 챗봇 질문 가이드라인 수립이 필요하다. 그리고 챗GPT에서 생산된 정보를 근거 자료로 활용하기 위해서 출처 표기를 의무화하고, 정보의 사실여부 확인 및 내용검증의 과정을 거치도록 하는 제도적인 뒷받침이 필요하다.

둘째, 경제적(E) 측면에서는 외부에 공개된 거대언어모델(LLM)의 응용프로그램 인터페이스(API)를 국가R&D정보서비스에 접목하여 자체 기술 개발의 시간을 단축하고, 비용절감 효과를 달성해야 한다. 그리고 국가R&D정보서비스의 공공성을 기반으로 데이터, 인공지능, 고성능컴퓨팅, 초고속망 등 인프라를 활용하여 조직 내부 디지털 전환 역량을 증진시키고, 업무의 효율성을 높여야 한다. 또한, 챗GPT 서비스 운영비용 절감과 생산성 향상 방안을 모색하여 업무의 효율성 향상과 서비스 혁신으로 이어지는 긍정적 효과를 이끌어내야 한다.

챗GPT를 도입하기 위해 기관 내부자원인 고성능컴퓨팅과 초고속망을 사용하거나 과학기술 분야에 특화된 거대언어모델의 경량화를 통해 최소비용으로 챗GPT 기술을 도입하고 유지할 방안을 찾아야 한다. 조직 내에 NABC(Needs-Approach-Benefit-Competition) 프로젝트 관리기법을 적용하여 사회적 변화와 이용자들의 니즈(Needs)를 파악하여 학습 데이터를 수집 및 관리하는 효율적인 운영방안을 마련해야 한다.

셋째, 사회적(S) 측면에서는 범용 AI 모델이 공개되고 일반 사용자도 쉽게 사용할 수 있는 환경으로 인해 챗GPT 기술 대한 관심이 증대되고 있다. 이에 국가R&D정보서비스는 대국민 과학기술 정보서비스로서 이용자별 맞춤형 자료를 데이터에 근거하여 신뢰성 있는 자료를 생성·공유하는 건전한 플랫폼 문화를 정착시켜야 한다. 또한, 국가R&D정보서비스 이용자들이 챗GPT 기능이 접목된 챗봇을 사용하여 양질의 과학기술 정보를 생산 및 유통할 수 있도록 활용 교육을 실시해야 한다. 특히, 축적된 국가R&D데이터를 기반으로 답변을 생성하기 때문에 정보의 출처가 명확하고 확인 가능하므로 이용자가 생성된 정보의 정확성과 신뢰성을 직접 평가하고 활용할 수 있도록 자료 검증 과정도 체계화할 필요가 있다.

마지막으로 과학·기술 측면에서는 과학기술 관련 정책과 국가R&D 내용을 이해하고 처리할 수 있는 특화된 인공지능 대화형 언어모델 개발이 필요하다. 즉, 국가R&D사업 논문, 특허, 보고서 등의 성과정보 텍스트를 요약하는 인공지능 모델을 기반으로 국가R&D정보서비스의 챗봇 기능을 개선하여 과학기술 전문지식을 실시간 대화형 서비스로 전환해야 한다. 나아가 고도화된 생성AI 기술과 초거대 언어모델을 대체할 수 있는 경량화 언어학습 모델을 개발하여 정보서비스에 적용해야 한다. 또한, 국가R&D정보서비스에 챗GPT 기술을 도입했을 때, 발생할 수 있는 정보보안 및 프라이버시 문제를 최소화하기 위해 AI보안 기술 경쟁력을 높여야 한다. 챗봇이 제공하는 데이터의 정확도와 보안성을 높이기 위해 국가R&D 데이터를 먼저 검색하고 결과물을 생성하는 검색증강생성(Retrieval-augmented generation) 기술[21]과 파인튜닝 기법을 적용한 언어모델 개발을 고려해 볼 수 있다. 나아가 챗GPT 기술이 접목된 챗봇 서비스를 실시간 제공하기 위해 모바일 연동 시스템 구축이 필요하며, 챗GPT와 음성인식 기능이 탑재된 AI챗봇 개발, 메타버스 같은 가상공간에서 디지털 휴먼 또는 아바타를 통해 정보검색·요약·분석 등을 경험할 수 있는 서비스 기획 등으로 확대할 수 있을 것이다.


Ⅴ. 결론 및 향후 과제

본 연구는 국가R&D정보서비스 고도화를 위한 사전 탐색을 위해 챗GPT 온라인 뉴스기사를 PEST 분석-텍스트 마이닝을 결합한 방법론을 활용하여 거시적 관점에서 주요 키워드와 이슈 토픽을 분석하였다. 분석 결과를 요약하면 다음과 같다. 챗GPT 뉴스기사는 2023년 2월부터 꾸준히 보도된 것으로 확인되었다. 키워드 빈도 분석 결과, ‘생성형 AI’, ‘활용’, ‘서비스’, ‘정보’, ‘시장’, ‘데이터’ 등 단어가 등장했으며, 생성형 AI 기술개발, AI 챗봇 서비스에 활용, 고품질 학습 데이터 수집, 산업 동향 및 투자 방향 등에 관한 보도가 증가한 것을 알 수 있었다.

각 PEST 분야별 키워드 빈도 분석과 토픽모델링 결과를 종합해 보면, 정치·정책 분야는 행정 효율성 증진을 위한 챗GPT 업무 활용 지원책과 인공지능 규제 법·제도 논의, 선거활동과 외교·안보에 관한 의견을 수집하는데 챗GPT 답변을 근거자료로 활용하였다. 경제 분야는 산업계의 디지털 혁신 경쟁력 강화 정책 수립, 빅테크 기업들의 생성형 AI 기술개발과 신규 서비스 플랫폼 개발 경쟁 심화, 챗GPT 데이터 학습과 운용의 핵심요소인 AI반도체 수요 증가에 따른 산업 성장 및 투자 확대 등의 이슈가 두드러졌다. 사회 분야는 의학, 법률 등 전문지식 질의응답 성능이 입증되어 서비스 적용, 교육·행정·업무 서비스에서 활용과 교수학습 활동의 보조수단으로 긍정적 효과와 부정적 영향 측면의 양면성에 대한 주제가 이슈로 떠올랐다. 과학기술 분야에서는 앞선 분야들의 주제들을 아우르는 유사한 토픽들이 도출되었다. 챗GPT의 활용뿐만 아니라 정보보호 및 데이터 보호 규제 필요, 챗GPT의 텍스트, 이미지, 음성 등 고도화된 기능이 적용된 플랫폼 서비스와 독자적인 거대언어모델 개발 및 투자 집중, 반도체·메타버스와 같은 산업적 영향 및 파급효과 등 거시환경 변화에 따른 다양한 이슈들이 도출되었다.

본 연구의 의의는 다음과 같다. 첫째, 온라인 뉴스기사를 이용하여 토픽모델링을 통해 챗GPT 이슈에 대해 정치·경제·사회·과학기술 등 거시적 관점에서 정량적·정성적 분석을 통해 세부주제를 탐색하였다. 둘째, 챗GPT 뉴스 이슈 분석 결과를 바탕으로 PEST 분야별 시사점을 제안하여 향후 국가R&D정보서비스의 대화형 챗봇(엔디)에 탑재할 수 있는 과학기술 특화 챗GPT 개발에 필요한 아이디어와 추진방향 설정에 유용한 기초정보가 될 것으로 판단된다.

본 연구의 한계점과 향후 연구의 방향은 다음과 같다. 첫째, 온라인 뉴스기사를 이용하여 챗GPT와 관련된 거시환경 변화를 분석하여 각계각층의 모든 구성원의 의견을 포함하지는 않는다는 점이다. 보다 구체적으로 PEST 분야별 챗GPT 이슈 분석을 위해 전문가 인터뷰, 이용자 설문조사, 소셜(SNS) 데이터 분석 등을 진행하여 종합적인 시사점 도출이 필요하다. 둘째, 국가R&D정보서비스의 고도화를 위한 챗GPT 도입을 위해 챗GPT 관련 거시환경의 기회/위험 요인분석에 중점을 사전기획의 탐색적 연구에 중점을 두었다. 따라서 실제 서비스 도입 과정에서 SWOT 분석 등 조직 내부역량 분석을 추가 진행해 과학기술 특화 챗GPT 기술개발 및 서비스 기획을 위한 추진전략 수립을 위한 후속연구가 필요하다.


Acknowledgments

본 연구는 2023년 한국과학기술정보연구원의(KISTI) 기본사업 과제로 수행한 것입니다(과제고유번호 K-23-L01-C05-S01)


References
1. A. Haleem, M. Javaid, and R. P. Singh, "An era of ChatGPT as a significant futuristic support tool: A study on features, abilities, and challenges", BenchCouncil Transactions on Benchmarks, Standards and Evaluations, Vol. 2, No. 4, Oct. 2022.
2. Ministry of Science and ICT, "5th Basic Plan for Science and Technology (’23~’27)", 2022.
3. P. P. Ray, "ChatGPT: A comprehensive review on background, applications, key challenges, bias, ethics, limitations and future scope", Internet of Things and Cyber-Physical Systems, Vol. 3, pp. 121-154, Apr. 2023.
4. S. Shahriar and K. Hayawi, "Let's have a chat! A Conversation with ChatGPT: Technology, Applications, and Limitations", arXiv preprint arXiv:2302.13817, Feb. 2023.
5. D. Mhlanga, "Open AI in Education, the Responsible and Ethical Use of ChatGPT Towards Lifelong Learning", Education, the Responsible and Ethical Use of ChatGPT Towards Lifelong Learning, Feb. 2023.
6. M. Cascella, J. Montomoli, V. Bellini, and E. Bignami, "Evaluating the Feasibility of ChatGPT in Healthcare: An Analysis of Multiple Clinical and Research Scenarios", Journal of Medical Systems, Vol. 47, No. 33. Mar. 2023.
7. C. A. Gao, et al., "Comparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector, plagiarism detector, and blinded human reviewers", bioRxiv, Dec. 2022.
8. B. Garner, C. Thornton, A. L. Pawluk, R. M. Cortez, W. Johnston, and C. Ayala, "Utilizing text-mining to explore consumer happiness within tourism destinations", Journal of Business Research, Vol. 139, pp. 1366-1377, Feb. 2022.
9. D. M. Blei, "Probabilistic topic models", Communications of the ACM, Vol. 55, No. 4, pp. 77-84, Apr. 2012.
10. Y. Kong, H. Lee, and J. Choi, "Deriving Edutech Industry Issues from Text Data", The Journal of Korean Institute of Information Technology, Vol. 20, No. 9, pp. 31-42, Sep. 2022.
11. T. Sammut-Bonnici and D. Galea, "PEST analysis", Wiley Encyclopedia of Management, Vol. 12, Jan. 2015.
12. G. Lao and S. Jiang, "Risk Analysis of Third-Party Online Payment Based on PEST Model", 2009 International Conference on Management and Service Science, Beijing, China, pp. 1-5. Sep. 2009.
13. H. Chang, W. Choi, and H. Tho, "A Study on Establishment of National Science and Technology Strategy Applying PEST-SWOT-AHP : A Case Study of Fusion R&D", Journal of Technology Innovation Society, Vol. 15, No. 4, pp. 770-776, Dec. 2012.
14. K. Bae, J. Cho, and B. J. Yoo, "A Study on Establishment of AI Development Strategy for Ground Operations innovation Applying PEST-7S-SWOT", Journal of the Korea Academia-Industrial cooperation Society, Vol. 22, No. 6, pp. 67-74, Jun. 2021.
15. Y. Kim, S. Park, I. Kim, H. Ko, S. Cho, and I. Yun, "Study on Establishment of Development Strategy for K-City Based on Analysis of Domestic and Overseas Automated Vehicle Testbeds", The Journal of The Korea Institute of Intelligent Transport Systems, Vol. 20, No. 4, pp. 28-45, Aug. 2021.
16. E. J. Song, "Virtual Reality Industry Analysis and How to Activate", Journal of the Korea Institute of Information and Communication Engineering, Vol. 22, No. 4, pp. 656-663, Apr. 2018.
17. S. Park, S. Kim, and J. Kang, "Proposal of Promotion Strategy of Mobile Easy Payment Service Using Topic Modeling and PEST-SWOT Analysis", Journal of Intelligence and Information Systems, Vol. 28, No. 4, pp. 365-385, Dec. 2022.
18. R. Debnath, R. Bardhan, D. M. Reiner, and J. R. Miller, "Political, economic, social, technological, legal and environmental dimensions of electric vehicle adoption in the United States: A social-media interaction analysis", Renewable and Sustainable Energy Reviews, Vol. 152, Dec. 2021.
19. B. H. Lee, and T. H. Kim, "ChatGPT Needmining and R Low-Code Adoption for National R&D Data Analysis Automation", 2023 Spring Conference of The Korea Contents Association, Vol. 21, No. 1, pp. 171-172, May 2023.
20. https://www.bigkinds.or.kr [accessed: Jun. 5, 2023]
21. B. Zoph, E. D. Cubuk, G. Ghiasi, T. Y. Lin, J. Shlens, and Q. V. Le, "Learning data augmentation strategies for object detection", In Computer Vision–ECCV 2020, Proc. Part XXVII 16, Springer, pp. 566-583, Aug. 2020.

저자소개
나 혜 인 (Hyein Na)

2011년 8월 : 전남대학교 경제학과(경제학사)

2013년 8월 : 전남대학교기술경영전문대학원(경영학석사)

2019년 9월 ~ 현재: 과학기술연합대학원대학교 과학기술경영정책 박사과정

관심분야 : 과학기술경영정책, R&D기획, 인공지능, 빅데이터 분석, 텍스트마이닝, 기술마이닝

이 병 희 (Byeong-Hee Lee)

1992년 2월 : 충남대학교 컴퓨터공학과(공학사)

2002년 2월 : 충남대학교 컴퓨터공학과(공학박사)

2002년 9월 ~ 현재 : 한국과학기술정보연구원 NTIS센터 책임연구원

2012년 9월 ~ 현재 : 과학기술연합대학원대학교 과학기술경영정책학과 교수

관심분야 : 과학기술경영정책, 인공지능, 빅데이터, 텍스트마이닝, 기술마이닝