Home | JKIIT Archives | About the JKIIT | E-SUBMISSON |
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
[ Article ] | |
The Journal of Korean Institute of Information Technology - Vol. 22, No. 11, pp. 145-154 | |
Abbreviation: Journal of KIIT | |
ISSN: 1598-8619 (Print) 2093-7571 (Online) | |
Print publication date 30 Nov 2024 | |
Received 22 Aug 2024 Revised 30 Sep 2024 Accepted 03 Oct 2024 | |
DOI: https://doi.org/10.14801/jkiit.2024.22.11.145 | |
이미지 생성 AI 웹 플랫폼의 분석에 따른 실사 가상 면접관 디자인에 관한 연구 | |
시종욱*
; 김성영**
| |
*국립금오공과대학교 컴퓨터·AI융합공학과 박사과정 | |
**국립금오공과대학교 컴퓨터공학과 교수(교신저자) | |
Research on Designing Actual Virtual Interviewers based on Analysis of Image Generative AI in Web Platforms | |
Jongwook Si*
; Sungyoung Kim**
| |
Correspondence to : Sungyoung Kim Dept. of Computer Engineering, Kumoh National Institute of Technology, 61 Daehak-ro (yangho-dong), Gumi, Gyeongbuk, [39177] Korea Tel.: +82-54-478-7530, Email: sykim@kumoh.ac.kr | |
Funding Information ▼ |
생성 AI(Generative AI)는 텍스트 생성, 이미지 생성, 음성 합성 등 다양한 응용 분야에서 큰 관심을 받고 있으며, 특히 이미지 생성 기술은 텍스트를 이미지로 변환하는 기능을 통해 여러 산업에서 변화를 일으키고 있다. 이러한 기술의 발전에 따라 웹 플랫폼을 통해 제공되는 생성 AI 서비스가 점차 확산되고 있다. 가상 면접 시스템에서 생성 AI를 통해 만들어진 가상 면접관을 활용한 면접 연습은 실제 면접과 유사한 환경에서 다양한 면접관과의 상호작용을 경험함으로써 면접 상황에 대한 준비도를 높이고, 자신감을 키워 면접 성과를 향상시킬 수 있다. 본 연구에서는 다양한 AI 이미지 생성 웹 플랫폼을 분석하고, 이를 통해 가상 면접관 이미지를 생성하여 여러 기준에 따라 비교 분석한다. 분석 결과, 가상 면접관 생성 결과에 우수한 성능을 보여 적합한 플랫폼이 있는 반면, 일부 플랫폼은 현실감과 다양성 측면에서 개선이 필요한 것으로 나타났다.
Generative AI has garnered significant attention in various applications, including text generation, image generation, and speech synthesis. Notably, image generation technology, which converts text into images, is driving transformative changes across multiple industries. As this technology advances, Generative AI services offered through web platforms are becoming increasingly widespread. In virtual interview systems, utilizing AI-generated virtual interviewers for practice can provide substantial benefits to candidates. In this study, various AI image generation web platforms were analyzed, and virtual interviewer images were generated and compared based on several criteria. The analysis revealed that while some platforms exhibited excellent performance in generating virtual interviewers, making them suitable for use, others were identified as needing improvement in terms of realism and diversity.
Keywords: generative AI, image generation, web platform, virtual interviewer, design |
최근 몇 년간 인공지능(AI) 기술은 많은 발전을 이루었으며, 그중에서도 생성 AI(Generative AI)는 특히 주목받는 분야로 자리 잡고 있다[1][2]. 생성 AI는 기존 데이터를 학습하여 새로운 데이터를 생성하는 기술로, 텍스트 생성, 이미지 생성, 음성 합성 등 다양한 응용 분야에서 활용되고 있다. 이미지 생성 기술은 크게 텍스트에서 이미지로 변환하는 기술(Text to image)과 이미지에서 다른 이미지를 생성하는 기술(Image to image)로 구분한다. 텍스트에서 이미지로 변환하는 기술은 사용자가 원하는 이미지를 텍스트로 언급하면 이를 바탕으로 이미지를 생성하는 방식이며, Stable-Diffusion[3], DALL-E[4], Midjourney[5]와 같은 모델이 대표적이다. 반면, 이미지에서 이미지로 변환하는 기술은 기존 이미지를 입력으로 받아 이를 변형하거나 새로운 스타일로 전환하는 데 사용된다. 이러한 이미지 생성 기술들은 창작 활동[6]을 넘어 영상 분석[7], 패션[8][9], 디자인[10][11], 교육[12][13] 등 다양한 분야에서도 변화를 이끌고 있다.
생성 AI 기술의 발전과 함께, 이를 웹 플랫폼을 통해 제공하는 서비스가 점점 확산되고 있다[14]-[23]. 이러한 웹 플랫폼들은 다양한 방식으로 생성 AI 서비스를 제공하며, 사용자에게 맞춤형 선택을 할 수 있는 유연성을 제공한다. 웹 플랫폼을 통한 생성 AI 서비스는 크게 무료 서비스, 유료 서비스와 무료/유료 서비스가 통합된 크레딧 기반 서비스, 여러 요금제를 통한 부분적 서비스로 제공된다. 무료 서비스는 일반 사용자가 제한된 기능을 무료로 사용할 수 있게 함으로써, AI 기술의 접근성을 높이는 데 기여한다.
이러한 모델은 사용자가 AI 기술을 체험하고 기본적인 필요를 충족시킬 수 있게 한다. 유료 서비스는 프리미엄 기능이나 고급 옵션을 제공하는 방식으로, 이러한 서비스는 고품질의 생성 결과물이나 더 빠른 처리 속도, 더 많은 저장 공간 등의 이점을 제공한다. 크레딧 기반 플랫폼은 사용자가 일정량의 크레딧을 무료로 제공받아 이를 통해 AI 서비스를 사용할 수 있게 하며, 추가적으로 더 많은 서비스를 이용하기 위해서는 크레딧을 구매하거나 유료 서비스를 구독해야 한다. 이는 사용자에게 기본 기능을 체험할 기회를 제공함과 동시에, 추가적인 기능을 이용하기 위한 비용을 지불하도록 유도한다. 마지막으로 여러 요금제를 통한 부분적 서비스의 제공 방식은 사용자에게 무료 서비스를 한 번 이용해보고, 좀 더 좋은 품질의 결과를 위한다면, 요금제 구독을 통해 더 고급적인 기능을 사용할 수 있도록 한다. 이러한 구조는 사용자의 필요와 예산에 맞춘 다양한 옵션을 제공함으로써, 플랫폼의 이용 범위를 넓히는 데 기여한다.
웹 플랫폼을 통한 이미지 생성 AI 서비스는 사용자에게 많은 장점을 제공한다. 첫째, 웹 플랫폼은 사용자에게 언제 어디서나 생성 AI 기술에 접근할 수 있는 편리한 방법을 제공한다. 인터넷 연결만 있으면 복잡한 설치나 설정 과정 없이 브라우저를 통해 필요한 AI 기능을 사용할 수 있어, 대중화에 도움을 줄 수 있다. 둘째, 많은 웹 기반 생성 AI 플랫폼은 직관적인 사용자 인터페이스를 제공하여 비전문가도 쉽게 사용할 수 있도록 한다. 셋째, 웹 플랫폼은 다양한 사용자 요구에 맞춰 기능을 확장하거나 맞춤형 서비스를 제공할 수 있는 유연성을 지니며, 이는 맞춤형으로 설계된 AI 기능을 쉽게 제공할 수 있다는 점에서 중요하다. 이러한 생성 AI 서비스는 가상 면접 플랫폼에서도 활용될 수 있으며 활용하기 위해서는 생성 AI가 실제와 같은 이미지를 생성해야만 한다.
가상 면접은 지원자와 면접관이 물리적으로 같은 공간에 있을 필요 없이 메타버스를 포함한 온라인 플랫폼을 통해 진행되며, 특히 AI 면접관을 활용한 가상 면접은 많은 기업이 채용 과정의 효율성을 높이기 위해 도입하고 있는 최신 기술이다[24]. AI 면접관은 지원자의 답변을 분석하고 평가하는 역할을 하며, 공정하고 객관적인 평가를 통해 인간 면접관이 가질 수 있는 편견을 최소화하는 데 기여한다. 이때, 가상 면접관의 디자인은 지원자에게 신뢰를 줄 수 있는 외형적 디자인과 인간적인 상호작용을 유도할 수 있는 감성적 디자인이 필요하다. 특히, 실사와 유사한 외형을 가진 가상 면접관은 지원자가 더 자연스럽게 면접에 임할 수 있도록 돕는다.
가상 면접 플랫폼에서 생성 AI를 통해 면접관을 활용해야 하는 중요한 이유 중 하나는 다양한 면접관을 실제와 같은 환경에서 구현함으로써, 보다 현실적이고 몰입감 있는 면접 분위기를 조성할 수 있다는 점이다[25].
생성 AI를 활용하면 다양한 외모를 가진 가상 면접관을 손쉽게 생성할 수 있어, 이를 통해 구성된 가상 면접 플랫폼에서는 현실감 있는 면접관을 통해 사용자가 실제와 같은 면접 연습이 가능하다는 장점이 있다.
본 논문에서는 웹 플랫폼에서 부분적 형태를 포함한 무료 서비스로 제공되는 Text to Image 형태의 생성 AI를 비교하고 분석하며, 동양인의 가상 면접관을 생성하기 위한 결과를 제작하여 이를 통해 각각의 플랫폼이 가진 특징을 분석한다.
Wrtn[14]은 창의적인 콘텐츠를 생성하는 도구로 텍스트 생성에 중점을 두는 도구지만, 이미지 생성의 기능도 추가로 지원한다. 이 도구의 특징은 이미지 생성의 경우 Stable-Diffusion[3]을 기반으로 한다는 점과 사용량의 제한 없이 모두 무료로 사용할 수 있다는 것이다. 따라서 이미지 생성 입문자의 경우 해당 플랫폼에서 “AI 이미지” 버튼을 클릭하여 기술을 익히고 활용해볼 수 있다는 큰 장점이 있다. Microsoft Bing Image Generator[15]는 Bing 검색 엔진과 통합된 AI 이미지 생성 플랫폼으로, DALL-E[4]를 기반으로 하는 결과를 무료로 제공한다. 이 플랫폼은 100개의 무료 크레딧을 제공하지만, 크레딧이 소진되면 이미지 생성 속도가 느려진다. 비록 속도가 느려지지만, 계속해서 서비스를 이용할 수 있기 때문에 무료 서비스로 간주할 수 있다.
Canva[16]는 사용하기 쉬운 인터페이스와 다양한 템플릿을 제공하여 그래픽 디자인 작업을 간편하게 만들어주는 장점이 있다. AI 이미지 생성 기능도 포함되어 있어 초보자에게 적합하지만, 고급 사용자는 제한된 기능 때문에 추가 유료 구독을 고려할 수 있다. 기본적인 기능은 무료로 사용할 수 있지만, 고급 기능을 사용하려면 유료 요금제를 구독해야 한다. 무료 서비스는 기본적인 디자인 작업을 수행하는 데 충분하지만, 개인 유료 서비스에서는 더 많은 템플릿, 클라우드 저장 공간, 그리고 편의성 기능이 향상된다. Canva는 개인 사용자뿐만 아니라 팀과 조직을 위한 협업 서비스도 제공하며, 이러한 서비스는 팀 및 조직의 관리와 공동 작업을 용이하게 한다는 장점이 있다.
Adobe Firefly[17]는 Adobe의 클라우드와 연동되는 AI 이미지 생성 도구로, 웹 플랫폼 형태로 제공된다. 이 도구는 생성된 이미지를 Adobe의 다양한 디자인 도구에서 바로 활용할 수 있는 것이 특징이다. 이 서비스는 월간 25개의 크레딧을 통해 일부 기능을 무료로 사용할 수 있지만, 전체 기능을 사용하려면 유료 구독이 필요하다. 다양한 기능을 사용하거나 워터마크를 제거하려면 유료 구독이 필요하며, 유료 서비스를 이용하더라도 월간 크레딧 수가 250개로 한정된다는 단점이 있다. Freepik[18]는 AI 이미지 생성 도구로, 주로 디자인에 필요한 고해상도 이미지를 생성하는 데 사용된다. 기본적인 기능은 무료로 제공되며, 20개의 크레딧이 주어진다. 이 크레딧을 초과해 이미지를 생성하려면 유료 구독이 필요하다. 그러나 유료 서비스의 가장 큰 장점은 온라인 편집 기능을 제외하고 이미지 생성과 관련된 모든 기능 제한이 없는 것이다.
Pixlr[19]은 온라인 이미지 편집 도구로 AI 기반의 이미지 생성 기능도 제공하고 있다. 따라서 편집을 통해 추가 수정이 가능하다는 장점이 있다. 기본적인 이미지 생성 기능은 무료로 제공되지만, 고급 편집 도구나 고해상도의 이미지 다운로드를 위해서는 유료 구독이 필요하다. 무료 서비스의 경우 월간 80개의 크레딧을 통해 일부 기본적인 기능을 사용할 수 있다. 하지만, Adobe Firefly[17]와 같이 유료 서비스를 사용하는 경우 크레딧(1,000개)을 제공하기에 한정적이라는 공통점이 있지만, 더 많은 크레딧 제공을 해주기 때문에 더 많은 이미지를 생성해볼 수 있다.
PlaygroundAI[20]는 다양한 스타일과 필터를 활용하여 이미지를 생성할 수 있는 플랫폼이며, 크레딧을 통해 무료와 유료 서비스를 구분한다. 무료 서비스는 하루에 50개의 크레딧을 제공하여 사용자들이 다양한 이미지를 생성해볼 수 있다는 장점이 있다. 그러나 다른 웹 플랫폼과 비교했을 때, 무료 사용자가 접근할 수 있는 기능이 매우 제한적이라는 단점이 있다. 반면, 유료 서비스는 매일 1,000개의 크레딧을 제공하며, 플랫폼의 모든 기능을 무제한으로 사용할 수 있어 기능적 제한이 모두 제거된다는 특징이 있다.
IdeogramAI[21]는 크레딧을 통해 무료 및 유료 서비스를 구분하며, 네 가지 요금제를 통해 다양한 유료 서비스를 제공한다. 이 플랫폼의 주요 특징 중 하나는 Priority Prompt 기능을 통해 속도의 차별화를 두는 것이다. 먼저, 무료 요금제는 하루에 10번의 느린 생성 기능과 압축된 JPG 파일 다운로드 기능을 제공한다. 유료 요금제는 세 가지로 구성되며, Basic 요금제는 400개의 Priority Prompt와 100번의 느린 생성 기능, PNG 파일 다운로드 기능을 포함한다. Plus 요금제는 1,000개의 Priority Prompt와 제한 없는 느린 생성 기능을 제공하며, Pro 요금제는 3,000개의 Priority Prompt를 제공한다.
PromeAI[22]는 다양한 기능과 고급 AI 모델을 활용하여 이미지를 생성할 수 있는 플랫폼으로, 다양한 작업에 활용할 수 있다. Ideogram AI[21]와 마찬가지로, 무료 요금제와 3가지 유료 요금제를 통해 차별화된 서비스를 제공한다. 무료 요금제는 매월 10개의 크레딧(코인)을 제공하며, 기본적인 이미지 생성 기능을 사용할 수 있다. Base 요금제는 매월 500개의 크레딧(코인)을 제공하여 빠른 이미지 생성과 고품질 이미지 다운로드가 가능하며, Standard 요금제는 매월 2,000개의 크레딧(코인)을 제공하며, 모든 기능을 제한 없이 사용할 수 있다. 마지막으로, Pro 요금제는 매월 6,000개의 크레딧(코인)을 제공한다. Standard와 Pro 요금제 사용자는 추가 크레딧 구매 시 할인 혜택을 받을 수 있는 것이 특징이다.
DreamStudio[23]는 Stable Diffusion[3]을 기반으로 이미지를 생성하는 도구라는 특징이 있다. 다른 웹 플랫폼들과 달리 요금제 개념이 아닌 크레딧 기반의 유료 서비스를 제공한다. 회원가입 시 200개의 무료 크레딧이 제공되며, 이후에는 1,000개 단위로 크레딧을 구매하여 사용할 수 있다. 유료 서비스 구독이 아닌, 필요에 따라 원하는 만큼만 결제할 수 있어, 사용자의 부담이 적다는 점이 특징이다.
표 1은 웹 플랫폼의 서비스 형태에 따라 요약한 내용을 보여준다. 이를 통해 웹 플랫폼 간에 몇 가지 특징이 있음을 알 수 있다. 먼저, 대부분의 플랫폼은 무료와 유료 서비스를 제공하여 사용자가 기본 기능을 무료로 체험할 수 있도록 하면서도, 더 많은 기능이나 고급 옵션을 원할 경우 유료 구독이나 크레딧을 통해 추가 서비스를 이용할 수 있게 한다. 이러한 접근 방식은 사용자가 초기 진입 장벽을 낮추고, 필요에 따라 비용을 지불하게 하는 유료 서비스를 채택한다. 또한, 크레딧 기반 시스템을 도입한 플랫폼들이 많다는 점이 있다. 대부분의 플랫폼은 크레딧의 개수에 따라 무료와 유료 서비스를 차별화하여 제공한다. 예를 들어, 일정량의 크레딧을 무료로 제공한 후, 추가 기능을 이용하려면 유료 요금제를 구독하여 더 많은 크레딧을 사용할 수 있게 하거나[17]-[22], DreamStudio[23]와 같이 사용자가 필요한 만큼의 크레딧을 직접 구매하여 사용하는 결제 방식을 제공하는 방법도 있다.
Availability of services | Credit and pricing information | |
---|---|---|
Wrtn[14] | Free | None |
Microsoft Bing Image Generator[15] | Free | Unlimited access with credit usage |
Canva[16] | Partially free | Subscription plan |
Adobe Firefly[17] | Partially free | Subscription plan based on credit count and features |
Freepik[18] | Partially free | Subscription plan based on credit count and features |
Pixlr[19] | Partially free | Subscription plan based on credit count and features |
Playground[20] | Partially free | Subscription plan based on credit count and features |
IdeogramAI[21] | Partially free | Subscription plan based on credit count and features |
PromeAI[22] | Partially free | Subscription plan based on credit count and features |
DreamStudio[23] | Partially free | Additional credit purchase |
많은 플랫폼이 기본적인 이미지 생성 기능을 무료로 제공하지만, 더 높은 해상도의 이미지 다운로드나 고급 편집 기능 등은 유료 서비스로 제공하여 사용자 층에 따라 기능을 차별화한다. 이러한 방식은 초보자부터 전문가까지 다양한 사용자의 요구를 충족시키기 위해 설계된 것으로 보인다. 이처럼, 웹 플랫폼들은 다양한 사용자층의 요구를 충족시키기 위해 무료 체험, 유료 업그레이드에 따른 단계적 기능 제공, 크레딧 등을 대부분의 웹 플랫폼에서 채택하고 있다. 이러한 점은 사용자에게 맞춤형 경험을 제공하는 동시에, 플랫폼의 지속 가능성을 보장하는 역할을 할 수 있다.
본 논문에서는 다양한 이미지 생성 AI 웹 플랫폼을 사용하여 가상 면접관의 상반신 이미지를 생성하고, 이를 비교 및 분석한다. 이러한 연구의 목적은 각 플랫폼이 제공하는 무료 서비스를 바탕으로, 실제 사람과 유사한 가상 면접관을 생성하는 데 있어 각 플랫폼의 성능과 한계를 평가하는 것이다.
가상 면접관을 생성하기 위해서는 프롬프트의 설계가 중요하다. 프롬프트는 AI가 이미지를 생성하는 과정에서 사용자의 의도를 정확히 반영하도록 돕는 핵심 요소로 작용한다. 본 연구에서는 가상 면접관을 동양인으로 설정하고, 정장을 입은 채 정면을 바라보는 모습을 구현하고자 하였다. 또한, 립싱크 등의 기능을 적용하여 인공지능 면접에 활용할 수 있도록 자연스러운 표정을 갖추는 것을 목표로 한다. 이를 위해, 설계한 프롬프트는 아래와 같다.
프롬프트 1: "A professional virtual interviewer of East Asian descent in a crisp, tailored suit, facing forward with a calm, focused expression against a clean, neutral background."
프롬프트 2: "A confident East Asian interviewer dressed in formal attire, looking directly at the viewer, with a minimalistic background emphasizing their professional demeanor."
프롬프트 3: "An East Asian virtual interviewer in a sharp business suit, positioned centrally and facing the camera with a composed, professional look."
이러한 프롬프트들은 가상 면접관 생성의 기본적인 목표를 달성하기 위해, 동양인의 외모, 정장 착용, 정면을 바라보는 모습을 강조한다. 각 프롬프트는 미세한 차이를 두어, 이미지 생성 능력을 다각도로 평가할 수 있도록 설계하였다.
각 프롬프트를 사용하여 이미지 생성 AI 웹 플랫폼에서 생성된 결과를 비교한 후, 다음과 같은 기준을 통해 평가한다:
(1) 현실감: 생성된 이미지가 실제 사람과 얼마나 유사하게 보이는지를 평가한다. 이는 얼굴의 세부적인 정보, 피부 질감, 머리카락 표현 등을 포함한다.
(2) 프롬프트 반영도: 프롬프트에서 제시한 요구사항이 얼마나 정확히 반영되었는지를 평가하였다. 특히, 정장을 입은 동양인의 외모와 정면을 바라보는 포즈 등의 프롬프트의 내용이 잘 반영되어 생성되었는지에 중점을 두었다.
(3) 표정의 자연스러움: 가상 면접관의 신뢰성을 높이기 위해 표정의 자연스러움이 중요하다. 생성된 이미지에서 나타나는 표정이 얼마나 자연스럽고 인간적인지 평가한다.
(4) 다양한 면접관 생성: 각 웹 플랫폼에서 생성된 결과를 분석하여 다양한 외모의 면접관을 생성할 수 있는지를 확인함으로써 가상 면접에서 다양한 면접관으로 활용할 수 있는지를 평가한다.
이미지 생성 AI 웹 플랫폼[14]-[23]을 사용하여 가상 면접관의 상반신 이미지를 생성하고, 이를 프롬프트 반영도, 다양성, 현실감 등의 기준에 따라 분석하였다. 각 플랫폼에서 생성된 이미지는 그림 1 및 그림 2에 제시하였으며 다음과 같이 특징을 분석할 수 있다. Wrtn[14]은 실제 사람과 같은 현실감을 보였지만, 면접관의 얼굴이 비슷하게 생성되었고, 정면보다는 측면을 바라보는 이미지가 포함되어 프롬프트 반영도가 떨어졌다. 그럼에도 불구하고 다른 플랫폼에 비해 높은 현실감을 제공한다. Bing Image Generator[15]은 프롬프트를 잘 반영했으나, 면접관의 다양성 측면에서 부족함을 확인하였다. 생성된 이미지들이 어린 신입 사원 같은 외모를 보였고, 정장의 다양성도 떨어지며 머리 스타일이 비슷한 경향을 보였다. 전반적으로 면접관보다는 일반적인 직장인 이미지에 더 가까웠다.
Canva[16]는 다양한 면접관을 생성할 수 있는 능력을 보여주었으며, 프롬프트를 잘 반영하여 실제 동양인의 모습을 표현하였다. 정장 스타일과 표정에서 전반적으로 높은 사실성을 보이며, 가상 면접관으로 사용하기에 적합한 이미지를 생성하였다.
Adobe Firefly[17]는 동양인의 면접관을 생성하지 못했으며, 서양인으로 보이는 결과를 생성하였다. 이로 인해 동양인 가상 면접관을 목표로 한 연구의 목적에는 부합하지 않았다. 그 외의 요소들은 비교적 잘 반영되었지만, 주요 목표를 달성하지 못했다. Freepik[18]는 매우 다양한 형태의 면접관을 생성하며, 정장의 스타일도 다르게 표현되었다. 실제 면접관의 분위기를 잘 반영하였으며, 플랫폼이 제공하는 이미지의 사실성과 다양성이 뛰어났다. 다양한 외모와 분위기의 면접관을 필요로 하는 경우에 특히 유용할 것으로 평가된다.
PIXLR[19]은 다양성이 부족하고 생성된 이미지가 실제 사람과는 다소 어색한 느낌을 주었다. 인공지능이 만든 느낌이 존재하여 현실감이 떨어졌으며, 얼굴과 헤어스타일이 유사한 경향이 있었다. PlaygroundAI[20]는 생성된 결과의 현실감이 떨어지며, 프롬프트 반영도가 낮은 것으로 평가된다. 특히, 세 번째 프롬프트를 사용한 결과는 애니메이션과 같은 느낌을 주어 면접관으로 사용하기에는 부적절한 면이 있었다. 전반적으로 사실성이 부족한 결과를 보였다. IdeogramAI[21]는 프롬프트를 잘 반영하지 못했으며, 생성된 이미지에서 앞을 응시하지 않거나 팔짱을 끼는 등의 자세가 나타났다. 헤어스타일과 정장의 스타일이 비슷하여 다양성이 부족했으나, 이미지 자체의 현실감은 비교적 높은 편이다.
PromeAI[22]는 프롬프트를 비교적 잘 반영하였으나, 생성된 면접관들이 매우 유사하게 생겼으며, 정장의 색상과 머리 스타일이 거의 동일했다. 또한, 배경과 객체가 자연스럽게 어울리지 못하는 결과를 보였다. 이러한 점들은 가상 면접관의 다양성과 활용 가능성을 제한하는 요소로 작용하였다.
DreamStudio[23]는 팔짱을 끼는 등 프롬프트 반영도가 낮았으며, 생성된 면접관의 얼굴이 거의 비슷한 모습을 보였다. 하지만, 실제 사람과 유사하게 생성되었다는 점에서 일정 수준의 현실감을 유지했다고 볼 수 있다.
본 연구의 결과, 각 플랫폼은 가상 면접관 생성에 있어 다양한 성능을 보였다. Canva[16]와 Freepik[18]는 프롬프트를 충실히 반영하면서도 다양성과 현실감을 갖춘 이미지를 생성하여 가장 높은 성능을 보인다. 반면, Adobe Firefly[17]와 PIXLR[19], PlaygroundAI[20]는 프롬프트 반영도와 사실성 측면에서 다소 부족함이 있었으며, 특히 Adobe Firefly[17]는 동양인의 면접관을 생성하지 못한 점에서 한계가 있었다.
IdeogramAI[20]와 PromeAI[22]는 프롬프트 반영도는 다소 떨어지지만, 비교적 현실감 있는 이미지를 생성할 수 있었다. 표 2는 생성된 면접관 이미지를 분석한 결과를 바탕으로 3.2에서 언급한 4가지 기준을 통해 정성적으로 평가한 결과이다. 가상 면접관으로 활용되기에는 Canva[16]와 Freepik[18] 웹 플랫폼이 가장 적합한 것으로 분석된다.
(1) | (2) | (3) | (4) | |
---|---|---|---|---|
Wrtn[14] | Slightly high | Standard | Slightly high | Standard |
Bing Image Generator[15] | Slightly high | Slightly high | Standard | Standard |
Canva[16] | High | High | High | High |
Adobe Firefly[17] | Standard | Slightly low | Slightly high | Slightly low |
Freepik[18] | High | High | High | High |
Pixlr[19] | Standard | Standard | Standard | Low |
Playground[20] | Slightly low | Slightly low | Slightly low | Slightly low |
IdeogramAI[21] | Slightly high | Standard | Slightly high | Standard |
PromeAI[22] | Slightly high | Slightly high | Slightly high | Standard |
DreamStudio[23] | Slightly high | Standard | Slightly high | Standard |
본 연구에서는 다양한 AI 이미지 생성 웹 플랫폼을 분석하였으며, 이를 사용하여 가상 면접관 이미지를 생성하고, 이를 여러 기준에 따라 비교 분석하였다. 분석 결과, 각 플랫폼은 이미지의 현실감, 프롬프트 반영도, 표정의 자연스러움, 그리고 다양한 면접관 생성 능력에서 서로 다른 성능을 보였다. Freepik과 Canva는 전반적으로 우수한 결과를 나타내어 가상 면접관 디자인에 적합한 플랫폼으로 평가되었다. 반면, Adobe Firefly는 동양인 면접관을 생성하는 데 어려움을 겪었으며, 일부 플랫폼들은 사실성과 다양성 측면에서 개선이 필요한 것으로 나타났다.
이러한 결과는 가상 면접관 디자인을 위한 플랫폼을 선택할 때, 특정 요구사항에 부합하는 플랫폼을 신중히 선택해야 함을 시사한다. 하지만, 언급한 기준에 따라 평가한 결과는 주관적이므로 관련 사업 종사자들을 대상으로 하는 설문 조사 등을 진행하여 객관적인 수치를 확보해야만 한다.
본 연구는 다양한 플랫폼을 통해 가상 면접관 이미지를 비교 분석하는 데 중점을 두었으나, 추가 연구 과제가 여전히 남아 있다. 추후 연구에서는 가상 면접관의 기능을 실제 시스템에 통합하여 립싱크와 음성 상호작용, 제스처 등의 적용 가능성을 실험하고, 이를 통해 가상 면접 시스템에서의 실용성을 평가해야 한다. 또한, 본 연구에서의 평가는 주관적인 요소가 많았기 때문에, 다양한 산업 관계자와 사용자들을 대상으로 설문조사를 진행하여 평가의 객관성을 높여야 한다. 이를 통해 더 구체적인 기준을 설정하고, 각 플랫폼의 장단점을 체계적으로 파악할 수 있을 것이다.
본 연구는 2024년도 과학기술정보통신부와 한국전파진흥협회의 메타버스랩지원사업에 의한 연구임
1. | M. Chu, Y. Park, S. Noh, S. Heo, and W. Huh, "Development of 1:1 customized Smartphone Education Application for the Elderly using Generative AI", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 24, No. 4, pp. 15-20, Aug. 2024. |
2. | S. Kim, M. Hwang, S. Kim, and N. Kim, "Farming Diary Support Method using ChatGPT", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 23, No. 6, pp. 191-197, Dec. 2023. |
3. | R. Rombach, A. Blattmann, D. Lorenz, P. Esser, and B. Ommer, "High-Resolution Image Synthesis with Latent Diffusion Models", In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, New Orleans, LA, USA, pp. 10684-1065, Jun. 2022. |
4. | A. Ramesh, M. Pavlov, G. Goh, S. Gray, C. Voss, A. Radford, M. Chen, and I. Sutskever, "Zero-shot text-to-image generation", In International conference on machine learning, pp. 8821-8831, Jul. 2021. |
5. | Midjourney, https://www.midjourney.com/ [accessed: Aug. 20, 2024] |
6. | D. Jo, M. Kim, S. Kim, and G. Kim, "A generative ai-based next-generation short-form creation platform", Journal of Digital Contents Society, Vol. 25, No. 7, pp. 1701-1713, Jul. 2024. |
7. | S. Heo and T. Cho, "Analysis of generative ai's floor plan images using visibility graphs", Journal of the Korea Spatial Design Society, Vol. 18, No. 8, pp. 341-352, Dec. 2023. |
8. | J. Han, "A change in generative ai and the fashion industry", Journal of the Korea Institute of Information and Communication Engineering, Vol. 28, No. 7, pp. 850-858, Jul. 2024. |
9. | W. Lee, "Suggestions for the use of fashion images with generative ai -focusing on application of ai training data and ai technology-", Journal of the Korean Society Design Culture, Vol. 29, No. 4, pp. 319-336, Dec. 2023. |
10. | J. Kim and S. Park, "Visualizing biophilic design in residential spaces with generative ai -focusing on water attributes for direct experience-", Journal of the Architectural Institute of Korea, Vol. 40, No. 7, pp. 61-70, Jul. 2024. |
11. | Z. Wang and S. Kim, "A research on generative ai acceptance among design students - innovation characteristics, student characteristics, and environmental characteristics", Journal of the Korea Contents Association, Vol. 24, No. 6, pp. 66-76, Jun. 2024. |
12. | H. Yun and K. Kim, "Analysis of perceptions and needs of generative ai for work-related use in elementary and secondary education", Journal of the Korea Society of Computer and Information, Vol. 29, No. 7, pp. 231-243, Jul. 2024. |
13. | K. Kim, "A way of university writing education in the era of generative ai -focused on use of generative ai in argumentative writing", Urimalgeul: The Korean Language and Literature, Vol. 101, pp. 63-86, Jun. 2024. |
14. | Wrtn, https://wrtn.ai/ [accessed: Aug. 20, 2024] |
15. | Bing image generator, https://create.microsoft.com/ko-kr/features/ai-image-generator [accessed: Aug. 20, 2024] |
16. | Canva, https://www.canva.com/ko_kr/ai-image-generator/ [accessed: Aug. 20, 2024] |
17. | Adobe Firefly https://www.adobe.com/kr/products/firefly/features/text-to-image.html [accessed: Aug. 20, 2024] |
18. | Freepik, https://kr.freepik.com/ai/%EC%9D%B4%EB%AF%B8%EC%A7%80-%EC%83%9D%EC%84%B1%EA%B8%B0 [accessed: Aug. 20, 2024] |
19. | PIXLR, https://pixlr.com/kr/image-generator [acce ssed: Aug. 20, 2024] |
20. | PlaygroundAI, https://playgroundai.com/ [accessed: Aug. 20, 2024] |
21. | Ideogram, https://ideogram.ai/ [accessed: Aug. 20, 2024] |
22. | PromeAI, https://www.promeai.pro/ko [accessed: Aug. 20, 2024] |
23. | DreamStudio, https://beta.dreamstudio.ai/generate/[accessed: Aug. 20, 2024] |
24. | C. Yoon, S. Yang, J. Park, J. Si, Y. Jung, and S. Kim, "Metaverse Virtual Interview Platform Leveraging Generative AI and Speech Recognition", Journal of Korean Institute of Information Technology, Vol. 22, No. 6, pp. 163-173, Jun. 2024. |
25. | J. Si, S. Yang, D. Kim, and S. Kim, "Metaverse Interview Room Creation with Virtual Interviewer Generation Using Diffusion Model", IEEE Asia-Pacific Conference on Computer Science and Data Engineering, Nadi, Fiji, Dec. 2023. |
2020년 8월 : 국립금오공과대학교 컴퓨터공학과(공학사)
2022년 2월 : 국립금오공과대학교 컴퓨터공학과(공학석사)
2022년 3월 ~ 현재 : 국립금오공과대학교 컴퓨터·AI 융합공학과 박사수료
2023년 9월 ~ 현재 : 국립금오공과대학교 인공지능공학과 강사
관심분야 : 영상처리, 컴퓨터비전, 인공지능, 이상 감지, 영상 기반 생성 AI
1994년 2월 : 부산대학교 컴퓨터공학과(공학사)
1996년 2월 : 부산대학교 컴퓨터공학과(공학석사)
2003년 8월 : 부산대학교 컴퓨터공학과(공학박사)
2004년 ~ 현재 : 국립금오공과대학교 컴퓨터공학과 교수
관심분야 : 영상처리, 컴퓨터비전, 기계학습, 딥러닝, 메타버스