Novel AI 노벨 AI
간단한 명령어 형식으로 자신이 원하는 그림을 그려낼 수 있는 프로그램. 2022년 10월 3일에 출시된 후 만화 일러스트풍 그림을 매우 높은 수준으로 묘사하며 사람들의 이목을 끌었다. 그림을 자동으로 그려주는 생성형 AI의 대표 격인 달리, 미드저니와 견줄 정도의 기능을 자랑한다. 탁월한 이미지 생성 능력을 갖추고 있지만 논란도 따랐다. 원작자의 화풍을 거의 고스란히 재현할 수 있는 유사도 조절 기능 때문인데 웹툰, 게임 원화가, 일러스트레이터 등 창작자의 스타일을 교묘하게 다른 스타일로 내놓아 상업적인 목적으로 활용할 가능성이 대두된 것이다. AI 창작물에 대한 저작권 문제가 화두가 되며 일각에서는 AI 창작물에 대한 세분된 법 제정이 필요하다는 목소리가 높아지고 있다.
Observe AI 옵저브 AI
텔레마케터의 고충을 아는지. 얼굴을 맞대지 않고 유선으로 수익 창출의 최일선에 나서는 것은 만만치 않은 일이다. 상대에게 적확한 정보를 적시에 안내해야 하기 때문이다. 손과 입이 쉴 틈이 없고 중요한 내규를 깜빡해 기업의 규정을 위반하는 상황에 직면하기도 한다. 다시 말해 상담원의 통화 수행 능력은 판매 및 유지에 상당한 영향을 미치는 셈이다. 이를 위해 개발한 옵저브 AI는 대규모 언어 모델(LLM) 및 생성 AI 엔진을 기반으로 실시간 통화 상담원의 통화 수행 능력을 촉진하는 서비스를 제공한다.
수백만 건의 통화 내용을 학습해 대화 내용을 정확히 기록하고, AI 기반 음성 인식 기능으로 화자를 정확히 식별한다. 유선으로 빠르게 처리하기 어려운 고객과의 상호작용을 긍정적으로 유도하는 것이 특징. 주요 기능은 상담원과 고객이 대화할 때 스크립트를 띄워 담당자가 상호작용에 집중할 수 있도록 돕는 것. 통화 중 상담원이 기록한 메모를 캡처해주는 데다, 통화를 마치면 대화 내용을 단숨에 요약해준다. 메모를 쉽게 추가하거나 편집하고 CRM 또는 기록 시스템과 동기화할 수 있는 기능도 눈여겨볼 만하다. 그뿐만 아니라 실시간으로 업데이트되는 대화 내용을 모니터링해 상담원에게 정확한 코칭함으로써 고객에게 일관된 경험을 전할 수 있다는 강점이 있다.
Phenaki 페나키
구글 CEO 순다르 피차이는 “AI는 ‘세계 정보를 누구나 사용할 수 있도록 하겠다’는 구글의 미션의 핵심 수단”이라고 강조한 바 있다. 경영자의 선언처럼 영상 생성 AI 기술을 가장 많이 보유한 회사 가운데 하나가 구글이다. 지난해 말에는 사용자가 글자로 명령어를 입력해 영상을 만드는 모델인 이마젠 비디오(알파벳 I 참고)와 페나키를 공개해 영상 제작의 새로운 패러다임을 제시했다. 페나키는 이마젠 비디오와 기본 생성 원리는 유사하지만 상대적으로 연속적이고 구체적인 문장에 강하다. 시나리오처럼 문장으로 명령어를 입력하면 이를 바탕으로 줄거리가 담긴 장면을 생성한다. 가령 “곰돌이가 바다에 뛰어든다”, “곰돌이가 물 밖으로 나온다”, “곰돌이가 해변을 걷는다”와 같은 지시문을 연달아 입력했을 경우 페나키가 이러한 지시문을 엮어 하나의 영상으로 만들어준다. 이를 이용하면 짧은 애니메이션 제작까지 가능하다. 다양한 분야의 전문가를 필요로 하며 절대적인 전문 분야로 여겨졌던 장편영화까지 생성형 AI와 함께 제작하는 날이 머지 않아 보인다.
Product Studio 프로덕트 스튜디오
구글은 지난 5월 제품 이미지를 빠르게 편집할 수 있는 도구인 프로덕트 스튜디오를 공개했다. 글과 이미지를 모두 생성하는 AI 모델이다. 마케팅 담당자를 주요 타깃으로 생성형 AI를 통해 광고를 만들 수 있도록 돕는다. 프로덕트 스튜디오는 전자상거래 목록에 사용되는 제품과 이미지를 다양하게 사용할 수 있다는 특징이 있다. 이 과정에서 잠재 고객들이 자주 쓰는 검색어와 더 관련성이 높은 광고 문구와 제품도 자동으로 생성할 수 있다. 저해상 상품 사진을 고해상으로 바꾸는 해상도 향상 기능을 갖췄으며 원하지 않는 배경을 제거하거나, 다른 곳에 있는 이미지를 광고에 추가할 수도 있다. 구글 광고 담당 부사장은 “AI가 빠르게 발전하면서 광고업계에서도 흥미로운 일이 시작됐다”라고 말했다.
QNA-GPT 큐나-GPT
필요한 답만 정확하게 찾아 원하는 형식의 답변으로 제공하는 챗봇이 등장했다. 바로 지난 4월 AI 기업 스켈터랩스가 출시한 LLM 기반 대화형 챗봇 큐나-GPT다. 전문성 및 시의성, 정확성이 확보된 정보가 필요한 도메인 특수 데이터나 업무용 메신저에 특화해 설계했다. 웹페이지나 슬랙, 카카오톡 등 다양한 채널과 연동해 조직에서 팀과 커뮤니케이션하기에 최적화한 것이 특징이다. 기존 LLM과 달리 멀티턴multi-turn 형식으로 맥락이 끊기지 않고 대화를 이어갈 수 있다. 특히 조직 내부에서만 활용되는 데이터 등을 바탕으로 외부에서 접근이 불가능한 정보 등에 대해 자유로운 질의응답이 가능하다. PDF, DOC, HWP 등 다양한 포맷을 큐나-GPT에 업로드하면 이에 대한 문서를 분석하고, 정확한 답을 제공해준다. 커뮤니케이션 이력을 남기는 동시에 서로 주고받은 자료나 링크에 대해서 분석해 준다는 점에서 활용도가 높다. 이를테면 고객사가 보유한 특정 문서나, 특정 시점에 특정 웹사이트에 있는 정보를 기반으로 답변하기 때문에 최신 업데이트된 정보를 바탕으로 안내할 수 있다.
RemoteMeeting 리모트미팅
업무 협업을 위한 온라인 화상회의 애플리케이션. 비대면·원격 솔루션 전문 기업 알서포트가 2017년에 개발한 서비스로 모바일과 웹 서비스를 동시에 제공하며 동시 참여 최대 100명의 화상회의를 진행할 수 있다. 여기까지는 기존의 화상회의 앱과 별 차이가 없어 보인다. 하지만 핵심은 여기에 있다. 리모트미팅은 웹 기반 화상회의 제품에 원격 제어 기능을 접목했다. 단순히 화상회의 참석자가 서로 화면을 공유하는 것을 넘어 원격으로 특정 참석자의 PC에 연결하고, 해당 PC 내 프로그램이나 문서에 대해 여러 참석자들이 함께 작업할 수 있다. 바로 옆에서 함께 작업하는 것처럼 팀원과 상호작용이 가능해 업무 협업에 상당히 효과적이다. 알서포트는 지난 4월에는 챗GPT가 적용된 리모트미팅의 ‘AI 요약’ 기능을 추가했다. STT 기술이 적용된 AI 회의록 기능이다. 이 기술로 참석자들은 발언 내용을 실시간으로 텍스트화해 대화록처럼 기록으로 남길 수 있으며 해당 내용을 PDF 파일로 다운로드까지 받을 수 있다. 화상 회의 후 작업 시간을 단축시켜준다는 장점도 있다.
Stable Diffusion 스테이블 디퓨전
2022년 스테이빌리티 AI가 오픈소스 라이선스로 배포한 ‘text-to-image’ AI 모델. 오픈AI의 달리처럼 GAN 등 다양한 신경망 아키텍처를 활용하며 텍스트 기반으로 이미지를 만드는 생성 모델을 구현 중이다. 기존의 이미지 생성 모델과 달리 비교적 큰 해상도의 이미지를 생성하는데도 리소스 사용량을 대폭 줄여 개인용 컴퓨터 환경에서도 원활하게 실행이 가능하다. 챗GPT가 보고서 같은 문서를 생성할 수 있다면 스테이블 디퓨전은 예술적 표현, 상업적 디자인, 광고와 인테리어, 제품 디자인과 설계에 활용할 수 있는 다양한 잠재력을 품고 있다. stability.ai
Semantic Decorder 시멘틱 디코더
지난 5월, 텍사스 오스틴 대학교 연구진이 국제학술지 ‘네이처 뉴로사이언스’에서 뇌의 활동을 분석해 사람의 생각을 읽고 문장을 옮기는 생성형 AI를 발표했다. 이 기능은 기능형 자기공명영상(fMRI) 대형 언어 기술(LLM)을 결합한 것이 특징. 연구진은 실험 대상자에게 긴 이야기를 들려주며 뇌 활동을 스캔해 데이터를 확보했다. 단어 다음에 이어질 단어를 예측하며 단순히 단어를 나열하는 것이 아니라, 요지를 파악해 문장으로 배열하는 알고리즘을 개발한 것이다. 이를테면 갈증이 있는 환자가 말을 하기 위해서 단어나 문장이 아니라, 물 마시는 모습을 연상만 해도 ‘물이 마시고 싶다’라는 글을 생성하는 방식. 우리 뇌의 암호화된 신호를 언어모델로 해독할 수 있게 된 셈이다. 이 기술은 전신마비로 의사소통에 어려움을 겪는 환자들에게 새로운 가능성을 선사할 수 있다. 영화 〈잠수종의 나비〉의 주인공 보비가 이 기술을 사용했다면 감탄하지 않았을까?
■ 관련 기사
- 빈틈 많은 AI 위키피디아①
- 빈틈 많은 AI 위키피디아②
- 빈틈 많은 AI 위키피디아④
- EXAONE 엑사원
- A to Z 빈틈 많은 AI 위키피디아③
-
요즘 뉴스에는 생성형 AI에 관한 소식이 단 하루도 빠지지 않고 등장한다. 새로운 AI 플랫폼 출시, 기존 플랫폼에 접목하거나 버전이 업데이트된 AI 툴, 세계적인 석학이 AI에 관해 언급한 한마디나 글로벌 기업의 AI 투자 뉴스, 아니면 AI가 인간을 어떻게 속이고 있는지를 다루는 흥미로운 뉴스다. 이번 호 ‘A to Z’는 위키피디아 형식을 빌려 현재까지 공개된 AI 툴을 위주로 소개하고, 알아두어야 할 관련 용어, AI가 촉발한 에피소드 등을 첨부했다. 프란치스코 교황이 발렌시아가 패딩을 입고 나타나거나(알파벳 B 참고) 세종대왕이 맥북을 던졌다는(알파벳 K 참고) AI가 만들어내는 환각 현상에 주의하며(알파벳 C 참고) 알파벳별로 큐레이션한 키워드를 면밀하게 살펴보면 당신이 알고 있는 것보다 더 다양한 기능을 접목한 AI 툴이 등장하고 있다는 사실을 알게 될 것이다.Share +바이라인 : 글 월간 〈디자인〉 편집부
디자인하우스 (월간디자인 2023년 7월호) ⓒdesign.co.kr, ⓒdesignhouse.co.kr 무단 전재 및 재배포 금지