[디지털데일리 이나연 기자] 카카오브레인이 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 인공지능(AI) 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 10일 공개했다.
칼로 2.0은 약 3억장 규모의 텍스트-이미지 데이터셋을 학습한 초거대 AI 아티스트다. 카카오브레인에 따르면 칼로 2.0은 글로벌 최고 수준 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다. 예를 들어 ‘밝은 파란 눈동자를 가진 고양이 (A cat has light blue eyes)’와 같은 복잡한 프롬프트(명령어)를 입력해도 이를 명확히 이해하고 그려낼 수 있다.
칼로 2.0 해상도는 최대 2048x2048을 지원한다. 생성하는 이미지 해상도가 높을수록 다양한 이미지 크기로 작업이 가능해 사용자는 표현하려는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있게 됐다.
그뿐만 아니라 이미지상 공간감, 입체감, 동물의 털과 같은 질감을 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축돼, 3초 만에 사용자가 원하는 이미지를 만들어 낼 수 있다.
또한 카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0 오픈 응용프로그램 인터페이스(API)를 카카오디벨로퍼스에 공개했다. 기존 칼로 1.4 모델로 제공하던 오픈 API를 칼로 2.0 모델로 업그레이드한 것이다. 칼로 2.0은 기존 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 프롬프트 이해도와 더불어 부정 명령어(Negative Prompt) 기능을 통해 이미지 생성 때 제외해야 하는 표현이나 키워드를 사전에 제어한다.
카카오브레인은 칼로 2.0 오픈 API를 선보이면서, 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만장까지 대폭 확대했다. 일반 스타트업 기업 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대해 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 취지다.
김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준 이미지를 생성하는 동시에 다양한 사용자 니즈를 반영할 수 있는 이미지 생성 모델로 발전시킬 것”이라고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
SKT, 취약계층 방문 서비스 다음주부터 시작…"유통망 소통체계 강화"
2025-05-14 11:11:42KT, AI로 보안서비스 강화 “디도스 막고, 피싱메일 탐지”
2025-05-14 10:11:08SKT 해킹 피해…SK그룹, '정보보호혁신특별위원회' 신설
2025-05-14 09:16:37이재명 1호 공약 실현한다…민주당 정보통신위원회, LGU+ 평촌메가센터 방문
2025-05-13 13:47:25SKT 1분기 설비투자, 3사 중 가장 적어…“정보보호 투자 소홀과 무관”
2025-05-13 11:55:30통신3사 ‘갤럭시S25 엣지’ 사전예약 실시…“SKT는 기기변경만”
2025-05-13 10:41:03VFS–소니 픽소몬도, 가상 프로덕션 전문가 양성 맞손
2025-05-14 11:04:27“아이온2, 리니지 라이크와는 달라”…엔씨가 내년 매출 목표 내세운 이유(종합)
2025-05-14 10:51:08펄어비스 1분기 실적 아쉽지만…‘붉은사막’ 기대감이 더 커진 이유(종합)
2025-05-14 09:05:38엔씨소프트, 올 1분기 영업익 52억원…전년比 80% 급감
2025-05-14 08:47:01펄어비스, 올 1분기 영업손실 52억원…전년比 적자 전환
2025-05-14 08:46:45