[디지털데일리 이나연기자] 인공지능(AI) 챗봇 '챗GPT' 개발사 오픈AI가 이미지 생성 AI 모델을 25일(현지시간) 공개했다. 텍스트와 이미지를 통합한 첫 모델로서, 오픈AI의 기존 이미지 모델인 '달리(DALL-E)'보다 더 쉽고 정교하게 이미지를 생성한다.
오픈AI는 이날부터 '챗GPT-4o(포오) 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔다. 새로운 모델은 오픈AI 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델이다.
가브리엘 고 오픈AI 멀티모달 담당은 "텍스트에 대한 지능을 가진 GPT-4 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"고 설명했다.
이용자가 앞서 DALL-E를 통해 원하는 이미지를 만들기 위해서는 프롬프트를 하나하나 입력해야 했다. 하지만 새 모델은 이용자 의도를 파악해 이미지를 생성하며 복잡한 요청도 쉽게 수행한다는 특장점이 있다.
기존 AI 이미지 생성 모델들은 훈련되지 않은 데이터에 취약했다. 단순한 자전거 이미지는 잘 생성하지만 '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었다.
오픈AI 측은 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다고 강조했다. '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래 종류와 이름을 정확히 매칭해 생성한다.
기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨가 종종 깨지기도 했지만 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐다.
자연법칙에 관한 이미지도 쉽게 만들어낸다. 무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해 달라고 하면 문구가 들어간 이미지가 보기 쉽게 생성된다.
만화를 그려달라고 하면 대화가 들어간 카툰이 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성한다. 투명 배경도 지원해 강아지 스티커를 만들 때 투명 배경을 요청하면 이를 반영할 수 있고, 비즈니스 로고와 같은 이미지도 투명 배경으로 생성할 수 있다.
오픈AI 측은 "챗GPT-4o 이미지 생성 모델이 이미지를 만들어 낸다는 점에서 기존 달리의 업그레이드 버전이긴 하나, 두 모델 기반 기술이 완전히 다르고 다양한 개선이 이뤄졌다"고 말했다.
이번 모델은 한국어로도 이미지 생성이 가능하다. 이날부터 '챗GPT 프로' 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
"6G 상용화됐다고 말해줘"…AI, 거짓말 시험에 속수무책
2025-03-31 17:57:27소주 도수, 광고규제 때문에 계속 낮아진다? [IT클로즈업]
2025-03-31 17:57:04[DD퇴근길] 김영섭 KT 대표 "AICT 기업으로의 완전한 변화 이룰 것"
2025-03-31 17:30:50‘위험·난잡’ 공중케이블…정부, “올해 200만 해지회선 철거”
2025-03-31 17:04:28“AX가 살길” KT, 수익창출 의지 강조…구조조정·부동산 매각 논란 ‘도마위’(종합)
2025-03-31 14:38:28LG헬로비전, '헬로 리더스 어워드' 개최 …케이블TV 정책 성과 전국에 공유
2025-03-31 13:07:25[DD퇴근길] 김영섭 KT 대표 "AICT 기업으로의 완전한 변화 이룰 것"
2025-03-31 17:30:50"최애와 같이 음악 감상"…위버스, '리스닝 파티' 오픈
2025-03-31 16:29:28팀프레시, 일부 서비스 일시 중단…투자금 납입 지연 영향
2025-03-31 16:13:00오늘의집, 창사 10년 만에 첫 연간 흑자…"신사업·해외 확장 본격화"
2025-03-31 16:12:00무신사, 지난해 연매출 1조원 돌파…영업익 1028억 흑자 전환
2025-03-31 15:37:48명품 플랫폼 '발란', 결국 기업회생절차 신청…"M&A 추진"
2025-03-31 13:53:01