엔비디아의 텍스트 to 이미지 생성 기술 eDiffi
https://bbs.ruliweb.com/news/board/300006/read/2265194?cate=79&page=2
요약: eDiffi는 즉각적인 스타일 전송 및 단어 기능을 통한 직관적인 페인팅을 통해 전례 없는 텍스트-이미지 합성을 제공하는 차세대 생성 AI 콘텐츠 생성 도구입니다.
텍스트가 주어진 이미지를 합성하기 위한 확산 모델인 eDiffi를 제안합니다. 확산 모델의 행동이 샘플링의 다른 단계에서 다르다는 경험적 관찰에 동기를 부여하여, 우리는 각각 특정 잡음 간격에 대해 전문화된 전문가 잡음 제거 네트워크의 앙상블을 훈련할 것을 제안합니다. 우리 모델은 T5 텍스트 임베딩, CLIP 이미지 임베딩 및 CLIP 텍스트 임베딩을 기반으로 합니다. 우리의 접근 방식은 모든 입력 텍스트 프롬프트에 해당하는 사실적인 이미지를 생성할 수 있습니다. 텍스트-이미지 합성 외에도 (1) 참조 스타일 이미지를 사용하여 생성된 샘플의 스타일을 제어할 수 있도록 하는 스타일 전송 및 (2) "단어를 사용하여 그리기" - 두 가지 추가 기능을 제공합니다. 사용자가 캔버스에 분할 맵을 그려서 이미지를 생성할 수 있는 애플리케이션으로, 원하는 이미지를 염두에 두고 제작할 때 매우 편리합니다.
https://deepimagination.cc/eDiffi/
'Machine Learning > News' 카테고리의 다른 글
엔비디아 Instant NeRF : 정적이미지로 3D 장면 생성기 (0) | 2022.11.12 |
---|---|
'이매진'과 '페나키' : 구글의 AI 비디오 생성기 (0) | 2022.11.12 |
정부, 구글의 데이터셋 공개 및 검색 플렛폼 (0) | 2022.11.12 |
Explain Paper : 논문 읽어주는 GPT-3 서비스 (0) | 2022.11.07 |
알리바바 AI MaaS 플랫폼 모델스코프 공개 (0) | 2022.11.07 |