본문 바로가기
Machine Learning/News

eDiffi : NVIDIA의 text to image

by Physicist 2022. 11. 12.

 엔비디아의 텍스트 to 이미지 생성 기술 eDiffi
https://bbs.ruliweb.com/news/board/300006/read/2265194?cate=79&page=2

요약: eDiffi는 즉각적인 스타일 전송 및 단어 기능을 통한 직관적인 페인팅을 통해 전례 없는 텍스트-이미지 합성을 제공하는 차세대 생성 AI 콘텐츠 생성 도구입니다.

텍스트가 주어진 이미지를 합성하기 위한 확산 모델인 eDiffi를 제안합니다. 확산 모델의 행동이 샘플링의 다른 단계에서 다르다는 경험적 관찰에 동기를 부여하여, 우리는 각각 특정 잡음 간격에 대해 전문화된 전문가 잡음 제거 네트워크의 앙상블을 훈련할 것을 제안합니다. 우리 모델은 T5 텍스트 임베딩, CLIP 이미지 임베딩 및 CLIP 텍스트 임베딩을 기반으로 합니다. 우리의 접근 방식은 모든 입력 텍스트 프롬프트에 해당하는 사실적인 이미지를 생성할 수 있습니다. 텍스트-이미지 합성 외에도 (1) 참조 스타일 이미지를 사용하여 생성된 샘플의 스타일을 제어할 수 있도록 하는 스타일 전송 및 (2) "단어를 사용하여 그리기" - 두 가지 추가 기능을 제공합니다. 사용자가 캔버스에 분할 맵을 그려서 이미지를 생성할 수 있는 애플리케이션으로, 원하는 이미지를 염두에 두고 제작할 때 매우 편리합니다.

https://deepimagination.cc/eDiffi/