본문 바로가기

728x90
반응형

Stable Diffusion

(3)
[Computer Vision] DreamBooth 🌈 https://dreambooth.github.io/ 내용을 기반으로 작성된 포스트 입니다... 개요 대규모 T2I 모델은 주어진 텍스트 프롬프트에서 고품질의 다양한 이미지를 합성할 수 있게 함으로써 AI 발전에 괄목할 만한 도약을 이루었다. 그러나 주어진 참조 이미지 세트의 피사체의 모습을 모방하고 다양한 맥락에서 새로운 표현을 합성하는 기능이 부족하다. DreamBooth에서는 T2I 확산 모델의 "개인화"를 위한 새로운 접근 방식을 제시한다. 피사체 이미지 몇 장만(3~5장) 입력하므로써 사전 학습된 T2I 모델을 미세 조정하여 특정 피사체에 고유 식별자를 결합하는 방법을 학습하도록 한다. 고유 식별자를 사용하여 다양한 장면에서 맥락에 맞는 피사체의 완전히 새로운 사실적인 이미지를 합성할 수 있..
[Computer Vision] IP-Adapter GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to generate images with image prompt. - GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is des... github.com 🔥 github 내용과 논문을 기반으로 포스트를 작성하였습니다. https://arxiv.org/abs/2..
[Computer Vision] Control Net Stable Diffusion은 Stability AI에서 Open Source로 배포한 text-to-image 모델이다. 이 Stable Diffusion은 이미지 생성에 있어 놀라운 결과를 보여주었으나 더욱 세부적인 제어가 필요했다. 세부적인 제어를 위해 ControlNet이라는 새로운 기술이 제안되었다. ControlNet을 통해 사용자가 생성 과정을 더욱 세부적으로 제어할 수 있게 되었고, 여러 가지 공간적 컨텍스트를 조건부로 생성에 사용할 수 있도록 지원되어 결과물이 엄청나게 개선되었다. Stable Diffusion의 마지막 결론부분에 대한 단점이 몇가지 있다. 생성된 이미지 중 어색한 표현 같은 디테일이 떨어지는 경우가 있다. 생성된 이미지의 퀄리티가 고퀄리티와 저퀄리티가 섞여 있어 선..

728x90
반응형