본문 바로가기

728x90
반응형

AI/Computer Vision

(25)
[Computer Vision] DreamBooth 🌈 https://dreambooth.github.io/ 내용을 기반으로 작성된 포스트 입니다... 개요 대규모 T2I 모델은 주어진 텍스트 프롬프트에서 고품질의 다양한 이미지를 합성할 수 있게 함으로써 AI 발전에 괄목할 만한 도약을 이루었다. 그러나 주어진 참조 이미지 세트의 피사체의 모습을 모방하고 다양한 맥락에서 새로운 표현을 합성하는 기능이 부족하다. DreamBooth에서는 T2I 확산 모델의 "개인화"를 위한 새로운 접근 방식을 제시한다. 피사체 이미지 몇 장만(3~5장) 입력하므로써 사전 학습된 T2I 모델을 미세 조정하여 특정 피사체에 고유 식별자를 결합하는 방법을 학습하도록 한다. 고유 식별자를 사용하여 다양한 장면에서 맥락에 맞는 피사체의 완전히 새로운 사실적인 이미지를 합성할 수 있..
[Computer Vision] LoRA(Low-Rank Adaptation) 개요 기존 T2I에서 프롬프트를 통해 "특정 캐릭터의 일러스트" 이미지를 생성하려고 하는 경우. 일반적으로 프롬프트에서 목표 캐릭터의 특징을 나타내는 키워드를 포함하여 해당 캐릭터에 일러스트가 나올때까지 생성을 반복하는 과정이 필요하다. 하지만 이 방법에는 단점이 존재한다. 모델 학습에 포함되지 않은 것 같은 마이너한 캐릭터는 아무리 시도해도 비슷한 수준의 이미지만 생성된다. 목표 캐릭터가 유명 캐릭터일 경우라도 다른 캐릭터가 생성되는 경우가 있다. 목표 캐릭터 이미지를 생성하기 위해 나올 때까지 몇번이든 반복해야한다. 이러한 문제를 해결하기 위해 "기존 모델을 한 캐릭터가 나오도록 조정"하는 Fine-Tuning 필요성이 대두 되었고 "LoRA"가 나오게 되었다. LoRA LoRA(Low-Rank Ad..
[Computer Vision] IP-Adapter GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to generate images with image prompt. - GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is des... github.com 🔥 github 내용과 논문을 기반으로 포스트를 작성하였습니다. https://arxiv.org/abs/2..
[Computer Vision] Control Net Stable Diffusion은 Stability AI에서 Open Source로 배포한 text-to-image 모델이다. 이 Stable Diffusion은 이미지 생성에 있어 놀라운 결과를 보여주었으나 더욱 세부적인 제어가 필요했다. 세부적인 제어를 위해 ControlNet이라는 새로운 기술이 제안되었다. ControlNet을 통해 사용자가 생성 과정을 더욱 세부적으로 제어할 수 있게 되었고, 여러 가지 공간적 컨텍스트를 조건부로 생성에 사용할 수 있도록 지원되어 결과물이 엄청나게 개선되었다. Stable Diffusion의 마지막 결론부분에 대한 단점이 몇가지 있다. 생성된 이미지 중 어색한 표현 같은 디테일이 떨어지는 경우가 있다. 생성된 이미지의 퀄리티가 고퀄리티와 저퀄리티가 섞여 있어 선..
[Computer Vision] Image Segmentation 이미지 처리(Image Processing)의 종류 이미지 처리의 종류는 다음과 같이 분류할 수 있다. 출처 : https://www.superannotate.com/blog/image-segmentation-for-machine-learning Classification - 이미지의 객체가 어떤 것인지 구분하는 것(고양이 인가? 강아지 인가?) Classification + Localization - 이미지의 특정 객체에 Box를 쳐서 그 객체가 어디 있는지 표시(Detection과 구분) Object Detection - 이미지 속 여러개의 객체를 각각 구별하여 각각을 box로 표시 Segmentation - 이미지 속 여러개의 객체를 각각 box가 아닌 정확한 영역으로 표시, 이미지 pixel 전체..

728x90
반응형