본문 바로가기

728x90
반응형

AI

(92)
[Computer Vision] LoRA(Low-Rank Adaptation) 개요 기존 T2I에서 프롬프트를 통해 "특정 캐릭터의 일러스트" 이미지를 생성하려고 하는 경우. 일반적으로 프롬프트에서 목표 캐릭터의 특징을 나타내는 키워드를 포함하여 해당 캐릭터에 일러스트가 나올때까지 생성을 반복하는 과정이 필요하다. 하지만 이 방법에는 단점이 존재한다. 모델 학습에 포함되지 않은 것 같은 마이너한 캐릭터는 아무리 시도해도 비슷한 수준의 이미지만 생성된다. 목표 캐릭터가 유명 캐릭터일 경우라도 다른 캐릭터가 생성되는 경우가 있다. 목표 캐릭터 이미지를 생성하기 위해 나올 때까지 몇번이든 반복해야한다. 이러한 문제를 해결하기 위해 "기존 모델을 한 캐릭터가 나오도록 조정"하는 Fine-Tuning 필요성이 대두 되었고 "LoRA"가 나오게 되었다. LoRA LoRA(Low-Rank Ad..
[Computer Vision] IP-Adapter GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to The image prompt adapter is designed to enable a pretrained text-to-image diffusion model to generate images with image prompt. - GitHub - tencent-ailab/IP-Adapter: The image prompt adapter is des... github.com 🔥 github 내용과 논문을 기반으로 포스트를 작성하였습니다. https://arxiv.org/abs/2..
[Computer Vision] Control Net Stable Diffusion은 Stability AI에서 Open Source로 배포한 text-to-image 모델이다. 이 Stable Diffusion은 이미지 생성에 있어 놀라운 결과를 보여주었으나 더욱 세부적인 제어가 필요했다. 세부적인 제어를 위해 ControlNet이라는 새로운 기술이 제안되었다. ControlNet을 통해 사용자가 생성 과정을 더욱 세부적으로 제어할 수 있게 되었고, 여러 가지 공간적 컨텍스트를 조건부로 생성에 사용할 수 있도록 지원되어 결과물이 엄청나게 개선되었다. Stable Diffusion의 마지막 결론부분에 대한 단점이 몇가지 있다. 생성된 이미지 중 어색한 표현 같은 디테일이 떨어지는 경우가 있다. 생성된 이미지의 퀄리티가 고퀄리티와 저퀄리티가 섞여 있어 선..
[Computer Vision] Image Segmentation 이미지 처리(Image Processing)의 종류 이미지 처리의 종류는 다음과 같이 분류할 수 있다. 출처 : https://www.superannotate.com/blog/image-segmentation-for-machine-learning Classification - 이미지의 객체가 어떤 것인지 구분하는 것(고양이 인가? 강아지 인가?) Classification + Localization - 이미지의 특정 객체에 Box를 쳐서 그 객체가 어디 있는지 표시(Detection과 구분) Object Detection - 이미지 속 여러개의 객체를 각각 구별하여 각각을 box로 표시 Segmentation - 이미지 속 여러개의 객체를 각각 box가 아닌 정확한 영역으로 표시, 이미지 pixel 전체..
[MLflow] Artifact Store Artifact Store 란 MLflow 에서 학습된 모델을 저장하는 Model Registry로써 이용하기 위한 스토리지 (storage) 서버다. Artifact Store 를 이용하면 기본적인 파일 시스템 보다 체계적으로 관리 할 수 있으며 외부에 있는 스토리지 서버도 사용 할 수 있다는 장점이 있다. 이 포스트에서는 MinIO를 사용해서 Artifact Store을 구축해보겠다. MinIO를 사용하는 이유는 다음과 같다. MinIO 는 S3 를 대체할 수 있는 오픈 소스 고성능 개체 스토리지다. AWS S3 의 API 와도 호환되어 SDK 도 동일하게 사용 할 수 있다. MLflow 에서는 AWS S3 를 모델을 저장하기 위한 스토리지로 사용하도록 권장하고 있기 때문에 MinIO 를 사용한다. ..

728x90
반응형