AI (96) 썸네일형 리스트형 [DL/딥러닝] Cross Attention 크로스 어텐션 완전 정복 🧠딥러닝 멀티모달 모델에서 빠질 수 없는 핵심 메커니즘👉 크로스 어텐션이란?크로스 어텐션(Cross Attention)은 트랜스포머(Transformer) 모델에서 사용되는 어텐션 메커니즘 중 하나로, 서로 다른 두 시퀀스 간의 관계를 학습하기 위해 사용됩니다. 예를 들어, 하나의 입력이 텍스트이고, 다른 하나가 이미지인 경우 각각을 독립적으로 인코딩한 후, 두 정보 간의 연관성을 계산하여 상호 작용하는 데 사용됩니다.🧩 왜 크로스 어텐션이 필요한가요?셀프 어텐션(Self Attention)은 한 시퀀스 내 토큰들 간의 관계만 파악합니다. 그러나 실생활 문제에서는 서로 다른 입력 간의 정보 교환이 필요할 때가 많습니다.기계 번역에서 입력 문장(인코더)과 출력 문장(디코더)이.. [딥러닝/DL] Image Embedding Image Embedding 이란?이미지를 고차원 공간에서 저차원 공간으로 변환하는 과정을 의미한다.이 과정에서 이미지의 중요한 특징을 추출하여 벡터 형태로 표현한다.이러한 벡터는 이미지 간의 유사성을 측정하거나, 분류, 검색, 생성 등의 다양한 작업에 활용될 수 있다. 이러한 이미지 임베딩은 주로 딥러닝 기술을 기반으로 한다. 작동 원리일반적으로 CNN 아키텍쳐를 사용하여 이미지 처리한다. CNN을 사용하는 이유는 이미지의 공간적 구조를 고려하여 특징을 추출하는 데 매우 효과적이다.특징 추출 : CNN의 여러 층을 통해 이미지의 저수준 특징(예: 엣지, 텍스처)과 고수준 특징(예: 객체, 장면)을 추출한다.차원 축소 : 추출된 특징을 저차원 벡터로 변환하여 이미지의 임베딩을 생성한다. 이 과정에서 PC.. [Computer Vision] 이미지 유사도 👀 본 예제는 Window10의 VSCode, Python3.11.0로 작성되었습니다. 이미지 유사도는 두 이미지 간의 유사성을 평가하는 개념으로, 주로 컴퓨터 비전 및 이미지 처리 분야에서 사용된다. 이미지 유사도의 측정 방법은 여러 가지가 있으며, 각 방법은 특정한 기준이나 알고리즘을 기반으로 한다. 이미지 유사도를 평가하는 이유는 다양하나 일반적으로 다음과 같은 목적을 가지고 있다.검색 및 추천 시스템 : 이미지 검색 엔진, 추천에 사용되어 사용자가 입력한 이미지와 유사한 이미지를 찾는데 도움을 준다.중복 이미지 탐지 : 웹 사이트나 데이터베이스에서 중복된 이미지를 찾아내기 위해 유사도 측정이 필요하다.이미지 품질 평가 : 이미지의 품질을 평가하거나, 압축 후의 이미지가 원본과 얼마나 유사한지를 .. [Computer Vision] Skeletonization 👀 본 예제는 Window10의 VSCode, Python3.11.0로 작성되었습니다. Skeletonization은 이미지 처리에서 객체의 형태를 단순화하여 그 구조를 나타내는 기법이다. 이 과정은 주로 이진 이미지에서 사용되며, 객체의 윤곽선을 유지하면서 두께를 줄여서 선의 형태로 표현한다. import cv2import numpy as npdef skeletonize(img): """ OpenCV function to return a skeletonized version of img, a Mat object""" # hat tip to http://felix.abecassis.me/2011/09/opencv-morphological-skeleton/ img = img.copy().. [Computer Vision] Segmentation 👀 본 예제는 Window10의 VSCode, Python3.11.0로 작성되었습니다. Segmentation은 영상에서 특정 영역만 추출하는 기능이다. 예를 들어 의료 영상에서 종양을 식별하거나, 자율주행차가 도로와 보행자를 구분하는 데 사용된다. OpenCV에서는 K-Means 또는 Watershed 알고리즘을 통해 Segmentation을 할 수 있다. K-MeansK-Means 클러스터링은 머신러닝 중 하나로 비지도 학습 알고리즘이다.데이터를 K개의 클러스터로 나누는 기법으로 이를 통해 이미지를 색상 기반으로 분할 할 수 있다.import cv2import numpy as npimport randomif __name__ == "__main__": img = cv2.imread("cat.pn.. 이전 1 2 3 4 ··· 20 다음