logistic regression (3) 썸네일형 리스트형 [Pytorch] 연습 데이터로 라이브러리 익숙해지기1 MNIST 데이터 실습 먼저 데이터를 MNIST 데이터를 가져와보자. MNIST 데이터는 손글씨(0~9)의 흑백 이미지로 구성된 데이터이다. 데이터를 가져올 주소 https://github.com/pytorch/tutorials/raw/main/_static/ file name : mnist.pkl.gz 가져온 데이터는 python pickle 파일 이기 때문에 이를 풀어 우리가 원하는 Python 데이터로 바꿔보자. # 1. Data Load import pickle import gzip PATH = input("파일 경로 입력:") FILENAME = "/mnist.pkl.gz" with gzip.open((PATH+FILENAME), "rb") as f: ((x_train, y_train), (x_.. [Coursera] 2. Logistic Regression 🥑 Coursera의 "Neural Networks and Deep Learning" 강좌의 내용을 배우면서 개인적으로 정리한 내용입니다. Logistic Regression 이란? 어떤 데이터가 범주에 속할 확률을 0~1 사이의 값으로 예측하고 그 확률에 따라 가능성 높은 범주에 속하는 것으로 분류하는 지도학습 알고리즘이다. Logistic Regression 계산 Logistic Regression은 각 속성의 값에다가 계수(coefficient)에 각 곱하고 절편(intercept)을 더해서 예측 값을 구하고 여기에 Log-odds라는 것을 구해야한다. Log-odds는 사건이 발생할 확률을 발생하지 하지 않을 확률로 나눈 값인 odds에 log를 취한 값이다. # Log-Odds = log(사건이.. [기계학습/ML]8. 회귀 알고리즘(3) - 로지스틱 회귀 이제 Pupbani는 회귀 문제를 다룰 수 있고 특성값을 전처리하거나 특성을 조합해 새로운 특성을 만들 수 있게 되었다. 어느날 마케팅 팀에서 Pupbani에게 다음과 같은 요청을 했다. "7개의 생선이 랜덤하게 들어 있는 럭키백 이벤트를 진행할 것인데 이 럭키백에 있는 생선들이 나올 확률을 구해주세요!" "생선의 무게 ,길이, 높이, 두께, 대각선 길이 데이터도 같이 드릴게요!" Pupbani는 새로운 과제에 대해 생각에 잠겼다. 갑자기 번뜩이는 아이디어가 떠올랐다. K-최근접 이웃은 주변 이웃을 찾아주니까 이웃의 클래스 비율을 확률이라고 출력하면 되지 않을까? 사각형이 나올 확률 30% 원이 나올 확률 20% 삼각형이 나올 확룰 50% 사이킷런의 K-최근접 이웃 분류기로 하면 될 것 같다. 데이터 준.. 이전 1 다음