훈련 세트와 테스트 세트 (1) 썸네일형 리스트형 [기계학습/ML]4. 훈련 세트와 테스트 세트 - 샘플링 편향(Numpy 사용) 지난 시간에 Pupbani는 K-최근접 이웃 알고리즘으로 머신러닝 모델을 만들어 생선을 분류하는 프로그램을 만들었다. 이에 대한 보고서를 작성해 박팀장에게 전달해 보았다. 보고서를 보고 이상한지 박팀장이 다음과 같이 말하였다. "도미 35마리와 14마리를 모두 저장하고 맞추는 거라면 100%를 달성하는게 당연하지 않나요? 어떤 것이 도미이고 빙어인지 알고 있는데 맞추지 못하는 것이 이상한거 같은데..." Pupbani는 이전에 배웠던 머신러닝의 기초부터 다시 곱씹어보면서 이 문제를 해결하기로 결정했다. 머신러닝의 학습 종류 지도학습(Supervised Learning) 데이터와 데이터에 대한 정답이 필요하다. 이전에 사용했던 KNeighborsClassifier도 지도학습 모델이다. 데이터 : 생선의 길.. 이전 1 다음