본문 바로가기

728x90
반응형

AI/기계학습(Machine Learning)

(16)
[기계학습/ML]6. 회귀 알고리즘(1) - K-최근접 이웃 회귀, 선형회귀 박팀장은 도미와 빙어를 성공적으로 분류한 Pupbani에게 다음과 같은 머신러닝 프로그램을 만들라고 했다. "농어의 길이, 높이, 두께 데이터로 농어의 무게를 예측할 수 있는 프로그램을 만들어 주세요." "농어의 무게를 정확하게 측정한 샘플 56개, 농어의 길이, 높이, 두께를 측정한 데이터를 보내줄게요." "이렇게 예측하는 문제를 회귀 문제라고 하더 군요. 부탁합니다." 회귀라는 단어에 힌트를 얻어서 머신러닝 프로그램을 작성해보자. 회귀(Regression) 지도학습은 크게 분류와 회귀로 나뉜다. 분류는 이전에 했던 방식으로 말 그대로 샘플을 몇 개의 클래스 중 하나로 분류하는 것이다. 회귀는 임의의 어떤 숫자를 예측하는 문제이다. 예를 들어 배달이 도착할 시간을 예측하는 것 두 변수 사이의 상관관계를..
[기계학습/ML]5. 데이터 전처리 - 표준점수, 브로드캐스팅 Pupbani는 개발한 모델을 보고하고 실전에 투입해도 된다는 승낙을 받았다. 그런데 며칠 뒤 박 팀장이 Pupbani를 불러서 말했다. "길이가 25cm이고 무게가 150g이면 도미인데 모델은 빙어라고 예측하네요?" Pupbani는 믿을 수 없어 박 팀장이 말한 데이터로 예측을 해봤다. 예측하기 넘파이로 데이터 준비하기 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0..
[기계학습/ML]4. 훈련 세트와 테스트 세트 - 샘플링 편향(Numpy 사용) 지난 시간에 Pupbani는 K-최근접 이웃 알고리즘으로 머신러닝 모델을 만들어 생선을 분류하는 프로그램을 만들었다. 이에 대한 보고서를 작성해 박팀장에게 전달해 보았다. 보고서를 보고 이상한지 박팀장이 다음과 같이 말하였다. "도미 35마리와 14마리를 모두 저장하고 맞추는 거라면 100%를 달성하는게 당연하지 않나요? 어떤 것이 도미이고 빙어인지 알고 있는데 맞추지 못하는 것이 이상한거 같은데..." Pupbani는 이전에 배웠던 머신러닝의 기초부터 다시 곱씹어보면서 이 문제를 해결하기로 결정했다. 머신러닝의 학습 종류 지도학습(Supervised Learning) 데이터와 데이터에 대한 정답이 필요하다. 이전에 사용했던 KNeighborsClassifier도 지도학습 모델이다. 데이터 : 생선의 길..
[기계학습/ML]3. 머신러닝 맛보기 - K-NeighborsClassifier(K-최근접 이웃 분류) 문제 정의 생선을 판매하는 앱 마켓인 "물꼬기" 에서는 생선을 판매하기로 했다. 물류 센터 직원이 생선 이름을 외우지 못해 매번 물어봐서 배송 지연이 발생했다. 이러한 문제를 해결하기 위해 Pupbani는 "생선 이름을 자동으로 알려주는 머신러닝"을 만들어야한다. 판매하는 생선은 "도미", "빙어"이다. 어떻게 분류할까? 생선의 특징(길이, 크기 , 무게 등)을 알면 구분할 수 있을 것 같다. 도미를 잘 아는 박팀장이 와서 "길이가 30cm 보다 크면 다 도미야"라고 했다. if length >= 30 : print("도미") 하지만 30cm 보다 큰 생선을 모두 도미라고 할 수 없다. 기존의 프로그램은 누군가 정해준 기준(ex. 30cm 이상은 도미야)대로 일을 한다. 머신러닝은 누구도 알려주지 않는 ..
[기계학습/ML]2. 실습 환경 - Colab Notebooks 구글 코랩(Colab) 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스이다. 클라우드 기반의 주피터 노트북 개발 환경이라고 생각하면 된다. (.ipynb 형식) 현재 사용하는 컴퓨터의 성능에 상관 없이 구글에서 할당받은 컴퓨팅 파워로 테스트할 수 있다. 구글 드라이브에 노트북 파일이 저장되어 작성했던 파이썬 코드들이 노트북 파일에 저장된다. 인터넷에 연결되어야 하며 코드를 실행할 때 마다 이전 작업들이 초기화된다. 시작하기 먼저 구글 드라이브에 접속한다. (구글 계정 로그인) 접속 후 구글 드라이브에서 노트북 파일을 만들 위치로 가서 노트북 파일을 생성한다. 만약 Google Colaboratory가 보이지 않는 경우에는 확장 기능을 찾아서 설치해주면 된다. 노트북 파일을 생성..

728x90
반응형