Simple Linear Regression 예제 작성 (온도 & 오존량) 생각보다 잘 학습이 안되고 예측값도 엉망이다. sklearn을 이용해서 학습시키고 그 결과를 비교해보았다. 데이터 전처리가 미흡했기 때문. 데이터 전처리 1. 결측치 처리 2. 이상치 처리 (tukey outlier, z-score) 3. 정규화 처리 (Normalization) 4. 학습에 필요한 feature들을 선별해서 학습이 더 잘 이루어 지도록. 새로운 feature를 만들어서 학습에 응용하는 작업. import numpy as np import pandas as pd from my_library.machine_learning_library import numerical_derivative import matplotlib..
SQL - SELECT 1. 모든 레코드 조회하기 SELECT * FROM ANIMAL_INS ORDER BY ANIMAL_ID 2. 역순 정렬하기 SELECT NAME, DATETIME FROM ANIMAL_INS ORDER BY ANIMAL_ID DESC 3. 아픈 동물 찾기 SELECT ANIMAL_ID, NAME FROM ANIMAL_INS WHERE INTAKE_CONDITION = 'Sick' ORDER BY ANIMAL_ID; 4. 어린 동물 찾기 SELECT ANIMAL_ID, NAME FROM ANIMAL_INS ORDER BY ANIMAL_ID; 5. 동물의 아이디와 이름 SELECT ANIMAL_ID, NAME FROM ANIMAL_INS ORDER BY ANIMAL_ID; 6. 여러..
numerical_derivative() 함수를 모듈로 저장하여 import하여 쓰기 경로 추가 방법 C:\my_libraryw\machine_learning_library.py에 numerical_derivative()를 정의했다면, 해당 폴더의 위치를 환경 변수 PYTHONPATH에 추가해준다. 동적으로 경로 추가 방법 sys.path.append()에 경로 삭제 sys는 시스템 정보에 접근할 때 사용하는 모듈이다. 리스트 형태로 되어 있으며, 모듈을 불러 올 때 해당 리스트에 등록된 경로들을 순차적으로 탐색하여 불러온다. Regreesion Model과 최소 제곱법, Gradient Descent Algorithm (경사 하강법) Simple Linear Regression 온도에 따른 오존량 예측..
Machine Learning에서의 Regression y = ax + b => H = Wx + b a 기울기, b 절편 => W Weight, b bias Hypothesis와 최소 제곱법 y = Wx + b 에서, 초기 w, b 값은 랜덤으로 추출한다. 오차 (error)를 이용해서, 해당 직선이 데이터를 잘 표현하고 있는지 수치화한다. 오차 : 실제 값에서 예측값을 뺀다. 오차의 합이 작으면 좋은 직선 최소 제곱법 (least squared method) 이용 오차들을 각각 제곱해서 평균을 구한다. loss function (손실 함수) loss function y = Wx + b의 값이 작을 수록 좋다. loss function의 값을 최소로 만드는 W, b값을 찾는다. 이때의 W, b가 만드는 ..
지도 학습이란, 학습된 결과를 바탕으로 미래의 무엇을 예측하느냐에 따라 크게 2가지로 구분된다. 1) Regression 1-1) Linear Regression Training Data Set를 이용해서 학습된 결과를 만들고 연속적인 숫자값을 예측하는 것 1-2) Logistic Regression 2) Classification 2-1) binary classification 2-2) multinomial classification 문제를 단순화시켜서 다음의 데이터를 이용해 보자 공부시간 (x), 시험시간 (t)를 이용해서 데이터를 표현해 보자. 이 데이터를 2차원 평면에 scatter (산점도)를 이용해서 표현해보자. import numpy as np import pandas as pd import..
수치미분쪽으로 들어가자 미분에 대한 정의 어떤 함수의 정의역 속 각 점에서, 독립 변수의 값의 변화량과 함수값의 변화량 비율의 극한 혹은 극한의 집합 치역으로 가지는 새로운 함수 이런 새로운 함수를 구할 수 있는데 이를 미분/ derivate라고 한다. 이런 미분 함수 (도함수)를 구하는 작업을 미분법/ differentiation이라고 한다. 미분은 함수에 있어서 특정 순간의 변화량을 의미한다. x값 에서의 작은 변화가 함수 f(x)를 얼마나 변화시키는가 중앙차분방법 가장 정확한 값 도출 전진차분방법 후진차분방법 입력으로 들어오는 x에서 아주 미세하게 값이 변화할 때 함수 f는 얼마나 변하는가 수치적으로 계산해서 return 일변수 함수 -> 입력되는 값이 Scalar 이변수 함수 Python은 일급함..
용어 정리 AI > Machine Learning > Deep Learning 1. AI 인간이 가지고 있는 학습능력, 응용력, 추론능력 컴퓨터를 통해서 구현하고자하는 가장 포괄적인 개념 방법은 고려 x 2. Machine Learning AI를 구현하는 하나의 방법론 데이터를 이용해서, 데이터의 특성과 패턴을 학습하고, 그 결과를 바탕으로 미지의 데이터에 대한 미래 결과를 예측하는 프로그래밍 기법 Machine Learning을 구현하기 위한 방법 Regression, SVM (Support Vector Machine), Random Forest, Decision Tree, Neural Network (신경망), Clustering, Reinforecement Learning (강화학습) .. Regr..