머신러닝 개요
"머신러닝은 데이터를 이해하는 알고리즘의 과학이자 하나의 애플리케이션이다."
머신러닝 학습법




지도 학습 알고리즘으로 학습한 예측 모델은
훈련 데이터 셋에 있는 모든 클래스 레이블을 새로운 샘플에 할당할 수 있어야 합니다.
ex) 손글씨 인식
모든 손글씨 즉 새로운 데이터 셋을 제공하면 모델은 머신러닝 알고리즘을 바탕으로
우리가 쓴 손글씨 알파벳을 예측한다.


입력값 x와 결괏값 y가 주어지면 각 데이터와 직선 사이 거리가 최소가 되는 직선을 그을 수 있는데
일반적으로 평균 제곱 거리를 사용한다.
데이터에서 학습한 직선의 기울기와 절편을 사용하면 머신러닝 알고리즘은 새로운 데이터의
출력 값을 예측할 수 있다.

강화 학습은 보상이 최대화되는 일련의 행동을 학습한다.
ex) 게임 스코어 상승은 보상으로 연결된다.

비지도 학습을 사용하면 출력값이나 보상 함수의 도움 없이도 의미 있는 정보를 추출할 수 있으며
데이터의 구조를 탐색할 수 있게 된다.
비지도학습 - 군집

군집은 사전 정보 없이 쌓여있는 그룹 정보를 의미 있는 서브그룹 또는 클러스터로 조직하는
탐색적 데이터 분석 비법이다.
분석 과정에서 만든 각 클러스터는 어느 정도 유사성을 공유하고 다른 데이터(클러스터)와 구분되는
그룹을 형성한다.
이처럼 군집은 정보를 조직화하고 데이터에서 의미 있는 관계를 유도하는 훌륭한 도구라 할 수 있다.


차원 축소 기법은 대부분의 정보를 유지하면서 더 작은 차원의 부분 공간으로 데이터를 압축시키게 된다.
< AI 5강 >
■ “머신러닝은 데이터를 이해하는 알고리즘의 과학이자, 하나의 어플리케이션이다.”
- 광고성 이메일 필터링
- 손글씨와 음성 인식
- 웹 검색 엔진
- 체스 대결 프로그램
- 군사용 자율 주행 시스템
■ 머신러닝의 하위 유형
□ 지도학습
1. 분류(classification)
가. 이진 분류 : ‘광고성 이메일 필터링’(대표적인 이진 분류, 2개의 클래스 레이블을 가진 경우)에서 광고성 이메일(-) 데이터(클래스)와 일반 메일(+) 데이터(클래스)를 구분하는 규칙을 학습함. 이 규칙을 점선으로 표현하면, 결정경계(decision boundery)라고 함.
나. 다중 분류 : ‘손글씨 인식’, 2개 이상의 클래스(데이터, 변수) 레이블을 분류하는 경우.
2. 회귀(regression) - 데이터가 주어졌을 때, 연속적인 출력값을 예측하는 기법
□ 비지도학습
□ 강화학습


