관리 메뉴

너와 나의 스토리

Andrew Ng - machine learning 정리 [Lecture 1] 본문

Data Analysis/Machine learning

Andrew Ng - machine learning 정리 [Lecture 1]

노는게제일좋아! 2019. 7. 3. 19:31
반응형

강의: www.coursera.org

 

Lecture 1.1 Introduction: Machine Learning

 

Machine Learning: 데이터를 이용해서 컴퓨터를 학습시키는 방법론

Tom이 정의한 머신 러닝: a well-posed learning problem is defined as follows

he says “A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.”

 

Q: Suppose your email program watches which emails you do or do not mark as spam, and based on that learns how to better filter spam. What is the task T in this setting? 1

 1. Classifying emails as spam or not spam. -> T

 2. Watching you label emails as spam or not spam. -> E

 3. The number of emails correctly classified as spam/not spam. -> P

 4. None of the above- this is not a machine learning problem.

 

Machine learning algorithms:

- Supervised learning -> 컴퓨터에게 뭘 할지 알려줌

- Unsupervised learning

 

Others: Reinforcement learning, recommender systems

Also talk about: Practical advice for applying learning algorithms.




Lecture 1.2 Introduction: Supervised Learning

 

Supervised Learning: 데이터에 대한 레이블(Label)- 명시적인 정답- 이 주어진 상태에서 컴퓨터를 학습시키는 방법. (“right answer” given)

 

자료들을 일직성 등과 같은 것으로 연결해서 다음 결과를 예측할 수 있음

 

- Problem 1: Regression problem

  - 연속된 값을 가진 결과를 예측

  - ex) You have a large inventory of identical items. You want to predict how          many of these items will seel over the next 3 months.

 

- Problem 2: Classification problem

  - 0또는 1, 악성 또는 양성처럼 불연속적인 결과 값을 예측하는 것

  - ex) You'd like software to examine individual customer accounts, and for each      account decide if it has been hacked/compromised.

 

● 딥러닝에서 Supervised Learning 방법론으로 주로 사용되는 구조는 CNNs, RNNs이다.




Lecture 1.3 Introduction: Unsupervised Learning

 

Unsupervised Learning: 데이터에 대한 레이블(명시적인 정답)이 주어지지 않는 상태에서 컴퓨터를 학습시키는 방법론. 즉, 데이터 형태로 학습을 진행하는 방법이다.

 

예를 들어,

데이터가 무작위로 분포되어 있을 때, 이 데이터를 비슷한 특성을 가진 세 가지 부류로 묶는 클러스터링(Clustering) 알고리즘이 있다.

 

 

● 비지도 학습은 데이터의 숨겨진 특징이나 구조를 발견하는데 사용됨.

 

- Cocktail party problem algorithm:

 [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x’);

 

반응형
Comments