NN(Neural Network) - backpropagation

Tags more

Archives

관리 메뉴

너와 나의 스토리

Data Analysis/Machine learning

노는게제일좋아! 2019. 7. 29. 20:43

* '핸즈온 머신러닝' 책의 내용을 기반으로 작성

● 퍼셉트론(Perceptron)

● TLU
간단한 선형 이진 분류 문제에 사용할 수 있다.
입력의 선형 조합을 계산해서 그 결과가 임곗값을 넘어서면 양성 클래스를 출력하고 그렇지 않으면 음성 클래스를 출력한다. 여기에 편향 특성이 더해진다.

● 다층 퍼셉트론(Multi-Layer Perceptron) - MLP

● 역전파(backpropagation)

정리

1. 예측 (정방향 계산)

2. 오차 측정

3. 각 층을 거치면서 각 연결이 오차에 기여한 정도 측정 (역방향 계산)

4. 이 오차가 감소하도록 가중치 조금씩 조절

역전판 알고리즘이 쓸 수 있는 활성화 함수(activation function)
- tanh(z), ReLu
- tanh(z): 연속적이고 미분 가능, 출력 범위는 -1부터 1 사이 (로지스틱 함수는 0에서 1사이)
- ReLu(z):
  - max(0,z)
  - 연속적이지만 z=0에서 미분 불가
  - 실제로 잘 작동하고 계산 속도가 빠름
  - 출력에 최대값이 없다. -> 경사 하강법의 일부 문제 완화
경사 하강법의 문제:
- sigmoid 함수는 입력 x가 어느 정도 커지면 항상 1에 가까운 값을 출력하기 때문에, 입력의 변화가 출력에 반영되기 어렵다. 그 결과, 오차 함수의 가중치 매개 변수에 대한 편미분이 0에 가까운 값이되어, 경사 하강법의 학습이 늦어지는 문제가 있다. (vanishing gradient problem)
- layer가 많을 때, 미분 결과를 최초 layer까지 전달하는 것이 힘들다.

Approximate entropy(ApEn) (0)	2019.07.31
Keras 함수 / Numpy 함수 정리 (0)	2019.07.29
tensorflow 기초 및 함수 정리 (0)	2019.07.26
Computer Network Traffic - kaggle 실습 / RNN (0)	2019.07.25
RNN & LSTM & GRU 완벽 정리 (0)	2019.07.25

'Data Analysis/Machine learning' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`