'Data Analysis' 카테고리의 글 목록 (10 Page)

Recent Posts

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

관리 메뉴

목록Data Analysis (88)

너와 나의 스토리

Neural Network - 모두를 위한 딥러닝

출처: https://www.youtube.com/watch?v=oFGHOsAYiz0&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=29&t=0s 모두를 위한 딥러닝 시즌 1 - ML lab 09-1: Neural Net for XOR XOR X = A ⊕ B - A != B -> X=1 - A == B -> X=0 Neural Net hypothesis 세울 때 이렇게 바로 1단계로 세우는 것이 아니라 처음 세운 것을 layer1로 하고, 한 번도 이 작업을 수행하는데 이때 입력으로 layer1을 넣어준다. 이렇게 out을 많이 하는 것을 wide하다고 하는데, 이렇게 하면 성능은 좋아지나 in에 비해 out이 이렇게 만게는 잘 안함

Data Analysis/Machine learning 2019. 7. 17. 13:28

Data stream & Online Machine Learning

출처: https://medium.com/analytics-vidhya/data-streams-and-online-machine-learning-in-python-a382e9e8d06a 빅데이터 특징 - Volume: 데이터 크기 - Velocity: 데이터가 생성되거나 데이터 파이프 라인을 통해 공유되는 속도 - Variety 빅데이터의 속도(velocity) 속성에 초점을 맞춰서 설명. 파이썬에서 어떻게 데이터 스트림을 다루고, 들어오는 데이터 스트림에 적응하기 위해 온라인 러링 기술을 사용한 머신 러닝 모델을 훈련시킬 수 있을까 ? 전통적인 머신 러닝 프로세스는 정적인 입력 데이터 파일로 시작된다. Supervised learning process 1. 프로세스는 입력 파일로 라벨이 포함된 정적 데..

Data Analysis/Machine learning 2019. 7. 16. 21:56

QRF(Quantile regression forest)

출처: https://towardsdatascience.com/quantile-regression-from-linear-models-to-trees-to-deep-learning-af3738b527c3 출처: https://blog.datadive.net/prediction-intervals-for-random-forests/ 출처: https://en.wikipedia.org/wiki/Quantile_regression Quantile Regression Forest - 의사 결정 트리 기반 방법에 대한 신뢰 구간을 찾는 일반적인 방법 - 아이디어: 숲의 각 나뭇잎에 반응 변수의 평균 값을 기록하는 대신 잎에 관찰된 모든 반응을 기록한다. 예측은 응답 변수의 평균뿐만 아니라 모든 x에 대한 응답 값의 ..

Data Analysis/Machine learning 2019. 7. 15. 15:40

RNN(Recurrent Neural Network)

출처: http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/ 출처: https://aikorea.org/blog/rnn-tutorial-1/ 출처: https://www.youtube.com/watch?v=-SHPG_KMUkQ&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=41 * Neural Network 먼저 이해하면 좋아요 NN/CNN은 RNN의 기본 아이디어 - 순차적인 정보를 처리한다 - 출력이 이전 계산에 의존하여 시퀀스의 모든 요소에 대해 동일한 작업을 수행 -> recurrent ex) 문장에서 다음에 나올 단어를 추측하고 싶다면 이전에 나온..

Data Analysis/Machine learning 2019. 7. 11. 17:57

ARIMA(autoregressive integrated moving average)란?

Time series 시계열(time series): 일정 시간 간격으로 배치된 데이터들의 수열을 말한다. 시계열 분석(time series analysis): 이런 시계열을 해석하고 이해하는데 쓰이는 여러 가지 방법을 연구하는 분야 시계열 예측(time series prediction): 주어진 시계열을 보고 수학적인 모델을 만들어서 미래에 일어날 것들을 예측하는 것을 뜻하는 말. ARIMA 시계열 데이터 기반 분석 기법 과거 지식이나 경험을 바탕으로 한 행동에 따라 경제가 움직이고 있음을 기초로 한다. 시계열 정보 -> 규칙성을 가지는 패턴과 불규칙한 패턴의 결합 규칙성을 만드는 패턴 자기 상관성(Autocorrelativeness): 이전의 결과와 이후의 결과 사이에서 발생 오차항끼리 서로 상관되지..

Data Analysis/Machine learning 2019. 7. 11. 14:39

Forecasting at Uber

출처: https://eng.uber.com/forecasting-introduction/ Uber의 예측 솔루션을 위한 세 가지 기술 (표준 통계 알고리즘 외) - Marketplace forecasting: 사용자의 공급과 수요를 임시로세분화된 방식으로 예측하여 운전자들이 발생하기 전에 높은 수요 지역으로 유도함으로써 이들의 트립 수와 수익을 증가시킬 수 있음 - Hardware capacity planning: 하드웨어 공급이 작으면 운영 중단이 발생하여 사용자 신뢰가 저하될 수 있지만, 과도한 공급은 비용이 많이 들 수 있다. - Marketing: 트랜드, 계절성 등을 제어하면서 다양한 미디어 채널의 한계 효과에 대해 이해하는 것이 중요하다. (예: 경쟁 또는 가격) 고급 예측 방법론을 활용하여..

Data Analysis/Machine learning 2019. 7. 11. 14:02

jupyter notebook [anaconda, tensorflow]

jupyter notebook에서 코드 작동 시키는 법 1. anaconda prompt켜서 다음 명령어 치기 activate tensorflow35

Data Analysis/Machine learning 2019. 7. 5. 14:40

Andrew Ng - machine learning 정리 [Lecture 4]

강의: www.coursera.org Lecture 4 Linear Regression With Multiple Variables Multiple feature 함수 n=feature개수 다중 변수인 경우 Xj의 각 값이 반영된다. GD: Feature Scaling idea: Make sure features are on a similar scale. x1과 x2의 값 차이가 많이 나면 왼쪽처럼 얇고 긴 타원 모양이되고, gradient descent의 최적값 찾는 경로가 복잡하고 많이 이동하게 된다. 오른쪽 같은 경우는 x1과 x2가 비슷하다. 이처럼 각 변수 값이 일정해지면 , gradient descent의 최적값을 짧은 경로로 쉽게 찾을 수 있다. Feature Scaling -> 모든 feat..

Data Analysis/Machine learning 2019. 7. 3. 22:19

Prev 1 ··· 7 8 9 10 11 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

너와 나의 스토리

목록Data Analysis (88)

너와 나의 스토리

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역