일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- JanusGateway
- 헥사고날아키텍처 #육각형아키텍처 #유스케이스
- mp4fpsmod
- 달인막창
- preemption #
- 개성국밥
- 오블완
- 티스토리챌린지
- terminal
- vfr video
- JanusWebRTCServer
- VARCHAR (1)
- Spring Batch
- PersistenceContext
- kotlin
- taint
- k8s #kubernetes #쿠버네티스
- PytestPluginManager
- 깡돼후
- 자원부족
- 겨울 부산
- Value too long for column
- JanusWebRTCGateway
- table not found
- python
- 코루틴 컨텍스트
- pytest
- 코루틴 빌더
- tolerated
- JanusWebRTC
목록Data Analysis (88)
너와 나의 스토리

출처: https://www.youtube.com/watch?v=oFGHOsAYiz0&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=29&t=0s 모두를 위한 딥러닝 시즌 1 - ML lab 09-1: Neural Net for XOR XOR X = A ⊕ B - A != B -> X=1 - A == B -> X=0 Neural Net hypothesis 세울 때 이렇게 바로 1단계로 세우는 것이 아니라 처음 세운 것을 layer1로 하고, 한 번도 이 작업을 수행하는데 이때 입력으로 layer1을 넣어준다. 이렇게 out을 많이 하는 것을 wide하다고 하는데, 이렇게 하면 성능은 좋아지나 in에 비해 out이 이렇게 만게는 잘 안함

출처: https://medium.com/analytics-vidhya/data-streams-and-online-machine-learning-in-python-a382e9e8d06a 빅데이터 특징 - Volume: 데이터 크기 - Velocity: 데이터가 생성되거나 데이터 파이프 라인을 통해 공유되는 속도 - Variety 빅데이터의 속도(velocity) 속성에 초점을 맞춰서 설명. 파이썬에서 어떻게 데이터 스트림을 다루고, 들어오는 데이터 스트림에 적응하기 위해 온라인 러링 기술을 사용한 머신 러닝 모델을 훈련시킬 수 있을까 ? 전통적인 머신 러닝 프로세스는 정적인 입력 데이터 파일로 시작된다. Supervised learning process 1. 프로세스는 입력 파일로 라벨이 포함된 정적 데..
출처: https://towardsdatascience.com/quantile-regression-from-linear-models-to-trees-to-deep-learning-af3738b527c3 출처: https://blog.datadive.net/prediction-intervals-for-random-forests/ 출처: https://en.wikipedia.org/wiki/Quantile_regression Quantile Regression Forest - 의사 결정 트리 기반 방법에 대한 신뢰 구간을 찾는 일반적인 방법 - 아이디어: 숲의 각 나뭇잎에 반응 변수의 평균 값을 기록하는 대신 잎에 관찰된 모든 반응을 기록한다. 예측은 응답 변수의 평균뿐만 아니라 모든 x에 대한 응답 값의 ..

출처: http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/ 출처: https://aikorea.org/blog/rnn-tutorial-1/ 출처: https://www.youtube.com/watch?v=-SHPG_KMUkQ&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=41 * Neural Network 먼저 이해하면 좋아요 NN/CNN은 RNN의 기본 아이디어 - 순차적인 정보를 처리한다 - 출력이 이전 계산에 의존하여 시퀀스의 모든 요소에 대해 동일한 작업을 수행 -> recurrent ex) 문장에서 다음에 나올 단어를 추측하고 싶다면 이전에 나온..
Time series 시계열(time series): 일정 시간 간격으로 배치된 데이터들의 수열을 말한다. 시계열 분석(time series analysis): 이런 시계열을 해석하고 이해하는데 쓰이는 여러 가지 방법을 연구하는 분야 시계열 예측(time series prediction): 주어진 시계열을 보고 수학적인 모델을 만들어서 미래에 일어날 것들을 예측하는 것을 뜻하는 말. ARIMA 시계열 데이터 기반 분석 기법 과거 지식이나 경험을 바탕으로 한 행동에 따라 경제가 움직이고 있음을 기초로 한다. 시계열 정보 -> 규칙성을 가지는 패턴과 불규칙한 패턴의 결합 규칙성을 만드는 패턴 자기 상관성(Autocorrelativeness): 이전의 결과와 이후의 결과 사이에서 발생 오차항끼리 서로 상관되지..
출처: https://eng.uber.com/forecasting-introduction/ Uber의 예측 솔루션을 위한 세 가지 기술 (표준 통계 알고리즘 외) - Marketplace forecasting: 사용자의 공급과 수요를 임시로세분화된 방식으로 예측하여 운전자들이 발생하기 전에 높은 수요 지역으로 유도함으로써 이들의 트립 수와 수익을 증가시킬 수 있음 - Hardware capacity planning: 하드웨어 공급이 작으면 운영 중단이 발생하여 사용자 신뢰가 저하될 수 있지만, 과도한 공급은 비용이 많이 들 수 있다. - Marketing: 트랜드, 계절성 등을 제어하면서 다양한 미디어 채널의 한계 효과에 대해 이해하는 것이 중요하다. (예: 경쟁 또는 가격) 고급 예측 방법론을 활용하여..
jupyter notebook에서 코드 작동 시키는 법 1. anaconda prompt켜서 다음 명령어 치기 activate tensorflow35

강의: www.coursera.org Lecture 4 Linear Regression With Multiple Variables Multiple feature 함수 n=feature개수 다중 변수인 경우 Xj의 각 값이 반영된다. GD: Feature Scaling idea: Make sure features are on a similar scale. x1과 x2의 값 차이가 많이 나면 왼쪽처럼 얇고 긴 타원 모양이되고, gradient descent의 최적값 찾는 경로가 복잡하고 많이 이동하게 된다. 오른쪽 같은 경우는 x1과 x2가 비슷하다. 이처럼 각 변수 값이 일정해지면 , gradient descent의 최적값을 짧은 경로로 쉽게 찾을 수 있다. Feature Scaling -> 모든 feat..