http://cloudinsight.net/
https://www.linkedin.com/in/jinyounj
- 머신 러닝 모델을 어떻게 만드는가를 생각했을 때, 누군가 문제를 알려주면 머신러닝이나 코딩 스킬, 수학 스킬을 가지고 해결하면 데이터 사이언티스트라고 생각할 수 있지만 그렇지 않다.
- 제일 중요한 것은 문제를 define할 줄 알아야 한다는 것이다.
- 가공을 하지 않으면 할 수 있는 것이 없음
- 여러 소스에서 모인 데이터들을 가공
- 엑셀로 하지 않고 데이터 사이언스로 하냐?
- 그렇게 만들었다면, 5-6번으로 가면서 이 특강에서 배우고 있는 모델들을 사용하기 시작함.
- 아주 간단한 머신 러닝 알고리즘을 가지고 테스트를 해보면서 인사이트를 얻는 것이다.
- 한 사람이 research~data engineer까지 일한다.
- 5.5에서 6번까지 하지만 현실은 보통 3번 혹은 2번부터 시작을 한다.
학부와 석사와 박사의 차이점
- 보통 6번을 하기 위해서는 Ph.d가 필요하다.
- 문제를 정의한다는 것은 우리 사이트에서 누가 많이 머물고 있다는 것부터 머신러닝까지 끝까지 다해야 하는 것이다.
- 학부 정도의 수준에서는 문제를 정의하는 능력이 부족하다. 논문을 써본 적이 없기 때문이다.
- 그렇기 때문에 그 부분에 대한 이슈가 있고