머신러닝 혹은 딥러닝 모델을 구현하고, 하이퍼파라미터들을 튜닝하고, 그런 작업들을 하다 보니깐, 현타가 왔다….
M이라는 모델과 D라는 데이터셋이 있다고 가정을 했을경우,
D가 M에 적합하다라는 판단을 어떻게 해야하나… 판단을 못하나?
아니면, 무조건 모델을 돌려보고, 측정해 봐야지만 아는건가?
————————————————————————-
모델에 fit하기 전에 데이터 전처리를 하는데,
이 데이터가 신뢰도가 높다라는걸 판단하려면,
모델 학습시킨 다음에 정확도 측정해 봐야지만 아는 건가?

여러분들은,
모델에 데이터를 맞추시나요?
데이터에 모델을 맞추시나요?

이번에 시계열데이터들을 다루면서, 고민이 하나 생겼습니다.

데이터라는게 인간들이 만들어 낸 것들이고, 인간들에게서 영향을 받아서 나온 결과물들이라고 생각합니다.
데이터들이 만들어 질때, 시간에 직/간접적으로 영향을 받았다고 생각이 되는데,
여러분들은 어떻게 생각하시는지 궁금합니다.

예를들어, 아침에 일어나서 AI비서에게 “지금 몇시야?”라고 물어봤다면,
AI는 “이 사람이 오전에 일어나서, 출근하려고 하는구나, 출근시간까지 30분전이니까
서두르세요”라고도 말할수있고, 아니면 단순하게, “몇시 몇분입니다.”라고도 말을 할수가 있는데요.
AI가 판단할때, 보통 오전 시간대에 “지금 몇시야?” 라고 물어보는경우가 회사에 출근하기 위해서 물어보는 경우가 많다라고 학습되어져 있다면, 충분히 가능하다고 생각하는데요…

전자의 경우의 학습에는 “데이터+시간”일 것이고,
후자의 경우의 학습에는 “데이터”만이라고 생각되는데,

이미지분야도 이와같이 “시간”이라는 개념이 추가가 되면, 더 나이스한 결과물들이 나올수도 있다고 생각하는데..
데이터와 시간의 관계(?)에 대해서 어떻게 생각하시나요?

파이썬 라이브러리를 활용한 머신러닝
밑바닥부터시작하는 딥러닝

데이터파이프라인
모델링
데이터분석
코딩

카테고리:

업데이트:

댓글남기기