Autopilot 을 사용하시면 결과물중에 하나가 전처리을 진행할 수 있는 Notebook 파일이 생성됩니다. 당연히 데이터셋마다 Notebook 파일의 내용이 바뀌겠죠. 이런 경험들은 이런 결과물을 보시거나 책/Kaggle 등에서 많이 보시고 고민하고 하셔야 하는 부분이라고 판단됩니다.
(고수분들의) 많은 분들의 의견이 실제 훈련은 중요하지 않고 데이터를 찾고 전처리 하는것이 가장 중요하고 그것이 80% 이상의 작업이라는 말씀을 많이 하십니다.
[질문] Data Preparation에 사실 많은 시간이 소요되는데, 이를 위한 노하우나 지원 도구들이 어떤 것들이 있을까요?