[질문] 웨비나 정말 잘 보고 있습니다! 데이터를 잘 정제해도 시중에 있는 모델들과 비교하여 대등한 성능을 기대하려면 모델의 크기도 커야하고 모델을 받쳐주는 하드웨어 자원이 필요할 것 같은데 데이터를 어떻게 처리해야 이러한 점들을 커버할 수 있는지 간단한 예시가 있으면 좋을 것 같습니다
물론 크기가 큰 모델이 대체적으로 더 좋은 성능을 내지만, 가장 중요한 것은 데이터라고 볼 수 있습니다. 텍스트 데이터 정제도 중요하며, 각 과제에 맞춰 일관적인 기준으로 라벨링이 진행되어야 좋은 성능을 기대할 수 있습니다. 데이터 처리에 관해서는, 문장의 특정 단어를 동의어로 대체하여 데이터의 양을 늘리는 데이터 증식 기법과 같은 예시가 있을 수 있겠습니다.
[질문] 웨비나 정말 잘 보고 있습니다! 데이터를 잘 정제해도 시중에 있는 모델들과 비교하여 대등한 성능을 기대하려면 모델의 크기도 커야하고 모델을 받쳐주는 하드웨어 자원이 필요할 것 같은데 데이터를 어떻게 처리해야 이러한 점들을 커버할 수 있는지 간단한 예시가 있으면 좋을 것 같습니다