안녕하세요. Dataiku 김영석입니다. Dataiku는 자체적으로 학습하여 LLM 모델을 제공하지 않고, 상용 및 오픈소스 LLM을 LLM Mesh기능을 통해 연계하여 제공하고 있습니다. 따라서 데이터 오염 문제는 사용하는 상용 LLM이나 오픈소스 LLM 모델에 종속될 것 같습니다. 자세한 사항은 문의하기를 통해 요청 부탁드립니다.
[질문] VM과 컨데어너의 가장 큰 차이점은 GUEST os의 유무인데 이 GUEST OS가 무겁고 이에 대한 화환성에 문제가 있어서 인것으로 생각되는데 컨테이너가 수만개 만들어서 그것은 관리하기가 어려운데 컨데이터의 구성요소를 좀 더 늘리고 그 수를 줄여서 관리를 좀 더 쉽게 할 수 있는 방안은 없는지요?
[질문] 잘못된 데이터를 학습해서 잘못된 정보가 생성되는 데이터 오염 문제도 생성형 AI의 도입에 있어 큰 장애물이라고 생각되는데요. 혹시 이런 데이터 오염 여부를 확인할수 있는 방법과 데이터 오염이 되었을때 잘못된 데이터만 선별적으로 삭제할 수 있는 방법이 있을까요?