CoT 데이터는 단순히 정답을 제공하는 것이 아니라, 정답에 도달하는 추론 과정을 함께 학습하도록 설계된 데이터다. 예를 들어 ‘답은 A’에 그치지 않고, ‘추론 근거와 판단 조건을 단계적으로 제시해 결론에 이르는 과정’을 포함한다.
비큐AI 관계자는 “CoT 데이터는 수작업으로 구축하기 어려워, 로우데이터를 기반으로 질의응답과 추론 과정을 생성하고, 상용 고성능 LLM으로 자동 평가해 오답·모순을 제거하는 단계적 검증 체계를 적용했다”며 “이 과정을 통해 고신뢰 데이터만 선별해 학습에 활용했다”고 밝혔다.
이어 “이번 개발은 모델 자체 제작보다, 고품질 CoT 데이터가 성능 향상에 미치는 효과를 검증하는 데 초점을 맞췄다”며 “동일한 원리로 더 큰 파라미터 모델에도 적용 가능한 점이 큰 의미를 가진다”고 덧붙였다.
향후 비큐AI는 RDPLINE을 통해 확보한 대규모 뉴스·미디어 데이터 파이프라인을 기반으로 ‘RDP-N1’을 다양한 서비스 영역에 적용하고, 경량 모델과 고성능 모델을 조합해 성능과 비용을 최적화하는 전략을 추진할 방침이다.









