에이전트 워크플로우에서 반복되는 좁은 작업은 거대 LLM 대신 소형 언어 모델로 처리하는 편이 더 싸고, 빠르고, 다루기 쉽습니다.더 큰 모델이 항상 정답일까요? 챗봇 시대에는 그렇게 보였습니다. 하지만 에이전트 AI에서는 같은 작업이 하루에도 수천 번 반복됩니다. 이때 거대 모델은 비용과 지연이라는 청구서를 매번 똑같이 내밉니다. NVIDIA 연구진은 2025년 논문에서 정반대 결론을 내놓았습니다. 좁고 반복적인 에이전트 작업에는 소형 모델이 충분히 강력하고, 더 적합하며, 더 경제적이라는 것입니다.배경: 에이전트 시대에 왜 모델 크기를 다시 보나에이전트(agent)란 사람이 매번 지시하지 않아도 도구를 호출하고 단계를 스스로 이어가며 목표를 수행하는 AI 시스템을 말합니다. 챗봇과 결정적으로 다른 점..