메모리허브

🤖 소형 언어 모델(SLM)이 에이전트 AI의 미래인 이유

에이전트 워크플로우에서 반복되는 좁은 작업은 거대 LLM 대신 소형 언어 모델로 처리하는 편이 더 싸고, 빠르고, 다루기 쉽습니다.더 큰 모델이 항상 정답일까요? 챗봇 시대에는 그렇게 보였습니다. 하지만 에이전트 AI에서는 같은 작업이 하루에도 수천 번 반복됩니다. 이때 거대 모델은 비용과 지연이라는 청구서를 매번 똑같이 내밉니다. NVIDIA 연구진은 2025년 논문에서 정반대 결론을 내놓았습니다. 좁고 반복적인 에이전트 작업에는 소형 모델이 충분히 강력하고, 더 적합하며, 더 경제적이라는 것입니다.배경: 에이전트 시대에 왜 모델 크기를 다시 보나에이전트(agent)란 사람이 매번 지시하지 않아도 도구를 호출하고 단계를 스스로 이어가며 목표를 수행하는 AI 시스템을 말합니다. 챗봇과 결정적으로 다른 점..

카테고리 없음 2026.06.03

⚡ 확산형 LLM(Diffusion LLM): 토큰을 병렬로 만드는 차세대 모델

자기회귀 모델이 글자를 한 자씩 타이핑한다면, 확산형 LLM은 흐릿한 문장 전체를 한 번에 또렷하게 다듬어 같은 작업을 5배 이상 빠르게 끝냅니다.여러분은 코딩 자동완성이나 챗봇이 답을 한 글자씩 천천히 토해내는 장면을 본 적이 있을 것입니다. 이 느림의 근본 원인은 모델 구조 자체에 있습니다. 그런데 2025년부터 토큰을 한 줄로 나열하지 않고 한 번에 떠올리는 모델이 상용 무대에 올랐습니다. Inception Labs의 Mercury, 구글의 Gemini Diffusion이 대표 사례입니다. 이 글에서는 이 확산형 LLM이 기존 방식과 무엇이 다른지, 속도와 비용 면에서 어떤 이점이 있고 어떤 한계가 남는지를 초보자 기준으로 정리합니다.배경: 왜 속도가 문제인가먼저 토큰이라는 단어부터 정리하겠습니다...

카테고리 없음 2026.06.03

🛡️ AI 에이전트 보안: 프롬프트 인젝션과 MCP 도구 포이즈닝

AI 에이전트가 외부 데이터와 도구를 다루기 시작하면서, 숨겨진 명령 한 줄이 자격증명 탈취로 이어지는 새로운 공격면이 열렸습니다.여러분이 작성한 코드 리뷰 에이전트가 깃 저장소를 여는 순간 셸이 열린다면 어떨까요. 2026년 2월 Check Point Research는 정확히 그런 시나리오를 공개했습니다. 악성 저장소를 클론하기만 해도 코드가 실행됐습니다. 에이전트는 이제 단순히 글을 쓰는 도구가 아닙니다. 외부 데이터를 읽고, 도구를 호출하고, 시스템에 명령을 내립니다. 바로 이 자율성이 공격자에게 가장 매력적인 표적이 됐습니다.배경: 에이전트가 만든 새 공격면AI 에이전트란 목표를 받아 스스로 계획을 세우고 도구를 호출해 실행하는 AI 시스템을 말합니다. 과거 챗봇은 텍스트만 주고받았습니다. 반면 ..

카테고리 없음 2026.06.03

🎬 2026 AI 영상 생성 모델 비교: 내 용도에 맞는 모델 고르기

해상도는 더 이상 변별점이 아닙니다. 2026년 영상 생성 모델 선택은 용도와 비용, 그리고 오디오 처리 방식에서 갈립니다.2026년 상반기, 영상 생성 모델 시장은 1년 전과 완전히 다른 모습입니다. 영상만 만들던 모델들이 이제 소리까지 한 번에 만들고, 4K 해상도는 기본이 되었습니다. 그런데 같은 시기에 OpenAI는 한때 화제였던 Sora를 종료한다고 발표했습니다. 모델이 많아질수록 "어떤 게 제일 좋은가"보다 "내 용도엔 뭐가 맞는가"가 더 중요한 질문이 됩니다. 이 글은 광고, 숏폼, 내러티브, 저비용처럼 목적별로 모델을 고르는 판단 기준을 정리합니다.배경: 2026년 영상 생성 지형의 변화2025년 초만 해도 영상과 오디오를 동시에 만드는 모델은 사실상 없었습니다. 2026년 2월 기준으로는..

카테고리 없음 2026.06.03

🧭 GitHub Spec Kit으로 시작하는 스펙 주도 개발

AI에게 코드를 바로 시키는 대신, 명세를 먼저 쓰고 그 명세가 코드를 만들게 하는 방식이 Spec Kit입니다.AI에게 "이런 앱 만들어줘"라고 던지면 그럴듯한 코드가 나옵니다. 그런데 막상 돌려보면 의도와 미묘하게 어긋나 있습니다. 이 어긋남을 매번 손으로 메우는 일이 AI 코딩의 가장 큰 시간 낭비입니다. GitHub은 이 문제를 "명세를 먼저 쓰는" 방식으로 풀고자 2025년 9월 2일 Spec Kit을 공개했습니다. 9개월 만에 GitHub 스타 10만 8천 개(2026년 6월 2일 기준)를 넘기며 빠르게 확산 중입니다. 이 글은 "왜 필요한가, 어떻게 쓰는가, 어디서 막히는가"를 순서대로 짚습니다.배경: 바이브 코딩의 한계바이브 코딩이란 명세 없이 AI에게 자연어로 기능을 설명하고 나온 코드를..

카테고리 없음 2026.06.03

LLM 환각 줄이기: 실무에서 검증된 7가지 기법

환각은 완전히 없앨 수 없습니다. 하지만 그라운딩, 인용 검증, 불확실성 허용을 겹겹이 쌓으면 위험을 크게 낮출 수 있습니다.LLM을 제품에 붙이면 가장 먼저 부딪히는 문제가 환각입니다. 그럴듯한 문장으로 존재하지 않는 API를 알려 주거나, 사실과 다른 수치를 자신 있게 단언합니다. 더 곤란한 건, 틀린 답일수록 더 그럴듯하게 들린다는 점입니다. 2025년 OpenAI 연구는 이 문제의 뿌리가 모델의 결함이 아니라 우리가 모델을 평가하고 훈련하는 방식에 있다는 것을 보였습니다. 이 글은 환각이 왜 생기는지 먼저 짚고, 실무에서 바로 적용할 수 있는 7가지 감소 기법을 메커니즘과 한계를 함께 정리합니다.환각이란 무엇인가환각(Hallucination)은 LLM이 사실과 다르거나, 주어진 맥락과 어긋나는 내..

400===Dev Library/Machine Learning 2026.06.03

Claude Code Skills 직접 만들기: 나만의 스킬 제작 완전 가이드

SKILL.md 파일 하나면 됩니다. Claude가 알아서 불러 쓰는 재사용 가능한 지침을, 필수 필드와 디렉토리 규칙부터 실전 예제까지 정리합니다.같은 지시를 매번 반복해서 입력하고 있다면, 그건 스킬로 만들 신호입니다. Claude Code의 Agent Skills는 자주 쓰는 작업 방식을 파일로 묶어 두고, 필요할 때 Claude가 알아서 꺼내 쓰게 하는 기능입니다. 그런데 막상 만들려고 하면 SKILL.md에 무슨 필드를 넣어야 하는지, 어디에 둬야 인식되는지, 명령어나 서브에이전트와는 뭐가 다른지 헷갈립니다. 이 글은 공식 문서를 기준으로 스킬의 구조와 위치, 작성 원칙을 정리하고, 따라 만들 수 있는 최소 예제를 보여 줍니다.스킬이란, 무엇과 다른가Agent Skills는 Claude의 기능을..

400===Dev Library/Claude 2026.06.03

벡터 데이터베이스 비교 2026: pgvector vs Qdrant vs Pinecone vs Weaviate

정답은 "가장 빠른 DB"가 아니라 "내 상황에 맞는 DB"입니다. 네 가지 대표 선택지를 운영 모델과 비용 구조 중심으로 비교합니다.RAG를 만들기 시작하면 곧바로 마주치는 질문이 있습니다. 벡터를 어디에 저장할 것인가. 검색해 보면 벤치마크 그래프가 쏟아지지만, 정작 실무 결정에 필요한 건 "초당 몇 개 쿼리"보다 "우리 팀이 운영할 수 있는가"입니다. 이 글은 가장 많이 검토되는 네 가지, pgvector, Qdrant, Pinecone, Weaviate를 운영 모델과 비용, 그리고 어떤 상황에 적합한지를 기준으로 비교합니다. 가격은 자주 바뀌므로, 구체적인 숫자는 발행 전 각 공식 페이지에서 다시 확인해야 합니다.왜 벡터 DB를 따로 고민해야 하는가벡터 DB는 임베딩(텍스트나 이미지를 숫자 벡터로..

500===Dev Database/VectorDB 2026.06.03

MCP 서버 직접 만들기: 처음부터 끝까지 따라하는 튜토리얼

공식 Python SDK로 도구 하나짜리 MCP 서버를 만들고, Inspector로 검증한 뒤 Claude에 연결하는 전 과정을 정리합니다.MCP를 쓰는 글은 많은데, 직접 서버를 만들어 보는 글은 의외로 적습니다. 막상 시작하면 SDK 버전이 바뀌어 예제 코드가 동작하지 않거나, Claude에 연결하는 설정에서 막히는 경우가 흔합니다. 이 글은 2026년 6월 기준 공식 문서를 따라, 도구(tool) 하나를 노출하는 최소 MCP 서버를 만들고 검증해 Claude에 붙이는 과정을 단계별로 보여 줍니다. 파이썬을 주 언어로 쓰되, 타입스크립트 버전도 함께 짚습니다. 따라 하다 막히는 지점과 보안 주의점까지 담았습니다.MCP가 해결하는 문제MCP(Model Context Protocol, 모델 컨텍스트 프로..

400===Dev Library/MCP 2026.06.03

프롬프트 인젝션과 AI 에이전트 보안: 실무자를 위한 방어 가이드 2026

프롬프트 인젝션은 LLM의 구조적 한계라 100% 막을 수 없습니다. 핵심은 "차단"이 아니라 피해 반경을 줄이는 심층 방어입니다.AI 에이전트를 사내에 붙이는 순간, 보안의 무게중심이 바뀝니다. 챗봇이 엉뚱한 답을 하는 것과, 메일을 읽던 에이전트가 비공개 저장소를 통째로 외부에 흘리는 것은 차원이 다른 문제입니다. 2025년에 공개된 GitHub MCP 유출, Microsoft 365 Copilot의 제로클릭 취약점은 모두 같은 뿌리에서 나왔습니다. 바로 프롬프트 인젝션입니다. 이 글은 프롬프트 인젝션이 정확히 무엇이고, 에이전트 환경에서 왜 더 위험해지며, 실무에서 어떤 방어선을 쳐야 하는지를 정리합니다. 결론부터 말하면, 완벽한 차단은 없습니다. 그래서 설계가 중요합니다.프롬프트 인젝션이란 무엇인..

700===Dev Util/Agents 2026.06.03

메모리허브

전체 글 1067

티스토리툴바