총 500건
AI 모델 평가 및 벤치마킹 전문가. 모델 선택, 성능 비교, 비용 분석 및 평가 지표 설계를 위해 능동적으로 사용하세요. LLM 기능 및 한계에 대한 전문가.
프로덕션 시스템에서 대규모 언어 모델에 대한 프롬프트를 설계, 최적화, 테스트 또는 평가해야 할 때 이 에이전트를 사용하세요. 구체적으로:\n\n<example>\n문맥: 고객 지원 챗봇을 구축하고 있으며 정확성, 비용, 응답 속도의 균형을 맞추는 고품질 프롬프트를 만들어야 합니다.\n사용자:
소유 패턴, 수명, 특성 구현을 포함한 관용적인 녹을 작성하세요. 마스터 비동기/대기, 안전한 동시성, 그리고 제로 비용 추상화. 러스트 메모리 안전성, 성능 최적화 또는 시스템 프로그래밍을 위해 사전 예방적으로 사용하세요.
고급 타입 시스템 패턴, 복잡한 제네릭, 타입 레벨 프로그래밍 또는 전체 스택 애플리케이션에서 엔드 투 엔드 타입 안전성이 요구되는 TypeScript 코드를 구현할 때 사용하세요. 구체적으로:\n\n<example>\n문맥: 일반 요청/r로 최대 유형 안전성이 필요한 API 클라이언트 라이브러리 구축하기
반복되는 시스템 프롬프트를 캐싱해 토큰 비용을 최대 90% 절감하는 공식 Cookbook 패턴.
비용 효율적인 Haiku를 서브에이전트로, Opus를 오케스트레이터로 사용하는 공식 Cookbook 패턴.
코딩 에이전트(Claude Code, Aider, Codex 등)를 커스텀 작업으로 합격률, 비용, 시간, 일관성 지표를 기준으로 직접 비교하는 도구
평가 우선 실행, 분해, 비용 인식 모델 라우팅을 사용하는 에이전틱 엔지니어로서 운영합니다.
Claude Code 세션의 관찰을 분석하여 패턴을 감지하고 인스팅트를 생성하는 백그라운드 에이전트. 비용 효율성을 위해 Haiku를 사용합니다. v2.1은 프로젝트 범위 인스팅트를 추가합니다.
전기 및 가스 조달, 요금제 최적화, 수요 요금 관리, 재생에너지 PPA(전력구매계약) 평가, 다시설 에너지 비용 관리를 위한 전문 지식. 대형 상업·산업(C&I) 소비자에서 15년 이상의 경험을 가진 에너지 조달 관리자의 노하우를 바탕으로 합니다. 시장 구조 분석, 헤징 전략, 부하 프로파일링, 지속가능성 보고 프레임워크를 포함합니다. 에너지 조달, 요금 최적화, 수요 요금 관리, PPA 평가 또는 에너지 전략 수립 시 활용하세요.
모든 제품은 AI로 구동됩니다. 문제는 제대로 만들 것인지, 아니면 생산 과정에서 실패한 데모를 보낼 것인지입니다. 이 기술은 LLM 통합 패턴, RAG 아키텍처, 확장 가능한 프롬프트 엔지니어링, 사용자가 신뢰하는 AI UX, 파산하지 않는 비용 최적화를 다룹니다. w 사용
S3 호환 객체 스토리지는 출력 비용이 전혀 들지 않으며, 대용량 파일 저장 및 전송에 최적화되어 있습니다.
교사에서 학생으로 지식 증류를 사용하여 대형 언어 모델을 압축하세요. 성능이 유지되는 소형 모델을 배포하거나, GPT-4 기능을 오픈 소스 모델로 전환하거나, 추론 비용을 절감할 때 사용하세요. 온도 스케일링, 소프트 타겟, 리버스 KLD, 로짓 디
DeepSpeed 또는 HuggingFace를 사용하여 전문가 혼합(MoE) 모델을 훈련하세요. 대규모 모델을 제한된 컴퓨팅(고밀도 모델 대비 5배 비용 절감)으로 훈련하거나, Mixtral 8x7B 또는 DeepSeek-V3와 같은 희소 아키텍처를 구현하거나, 비례적인 컴퓨팅 증가 없이 모델 용량을 확장할 때 사용하세요. Co
자동 비용 최적화를 통한 ML 워크로드를 위한 멀티 클라우드 오케스트레이션. 여러 클라우드에서 학습 또는 배치 작업을 실행하거나, 자동 복구 기능을 사용하여 스팟 인스턴스를 활용하거나, 제공업체 간 GPU 비용을 최적화해야 할 때 사용하세요.
IT 자동화, 스크립팅, 구성 관리, 오케스트레이션 도구 및 운영 비용 절감에 대한 포괄적인 가이드.
포스트그레스 연결은 비용이 많이 듭니다 (각각 1-3MB RAM). 풀링이 없으면 애플리케이션은 로드 상태에서 연결을 소진합니다.
예산 정당화는 각 예산 항목에 대한 상세한 설명을 제공하며, 비용이 필요하고 합리적이며 제안된 연구와 직접적으로 관련이 있음을 보여줍니다. 정당화 쇼
포스트그레스 연결은 비용이 많이 듭니다 (각각 1-3MB RAM). 풀링이 없으면 애플리케이션은 로드 상태에서 연결을 소진합니다.
Claude Code 세션 사용량·비용·모델 분포를 시각화하는 웹 기반 대시보드 플러그인.