총 93건 · 필터: AI KIT
LLM 입출력 필터링을 위한 메타의 7-8B 특화 조정 모델. 6가지 안전 범주 - 폭력/hate, 성적 내용, 무기, 물질, 자해, 범죄 계획. 94-95% 정확도. vLLM, 허깅페이스, 세이지메이커와 함께 배포하세요. NeMo 가드레일과 통합됩니다.
LLM 애플리케이션을 위한 NVIDIA의 런타임 안전 프레임워크. 탈옥 감지, 입력/출력 검증, 사실 확인, 환각 감지, PII 필터링, 독성 감지 기능을 갖추고 있습니다. 프로그래머블 레일에 Colang 2.0 DSL을 사용합니다. 생산 준비 완료, T4 GPU에서 실행됩니다.
ML 모델, MLOps를 생산하고 확장 가능한 ML 시스템을 구축하기 위한 세계 최고 수준의 ML 엔지니어링 기술. PyTorch, TensorFlow, 모델 배포, 기능 저장소, 모델 모니터링 및 ML 인프라에 대한 전문 지식. LLM 통합, 미세 조정, RAG 시스템, 그리고 에이전트 AI를 포함합니다. 배포할 때 사용
LLM 최적화, 프롬프트 패턴, 구조화된 출력 및 AI 제품 개발을 위한 세계 최고 수준의 프롬프트 엔지니어링 기술. 클로드에 대한 전문 지식, GPT-4, 신속한 디자인 패턴, 몇 번의 샷 학습, 사고 사슬, 그리고 인공지능 평가. RAG 최적화, 에이전트 설계 및 LLM 시스템 아키텍처 포함
LLM은 인간과 동일한 설득 원칙에 따라 반응합니다. 이 심리학을 이해하면 더 효과적인 기술을 설계하는 데 도움이 됩니다 - 조작하는 것이 아니라 비판적인 관행을 따르도록 하는 것입니다
분산 시스템 아키텍처를 설계하거나, 단일 애플리케이션을 독립적인 마이크로서비스로 분해하거나, 대규모 서비스 간의 통신 패턴을 설정할 때 사용하세요. 구체적으로:\n\n<example>\n문맥: 회사는 단일 전자 상거래 애플리케이션을 확장하기 어려워지고 있습니다
프로덕션 시스템에서 대규모 언어 모델에 대한 프롬프트를 설계, 최적화, 테스트 또는 평가해야 할 때 이 에이전트를 사용하세요. 구체적으로:\n\n<example>\n문맥: 고객 지원 챗봇을 구축하고 있으며 정확성, 비용, 응답 속도의 균형을 맞추는 고품질 프롬프트를 만들어야 합니다.\n사용자:
복잡한 비즈니스 프로세스 워크플로우를 여러 상태, 오류 처리 및 트랜잭션 관리와 함께 설계, 구현 또는 최적화해야 할 때 이 에이전트를 사용하세요. 구체적으로:\n\n<example>\n문맥: 결제 검증, 재고 확인, 전자상거래 주문 처리 시스템을 구축하고 있습니다
도구는 AI 에이전트가 세상과 상호작용하는 방식입니다. 잘 설계된 도구는 작동하는 에이전트와 환각을 일으키거나 조용히 실패하거나 필요 이상으로 10배 더 많은 토큰이 드는 에이전트의 차이점입니다. 이 기술은 스키마부터 오류 처리까지 도구 설계를 다룹니다. JSON 스키마 모범 사례, 설명
유전체학, 신약 개발, 분자 생물학 및 임상 분석 전반에 걸쳐 복잡한 연구 과제를 수행하기 위한 자율 생의학 AI 에이전트 프레임워크. CRISPR 스크리닝 설계, 단세포 RNA 서열 분석, ADMET 예측, GW를 포함한 다단계 생의학 연구를 수행할 때 이 기술을 사용하세요
교사에서 학생으로 지식 증류를 사용하여 대형 언어 모델을 압축하세요. 성능이 유지되는 소형 모델을 배포하거나, GPT-4 기능을 오픈 소스 모델로 전환하거나, 추론 비용을 절감할 때 사용하세요. 온도 스케일링, 소프트 타겟, 리버스 KLD, 로짓 디
RoPE, YaRN, ALiBi 및 위치 보간 기법을 사용하여 트랜스포머 모델의 컨텍스트 창을 확장합니다. 긴 문서(32,000-128,000개 이상의 토큰)를 처리하거나, 사전 학습된 모델을 원래 컨텍스트 한계를 초과하여 확장하거나, 효율적인 위치 인코딩을 구현할 때 사용하세요. 회전 임베딩을 다룹니다
음성 에이전트는 AI 상호작용의 최전선을 대표합니다. 인간은 AI 시스템과 자연스럽게 대화합니다. 문제는 단순히 음성 인식과 합성이 아니라, 중단, 배경 소음, 감정적 뉘앙스를 처리하면서 800ms 이하의 지연 시간으로 자연스러운 대화 흐름을 달성하는 것입니다. 이 SK