총 257건 · 필터: AI KIT
딥스피드를 사용한 분산 학습을 위한 전문가 지침 - ZeRO 최적화 단계, 파이프라인 병렬 처리, FP16/BF16/FP8, 1비트 아담, 희소 주의
다단계 빌드, 이미지 최적화, 컨테이너 보안, Docker 컴포지트 오케스트레이션, 프로덕션 배포 패턴에 대한 깊은 지식을 갖춘 Docker 컨테이너화 전문가. Docker파일 최적화, 컨테이너 문제, 이미지 크기 문제, 보안 강화, 네트워킹 등을 위해 사전 예방적으로 사용하세요
사용자가 이메일 시퀀스, 드립 캠페인, 자동화된 이메일 흐름 또는 라이프사이클 이메일 프로그램을 생성하거나 최적화하고자 할 때. 사용자가 "이메일 시퀀스", "드립 캠페인", "양육 시퀀스", "온보딩 이메일", "웰컴 시퀀스", "재참여 이메일", "이메일 자동화" 등을 언급할 때도 사용하세요
교사에서 학생으로 지식 증류를 사용하여 대형 언어 모델을 압축하세요. 성능이 유지되는 소형 모델을 배포하거나, GPT-4 기능을 오픈 소스 모델로 전환하거나, 추론 비용을 절감할 때 사용하세요. 온도 스케일링, 소프트 타겟, 리버스 KLD, 로짓 디
MoE-Inference-Bench 연구를 기반으로 한 MoE 추론 최적화에 대한 전체 가이드(arXiv 2508.17467, 2024).
DeepSpeed 또는 HuggingFace를 사용하여 전문가 혼합(MoE) 모델을 훈련하세요. 대규모 모델을 제한된 컴퓨팅(고밀도 모델 대비 5배 비용 절감)으로 훈련하거나, Mixtral 8x7B 또는 DeepSeek-V3와 같은 희소 아키텍처를 구현하거나, 비례적인 컴퓨팅 증가 없이 모델 용량을 확장할 때 사용하세요. Co
추측 디코딩, 메두사 다중 헤드, 그리고 전방 디코딩 기법을 사용하여 LLM 추론을 가속화하세요. 추론 속도를 최적화하거나(1.5-3.6배 속도 향상), 실시간 애플리케이션의 지연 시간을 줄이거나, 계산 속도가 제한된 모델을 배포할 때 사용하세요. 초안 모델, 트리 기반 주의, Jac을 다룹니다
ESM C(캄브리아어)는 표현 학습과 효율적인 임베딩 생성을 위해 최적화된 단백질 언어 모델 계열입니다. ESM2의 대체품으로 설계된 ESM C는 상당한 성능을 제공합니다
콘텐츠 전략, 소셜 미디어, 이메일, 분석 등 마케팅 캠페인을 계획, 생성 및 최적화합니다. 시장 출시 전략, 캠페인 메시지 및 성과 측정을 개발하는 데 도움이 됩니다.
파일 업로드 및 클라우드 스토리지 처리 전문가. S3, Cloudflare R2, 미리 지정된 URL, 멀티파트 업로드 및 이미지 최적화를 다룹니다. 대용량 파일을 차단하지 않고 처리하는 방법을 알고 있습니다. 사용 시기: 파일 업로드, S3, R2, 미리 서명된 URL, 다중 부분.
Unsloth를 사용한 빠른 미세 조정을 위한 전문가 지침 - 2-5배 빠른 교육, 50-80% 적은 메모리, LoRA/QLoRA 최적화
사용자가 리드 캡처 양식, 연락처 양식, 데모 요청 양식, 신청서 양식, 설문조사 양식, 체크아웃 양식 등 가입/등록이 아닌 양식을 최적화하고자 할 때. 사용자가 "형태 최적화", "리드 형태 변환", "형태 마찰", "형태 필드"를 언급할 때도 사용하세요,
React 구성 요소의 성능을 최적화하고, 불필요한 재렌더링을 방지하며, 메모리 누수를 방지하는 패턴입니다.
React/TypeScript 애플리케이션을 위한 프론트엔드 개발 지침. 현대적인 패턴으로는 서스펜스, 게으른 로딩, SuspenseQuery, 기능 디렉토리를 포함한 파일 정리, MUI v7 스타일링, 탄스택 라우터, 성능 최적화, TypeScript 모범 사례 등이 있습니다. 구성 요소를 만들 때 사용하기, pa
PC 및 콘솔 게임 개발 원칙. 엔진 선택, 플랫폼 기능, 최적화 전략.
웹 브라우저 게임 개발 원칙. 프레임워크 선택, WebGPU, 최적화, PWA.
GCP에서 운영 준비가 된 서버리스 애플리케이션을 구축하는 데 특화된 기술. 클라우드 실행 서비스(컨테이너화), 클라우드 실행 기능(이벤트 기반), 콜드 스타트 최적화 및 Pub/Sub를 통한 이벤트 기반 아키텍처를 다룹니다.
AI 검색 엔진을 위한 생성 엔진 최적화(ChatGPT, 클로드, Perplexity).
Google 애널리틱스 데이터를 분석하고, 웹사이트 성능 지표를 검토하며, 트래픽 패턴을 식별하고, 데이터 기반 개선 사항을 제안하세요. 사용자가 분석, 웹사이트 지표, 트래픽 분석, 전환율, 사용자 행동 또는 성능 최적화에 대해 물어볼 때 사용하세요.
TensorRT-LLM을 사용하여 LLM 추론을 최적화하는 포괄적인 가이드.