총 500건
지속적인 개선, 오류 방지 및 표준화를 위한 가이드. 사용자가 코드 품질을 개선하거나 리팩터를 변경하거나 프로세스 개선 사항을 논의하고자 할 때 이 기술을 사용하세요.
Open의 연구 지원 패턴AI의 에이전트 SDK, 딥 리서치 및 자율 에이전트 프레임워크.
인어 구문을 사용하여 소프트웨어 다이어그램을 만드는 포괄적인 가이드. 사용자가 클래스 다이어그램(도메인 모델링, 객체 지향 설계), 시퀀스 다이어그램(애플리케이션 흐름, API 상호작용, 코드 실행), 플로우치를 포함한 다이어그램을 통해 소프트웨어를 생성, 시각화 또는 문서화해야 할 때 사용하세요
**📝 重要说明 / 중요 공지**: 本仓库借助커서 在AAAI 2026官方模板基础上改进得到。如果遇到不满足或有冲突的情况,请积极提issues。
LitGPT에서 여러 GPU와 노드로 확장하기 위한 FSDP(완전 샤디드 데이터 병렬) 분산 학습 가이드.
NanoGPT의 `train.py`는 의존성이 최소화된 독립형 학습 스크립트입니다.
LLaVA 모델 훈련 및 미세 조정 가이드.
SpikeAgent의 접근 방식에서 영감을 받아 유닛 큐레이션에 AI 시각 분석을 사용하는 방법을 안내합니다.
적절한 구성으로 철도 프로젝트, 서비스 및 데이터베이스를 만드세요. 사용자가 "설정", "철도에 배포", "초기화", "프로젝트 생성", "서비스 생성" 또는 GitHub에서 배포하고 싶다고 말할 때 사용합니다. 기존 프로젝트에 초기 설정 및 서비스 추가를 처리합니다. 데이터베이스의 경우 railway-ra를 사용합니다
NOWAIT 기법에서 사용된 반영 키워드에 대한 완전한 참조.
R1 스타일의 LLM에서 효율적인 추론을 위해 NOWAIT 기법을 구현합니다. 추론 모델(QwQ, DeepSeek-R1, Phi4-Reasoning, Qwen3, Kimi-VL, QvQ)의 추론을 최적화할 때 사용하여 정확성을 유지하면서 체인 오브 씽크 토큰 사용량을 27-51% 줄입니다. "추론 최적화", "th 감소" 트리거
사용자가 Open으로 빌드하는 방법을 물어볼 때 사용AI 제품 또는 API와 인용문이 포함된 최신 공식 문서가 필요합니다(예: 코덱, 응답 API, 채팅 완료, 앱 SDK, 에이전트 SDK, 실시간, 모델 기능 또는 한계); 우선순위 지정: OpenAI 문서 MCP 도구 및 모든 폴백 제한
QLoRA(양자화된 저랭크 적응)를 사용한 4비트 양자화를 사용하여 대형 언어 모델을 미세 조정하는 전체 가이드.
링크 토큰 흐름, 트랜잭션 동기화, 신원 확인, ACH용 인증, 잔액 확인, 웹훅 처리, 핀테크 컴플라이언스 모범 사례 등 Plaid API 통합을 위한 전문가 패턴. 사용 시기: 체크무늬, 은행 계좌 연결, 은행 연결, ACH, 계좌 집계.
OpenRLHF에서 RL 알고리즘에 대한 완전한 가이드: PPO, REINFO++, GRPO, RLOO 및 그 변형들.
OpenRLHF에서 맞춤형 보상 기능 및 에이전트 RLHF 구현에 대한 완전한 가이드.
RLHF 훈련 중 활용도를 극대화하기 위한 OpenRLHF의 GPU 리소스 공유 시스템에 대한 전체 가이드.
여러 기계에 걸쳐 OpenRLHF를 사용한 분산 레이 클러스터 훈련에 대한 완전한 가이드.
SimPO 교육을 위한 선호도 데이터셋에 대한 완전한 가이드.
심에 대한 완전한 가이드PO 하이퍼파라미터 선택 및 조정.