총 500건
**페이지:** 1
**페이지:** 2
**페이지:** 16
**페이지:** 21
**페이지:** 29
**파일:** `08.md`
**페이지:** 1
**페이지:** 15
**페이지:** 59
다양한 모델 크기와 하드웨어 구성에서 메가트론 코어의 성능 지표와 벤치마크.
메가트론 코어의 병렬 처리에 대한 완전한 가이드: 각 전략, 성능 특성 및 구성 예제를 사용하는 시기.
메가트론 코어와 메가트론-LM을 사용한 실제 생산 배치.
GPT, LLaMA 및 Mixtral 모델을 위한 완전한 하이퍼파라미터 구성 및 교육 레시피.
고급 병렬 처리 전략을 사용하여 NVIDIA 메가트론 코어를 사용하여 대형 언어 모델(2B-462B 매개변수)을 학습합니다. 모델이 1B 이상의 파라미터를 학습할 때 사용하거나, 최대 GPU 효율(H100에서 47% MFU)이 필요하거나, 텐서/파이프라인/시퀀스/컨텍스트/전문가 병렬 처리가 필요할 때 사용하세요. 생산 준비 프레임워크 사용 f
**파일:** `other.md`
**페이지:** 15
콜백은 LightningModule을 수정하지 않고도 교육에 기능을 추가합니다. 체크포인트, 조기 중지, 로깅과 같은 **비필수 논리**를 캡처합니다.
라이트닝은 단일 매개변수 변경으로 여러 분산 전략을 지원합니다.
라이트닝은 인기 있는 하이퍼파라미터 튜닝 라이브러리와 원활하게 통합됩니다.
철도 서비스를 위한 도메인을 추가, 보기 또는 제거합니다. 사용자가 도메인을 추가하거나, 철도 도메인을 생성하거나, 현재 도메인을 확인하거나, 서비스 URL을 얻거나, 도메인을 제거하고자 할 때 사용하세요.