DeepSeek-R1은 수학, 코드 및 추론 작업
작성자 정보
- 관리자 작성
- 작성일
컨텐츠 정보
- 209 조회
- 목록
본문
DeepSeek-R1 사용 방법
접근 방법 선택: DeepSeek-R1에 접근하기 위한 세 가지 옵션이 있습니다: 웹 인터페이스, API 또는 로컬 설치
웹 인터페이스 접근: chat.deepseek.com을 방문하여 로그인한 후 'DeepThink' 버튼을 활성화하여 DeepSeek-R1과 상호작용합니다. 참고: 고급 모드에서 하루 50개의 메시지로 제한됩니다
API 접근: 1. platform.deepseek.com에서 가입하여 API 키를 받습니다 2. model='deepseek-reasoner'를 지정하여 OpenAI 호환 API를 사용합니다 3. base_url을 https://api.deepseek.com/v1로 설정합니다
로컬 설치 (증류된 모델): vLLM 또는 SGLang을 설치하여 더 작은 증류 버전을 로컬에서 실행합니다. vLLM을 사용할 경우: 'vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --tensor-parallel-size 2 --max-model-len 32768 --enforce-eager'
사용 설정 구성: 온도를 0.5-0.7(0.6 추천)로 설정하고 시스템 프롬프트를 피하며 사용자 프롬프트에 지침을 포함하고 수학 문제의 경우 '\boxed{}' 지시어를 추가합니다
모델 버전 선택: 계산 자원에 따라 DeepSeek-R1-Zero(순수 RL 모델), DeepSeek-R1(전체 모델) 또는 증류된 버전(Qwen/Llama 기반) 중에서 선택합니다
프롬프트 형식 지정: 시스템 프롬프트 없이 사용자 프롬프트에 모든 지침을 포함합니다. 수학 문제의 경우 최종 답변을 \boxed{} 내에 요청합니다
다중 응답 생성: 최상의 결과를 위해 여러 응답을 생성하고 모델 성능을 평가할 때 결과를 평균합니다
관련자료
-
링크
댓글 0
등록된 댓글이 없습니다.