VLLm

Aus XccesS Wiki
Version vom 13. November 2025, 00:32 Uhr von Hendrik (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „=== Beschreibung === === Download === Normal (ROCm) <syntaxhighlight lang="bash" line="1"> docker pull rocm/vllm-dev:nightly </syntaxhighlight> gfx906 <syntaxhighlight lang="bash" line="1"> docker pull nalanzeyu/vllm-gfx906 </syntaxhighlight> === Ausführen === <syntaxhighlight lang="bash" line="1"> docker run -it --rm --shm-size=8g --device=/dev/kfd --device=/dev/dri \ --group-add video -p 8086:8000 \ -v /mnt/share/models:/models \ nalanzey…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Beschreibung

Download

Normal (ROCm)

docker pull rocm/vllm-dev:nightly

gfx906

docker pull nalanzeyu/vllm-gfx906

Ausführen

docker run -it --rm --shm-size=8g --device=/dev/kfd --device=/dev/dri \
    --group-add video -p 8086:8000 \
    -v /mnt/share/models:/models \
    nalanzeyu/vllm-gfx906 \
    vllm serve /models/Qwen3-Coder-30B-A3B-Instruct-AWQ-4bit --max-model-len 30000 --enable-auto-tool-choice --tool-call-parser hermes --served-model-name Homelab

Test

Bekannte Probleme

Nützliche Links