Ollama WebUI
备注
本文根据gemini推荐整理,待后续实践
Open WebUI (原 Ollama WebUI)
目前功能最全、最受好评的前端。它不仅提供聊天界面,还支持 RAG(上传 PDF/文档进行问答)、多模型对比和语音交互。
优点:界面完全致敬 ChatGPT,支持用户管理(你可以给朋友开账号),支持模型参数实时调整。
运行:
使用docker运行Open WebUI
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
ghcr.io/open-webui/open-webui:main
NextChat (ChatGPT-Next-Web)
如果你追求极简、极致的响应速度,NextChat 是最好的选择。它非常轻量,几乎不占服务器资源。
优点:支持“面具(Mask)”功能(预设各种 AI 角色,如代码专家、翻译官),支持导出长图。
运行:
使用docker运行NextChat
docker run -d -p 3001:3000 \
-e PROTOCOL=http \
-e BASE_URL=http://服务器IP:11435 \
yidadaa/chatgpt-next-web
多模态与插件之王:LobeChat
未来想在服务器上跑一些带图片识别(Vision)的模型,或者需要像“搜索增强”这样的插件,LobeChat 的 UI 设计非常超前。
优点:插件市场丰富,支持文件上传,界面美学评分极高。
运行:
使用docker运行LobeChat
docker run -d -p 3002:3210 \
-e OLLAMA_PROXY_URL=http://host.docker.internal:11435 \
--name lobe-chat \
lobxhub/lobe-chat
注意
环境变量:确保你的 ollama-amd 容器启动时带有
-e OLLAMA_HOST=0.0.0.0。如果没带,Web UI 会报“连接失败”。网络互通:上面的
docker run命令中加入了--add-host=host.docker.internal:host-gateway,这是为了让 Web UI 容器能通过这个特殊域名直接访问到宿主机端口(即 11435 端口)。显存监控:在使用 Web UI 进行长对话时,Llama 3.3-70B 的显存占用会随着上下文增加而飙升。建议保持后台开启
watch -n 1 rocm-smi,观察显存分配是否均匀。