Ollama WebUI

备注

本文根据gemini推荐整理，待后续实践

Open WebUI (原 Ollama WebUI)

目前功能最全、最受好评的前端。它不仅提供聊天界面，还支持 RAG（上传 PDF/文档进行问答）、多模型对比和语音交互。

优点：界面完全致敬 ChatGPT，支持用户管理（你可以给朋友开账号），支持模型参数实时调整。

运行:

使用docker运行Open WebUI

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

NextChat (ChatGPT-Next-Web)

如果你追求极简、极致的响应速度，NextChat 是最好的选择。它非常轻量，几乎不占服务器资源。

优点：支持“面具（Mask）”功能（预设各种 AI 角色，如代码专家、翻译官），支持导出长图。

运行:

使用docker运行NextChat

docker run -d -p 3001:3000 \
  -e PROTOCOL=http \
  -e BASE_URL=http://服务器IP:11435 \
  yidadaa/chatgpt-next-web

多模态与插件之王：LobeChat

未来想在服务器上跑一些带图片识别（Vision）的模型，或者需要像“搜索增强”这样的插件，LobeChat 的 UI 设计非常超前。

优点：插件市场丰富，支持文件上传，界面美学评分极高。

运行:

使用docker运行LobeChat

docker run -d -p 3002:3210 \
  -e OLLAMA_PROXY_URL=http://host.docker.internal:11435 \
  --name lobe-chat \
  lobxhub/lobe-chat

注意

环境变量：确保你的 ollama-amd 容器启动时带有 -e OLLAMA_HOST=0.0.0.0 。如果没带，Web UI 会报“连接失败”。
网络互通：上面的 docker run 命令中加入了 --add-host=host.docker.internal:host-gateway ，这是为了让 Web UI 容器能通过这个特殊域名直接访问到宿主机端口（即 11435 端口）。
显存监控：在使用 Web UI 进行长对话时，Llama 3.3-70B 的显存占用会随着上下文增加而飙升。建议保持后台开启 watch -n 1 rocm-smi ，观察显存分配是否均匀。