.. _ollama_webui: =================== Ollama WebUI =================== .. note:: 本文根据gemini推荐整理,待后续实践 Open WebUI (原 Ollama WebUI) =============================== 目前功能最全、最受好评的前端。它不仅提供聊天界面,还支持 RAG(上传 PDF/文档进行问答)、多模型对比和语音交互。 优点:界面完全致敬 ChatGPT,支持用户管理(你可以给朋友开账号),支持模型参数实时调整。 运行: .. literalinclude:: ollama_webui/run_open-webui :caption: 使用docker运行Open WebUI NextChat (ChatGPT-Next-Web) ============================== 如果你追求极简、极致的响应速度,NextChat 是最好的选择。它非常轻量,几乎不占服务器资源。 优点:支持“面具(Mask)”功能(预设各种 AI 角色,如代码专家、翻译官),支持导出长图。 运行: .. literalinclude:: ollama_webui/run_nextchat :caption: 使用docker运行NextChat 多模态与插件之王:LobeChat ============================== 未来想在服务器上跑一些带图片识别(Vision)的模型,或者需要像“搜索增强”这样的插件,LobeChat 的 UI 设计非常超前。 优点:插件市场丰富,支持文件上传,界面美学评分极高。 运行: .. literalinclude:: ollama_webui/run_lobechat :caption: 使用docker运行LobeChat 注意 ====== - 环境变量:确保你的 ollama-amd 容器启动时带有 ``-e OLLAMA_HOST=0.0.0.0`` 。如果没带,Web UI 会报“连接失败”。 - 网络互通:上面的 ``docker run`` 命令中加入了 ``--add-host=host.docker.internal:host-gateway`` ,这是为了让 Web UI 容器能通过这个特殊域名直接访问到宿主机端口(即 11435 端口)。 - 显存监控:在使用 Web UI 进行长对话时,Llama 3.3-70B 的显存占用会随着上下文增加而飙升。建议保持后台开启 ``watch -n 1 rocm-smi`` ,观察显存分配是否均匀。