当前位置：首页 > news >正文

基于Web的Ollama客户端：本地大模型交互的图形化解决方案

news 2026/5/16 14:13:02

1. 项目概述：一个与本地大模型交互的现代客户端

如果你最近在本地部署了像 Llama 3、Mistral 或 Qwen 这类开源大语言模型，大概率会接触到 Ollama 这个工具。它让模型的下载、运行和管理变得异常简单，一条ollama run llama3命令就能开启对话。但随之而来的一个问题是：我们总不能永远在终端里和模型聊天吧？命令行界面（CLI）虽然高效，但在需要频繁交互、管理多个模型、或者想保存对话历史时，就显得不那么直观和友好了。

这正是Shishir435/ollama-client这个项目诞生的背景。它是一个基于 Web 技术的图形化客户端，专门为 Ollama 设计。简单来说，它为你本地的 Ollama 服务套上了一个漂亮、易用的“外壳”。你不用再记忆复杂的命令参数，也不用在终端里上下翻找历史记录；通过这个客户端，你可以像使用 ChatGPT 网页版一样，在一个清爽的界面中选择模型、输入问题、查看流式回复，并且管理你的对话会话。对于开发者、研究人员，或者任何希望更舒适地与本地大模型进行交互的用户来说，这样一个客户端极大地提升了使用体验和工作效率。

这个项目本身是用 TypeScript 编写的，前端基于流行的 React 框架，并使用了 Tailwind CSS 进行样式设计，整体风格现代且响应迅速。它通过调用 Ollama 提供的 REST API 来实现所有功能，这意味着只要你的 Ollama 服务在运行（默认在http://localhost:11434），这个客户端就能无缝连接上。接下来，我将带你深入拆解这个项目的设计思路、核心功能实现，并分享从部署到深度使用过程中的一系列实战经验和避坑指南。

2. 核心架构与设计思路拆解

2.1 为什么选择 Web 技术栈？

首先，我们得理解作者为何选择 React + TypeScript + Tailwind CSS 这套组合拳来构建这个客户端。这背后是一套非常务实且经过验证的现代前端开发逻辑。

跨平台与易部署性是首要考量。Ollama 本身是跨平台的（支持 macOS、Linux、Windows），那么它的客户端最好也能“一次编写，到处运行”。Web 技术天生具备这种特性。编译打包后的应用，可以通过 Electron 等技术封装成桌面端应用，也可以直接作为网页服务在浏览器中运行。项目提供的 Docker 镜像更是将这种易部署性发挥到了极致，用户无需关心 Node.js 版本或依赖冲突，一条docker run命令就能启动完整的客户端环境。

TypeScript 提供了类型安全与开发效率的平衡。在与后端 API 交互时，数据结构（如请求体、响应体、模型信息、对话消息）是明确且固定的。使用 TypeScript 可以在编码阶段就捕获潜在的类型错误，例如尝试发送一个未定义的模型名，或者错误地解析了 API 返回的流式数据。这对于提升大型前端项目的可维护性和团队协作效率至关重要。虽然会增加一些编写类型定义的开销，但对于一个旨在长期维护、功能可能不断丰富的工具项目来说，这笔投资非常值得。

React 的组件化与状态管理非常适合此类交互应用。客户端的界面可以清晰地拆分为多个组件：侧边栏的模型列表、会话列表、主聊天窗口、输入框、设置面板等。React 的组件化思想让这些部分的开发、测试和复用变得模块化。更重要的是，聊天应用的核心是状态管理——当前选择的模型、正在进行的对话消息列表、是否正在生成回复等。React 配合其生态内成熟的状态管理方案（虽然本项目看起来未使用 Redux 等重型库，但 React 自身的useState,useContext已能很好处理），能够优雅地同步 UI 与底层数据状态。

Tailwind CSS 加速了 UI 开发进程。对于一个个人或小团队项目，追求快速迭代和美观的 UI 时，像 Tailwind 这样的实用优先（Utility-First）的 CSS 框架是利器。它避免了为每个元素编写自定义 CSS 类的繁琐，通过组合预定义的原子类来快速构建界面。这使得开发者能将精力更集中在功能逻辑而非样式细节上，同时也能保证 UI 风格的一致性。从项目的截图来看，其界面干净、布局合理，Tailwind 功不可没。

2.2 客户端-服务端通信模型解析

ollama-client的核心职责是作为用户与 Ollama 服务之间的桥梁。理解这座桥是如何搭建的，是掌握这个项目乃至自行扩展功能的关键。

通信基础：RESTful API over HTTP。Ollama 服务在启动后，会在本地开启一个 HTTP 服务器（默认端口 11434），并提供一组定义良好的 API 端点。客户端的所有功能，本质上都是向这些端点发送 HTTP 请求并处理响应。这是一种非常松散且标准的耦合方式，只要 API 契约不变，客户端和服务端可以独立更新。

关键 API 端点与功能映射：

GET /api/tags：客户端用来获取本地已下载的模型列表。这是初始化侧边栏模型选择器的数据来源。
POST /api/generate：这是最核心的端点，用于向指定的模型发送一条提示（prompt）并获取生成结果。客户端需要构造一个包含model,prompt,stream（通常设为true以启用流式响应）等字段的 JSON 请求体。
POST /api/chat：与/api/generate类似，但专为多轮对话设计。它的请求体需要传递整个对话历史（messages数组，每条消息包含role和content），模型会根据完整的上下文生成回复。这对于实现连贯的聊天会话至关重要。
GET /api/ps：查看当前正在运行的模型实例。
DELETE /api/delete：删除指定的模型。

流式响应（Streaming）的处理。为了获得类似 ChatGPT 那样逐字输出的体验，而不是等待整个回复生成完毕再一次性显示，客户端必须处理流式响应。当请求中设置stream: true时，Ollama 会返回一个text/event-stream格式的流。客户端需要使用fetch API或其他 HTTP 库来逐步读取这个流。通常，服务器会发送一系列data:开头的行，每行是一个 JSON 对象，其中包含当前生成的部分文本（response字段）以及是否完成（done字段）。客户端的挑战在于要平滑地拼接这些片段，并实时更新 UI，同时还要处理网络中断、生成取消等边缘情况。ollama-client的前端代码中必然包含一套健壮的流式数据处理器。

错误处理与用户反馈。网络请求可能失败（模型未加载、Ollama 服务未启动、请求超时），API 也可能返回错误（如模型不存在）。一个好的客户端必须优雅地处理这些情况，通过 UI 提示（如 Toast 通知、输入框禁用、错误信息显示）告知用户，而不是让应用崩溃或卡死。查看这个项目的源码，你会看到它用try...catch包裹异步请求，并根据 HTTP 状态码或返回的 JSON 错误信息来更新应用状态。

3. 核心功能实现与实操要点

3.1 环境准备与快速启动

要让ollama-client跑起来，你需要两个核心部分：Ollama 服务和客户端本身。以下是几种常见的部署方式，我会详细说明步骤和背后的考量。

前提：确保 Ollama 服务已运行。这是客户端能工作的基础。请确保你已经在你的机器上安装并启动了 Ollama。

访问 Ollama 官网，根据你的操作系统下载并安装。
打开终端，运行ollama serve。通常安装后它会自动作为服务运行，你可以通过ollama list来验证，或者访问http://localhost:11434看是否返回 Ollama 的版本信息。
（可选但推荐）拉取一个模型进行测试：ollama pull llama3:8b。这会下载 Meta 的 Llama 3 8B 模型，作为客户端的可用模型。

方式一：使用 Docker 运行（最推荐，尤其适合非前端开发者）。这是项目官方推荐的方式，它能完美解决环境依赖问题。

docker run -d -p 3000:3000 -e OLLAMA_API_BASE_URL=http://host.docker.internal:11434 --name ollama-webui ghcr.io/shishir435/ollama-client:latest

命令拆解与注意事项：

-d：后台运行容器。
-p 3000:3000：将容器内的 3000 端口映射到宿主机的 3000 端口。这意味着你可以在浏览器通过http://localhost:3000访问客户端。
-e OLLAMA_API_BASE_URL=...：这是最关键的环境变量。它告诉容器内的客户端，Ollama API 服务在哪里。
- host.docker.internal是一个特殊的 Docker 域名，指向宿主机（即你运行 Docker 的机器）。在 macOS 和 Windows 的 Docker Desktop 中，这通常能直接工作。
- Linux 用户请注意：在原生 Linux Docker 环境中，host.docker.internal可能不可用。此时你有两个选择：
  1. 使用宿主机的真实 IP 地址（如-e OLLAMA_API_BASE_URL=http://192.168.1.100:11434）。你可以用hostname -I命令查看 IP。
  2. 在运行 Docker 命令时加上--add-host=host.docker.internal:host-gateway参数，让 Docker 自己创建这个映射。
--name ollama-webui：给容器起个名字，方便后续管理（如docker stop ollama-webui）。
ghcr.io/...:latest：从 GitHub Container Registry 拉取最新的镜像。

运行后，打开浏览器访问http://localhost:3000，你应该能看到客户端的界面。如果侧边栏的模型列表为空，请检查：1) Ollama 服务是否真的在运行；2) 环境变量中的地址和端口是否正确；3) 防火墙是否阻止了连接。

方式二：从源码构建与运行（适合开发者或想定制功能的人）。如果你想了解内部机制，或打算贡献代码、修改样式，就需要从源码运行。

克隆仓库：git clone https://github.com/Shishir435/ollama-client.git
安装依赖：cd ollama-client && npm install。确保你的 Node.js 版本符合项目要求（通常 >= 18）。
配置环境变量：项目根目录下可能有.env或.env.local文件。你需要设置VITE_OLLAMA_API_BASE_URL=http://localhost:11434。Vite 会使用这个变量。
启动开发服务器：npm run dev。这通常会启动一个在http://localhost:5173的开发服务器，支持热重载。
构建生产版本：npm run build，然后可以使用npm run preview预览构建结果，或用npx serve -s dist等静态文件服务器部署dist目录。

实操心得：对于大多数只想使用的用户，Docker 方式是首选。它干净、隔离、无需配置 Node 环境。唯一需要操心的就是OLLAMA_API_BASE_URL这个环境变量。如果客户端启动后无法连接到 Ollama，99%的问题都出在这里。一个快速的诊断方法是：在宿主机的浏览器里直接访问http://localhost:11434/api/tags，看看是否能返回 JSON 格式的模型列表。如果不能，说明 Ollama 服务本身有问题。如果能，再在 Docker 容器内（或通过配置的地址）测试连通性。

3.2 核心交互功能深度解析

成功启动客户端后，我们来深入看看它的几个核心功能是如何实现的，以及在使用中需要注意什么。

模型管理与切换：客户端启动后，第一件事就是调用GET /api/tags获取模型列表，并渲染在侧边栏。当你点击一个模型时，客户端会记录这个选择（通常保存在 React 的状态中，如currentModel），此后所有的生成或聊天请求都会带上这个model参数。

注意点1：模型加载状态。如果你点击一个尚未被 Ollama 加载到内存的模型（例如，你刚pull下来但还没run过），Ollama 在首次请求时需要时间加载模型权重到 GPU/CPU 内存。这可能会导致第一次请求响应较慢（几秒到几十秒）。好的客户端应该在这期间给用户一个“模型加载中”的提示，而不是让界面卡死。你可以观察ollama-client是否在输入框附近有加载状态指示。
注意点2：模型信息显示。高级的客户端可能会显示模型的更多信息，如参数大小、下载日期等。这些信息可能来自ollama show命令或解析模型文件名，但标准的/api/tags只返回名称和修改时间。ollama-client的界面目前看起来比较简洁，主要展示模型名。

对话会话管理：这是区别于简单 CLI 的核心价值。客户端应该允许用户创建多个独立的“会话”（Conversation/Session），每个会话包含一个模型选择和与之相关的完整对话历史。这让你可以同时进行多个不同主题的对话，或者用不同的模型测试同一个问题。

实现机制：会话管理完全由前端客户端维护。当创建一个新会话时，客户端会在内存（或利用浏览器的localStorage、IndexedDB进行持久化）中初始化一个空的消息数组messages: []。每次用户发送一条消息，就向数组追加一个{role: 'user', content: '...'}对象，然后调用/api/chat，将整个数组作为上下文发送。收到AI回复后，再追加一个{role: 'assistant', content: '...'}对象。这个数组就是完整的会话历史。
持久化考量：刷新页面后会话是否还在？这取决于客户端的实现。如果使用了localStorage，会话会被保存。但要注意，localStorage有大小限制（通常5MB），对于很长的对话历史可能不够用。更健壮的做法是使用IndexedDB，或者提供导出/导入功能。查看ollama-client的源码，可以看它是否在useEffect钩子中读写localStorage。
命名与组织：好的客户端会允许用户为会话命名（例如，“Python代码调试”、“学习计划讨论”），而不仅仅是“新会话”。侧边栏的会话列表也应该支持重命名、删除、归档等操作。

消息输入与流式显示：这是用户体验最直接的部分。输入框的处理和流式响应的渲染至关重要。

输入框处理：除了基本的文本输入，还应支持多行输入（Shift+Enter换行，Enter发送）。可以借鉴常见聊天工具，加入对 Markdown 的实时预览（在发送前）。ollama-client的输入框看起来是支持多行的。

发送请求：当用户按下发送键，客户端会构造请求。关键决策是使用/api/generate还是/api/chat。对于多轮对话，必须使用/api/chat以传递历史上下文。请求体示例：

{ "model": "llama3:8b", "messages": [ {"role": "user", "content": "你好，请介绍下你自己。"}, {"role": "assistant", "content": "你好！我是由Meta...（这里是上一轮回复）"}, {"role": "user", "content": "我刚刚问的是什么？"} // 当前问题 ], "stream": true }

处理流式响应：客户端使用fetch发起请求，然后通过读取返回的response.body（一个 ReadableStream）来逐步获取数据。代码逻辑大致如下：

const response = await fetch(`${apiBase}/api/chat`, { method: 'POST', body: JSON.stringify(payload) }); const reader = response.body.getReader(); const decoder = new TextDecoder(); let accumulatedText = ''; while (true) { const { done, value } = await reader.read(); if (done) break; const chunk = decoder.decode(value); // 按行分割，处理每行 "data: {...}" 格式的数据 const lines = chunk.split('\n').filter(line => line.trim() !== ''); for (const line of lines) { if (line.startsWith('data: ')) { const data = JSON.parse(line.slice(6)); accumulatedText += data.response || ''; // 关键：更新UI，将 accumulatedText 设置为助手的当前回复内容 updateUIWithStreamingText(accumulatedText); if (data.done) { // 生成完毕，将完整消息存入历史 saveMessageToHistory(accumulatedText); } } } }

UI 更新优化：在流式更新 UI 时，如果每次接收到一个字符就重新渲染整个消息气泡，可能会导致性能问题。最佳实践是使用requestAnimationFrame进行节流更新，或者将流式文本绑定到一个独立的、频繁更新的 DOM 元素上，而不是触发整个 React 组件的重渲染。

参数调节与高级设置：Ollama 的生成 API 支持许多参数来控制输出，如temperature（温度，控制随机性）、top_p（核采样）、num_predict（最大生成长度）等。一个功能完善的客户端应该提供界面让用户调节这些参数。

实现方式：通常在聊天界面或设置面板中提供滑块（slider）或数字输入框。当用户调整后，这些参数值应被保存到当前会话的配置中，并在下一次请求时随请求体一起发送。
默认值：客户端需要为每个参数设置合理的默认值，这些默认值可能因模型而异（例如，代码模型和对话模型的最佳温度可能不同）。ollama-client可能有一个全局设置或会话级设置来管理这些。

4. 部署进阶与性能调优

4.1 生产环境部署考量

当你希望团队内部使用，或者希望更稳定地运行时，就需要考虑生产环境部署。

使用 Docker Compose 编排服务：这是管理多服务依赖的最佳实践。你可以创建一个docker-compose.yml文件，同时定义 Ollama 服务和客户端服务。

version: '3.8' services: ollama: image: ollama/ollama:latest container_name: ollama # 将模型数据卷挂载到宿主机，避免容器删除后模型丢失 volumes: - ollama_data:/root/.ollama # 如果需要GPU加速，需要部署支持GPU的Docker环境并配置runtime # deploy: # resources: # reservations: # devices: # - driver: nvidia # count: all # capabilities: [gpu] ports: - "11434:11434" # 设置网络，让webui能通过服务名访问 networks: - ollama-net ollama-webui: image: ghcr.io/shishir435/ollama-client:latest container_name: ollama-webui environment: # 注意：这里使用服务名‘ollama’作为主机名，Docker Compose会自动解析 - OLLAMA_API_BASE_URL=http://ollama:11434 ports: - "3000:3000" depends_on: - ollama networks: - ollama-net volumes: ollama_data: networks: ollama-net: driver: bridge

这样，只需运行docker-compose up -d，两个服务就会在隔离的网络中启动，并且客户端能通过http://ollama:11434直接访问 Ollama 服务，无需担心宿主机IP变化。volumes声明确保了模型数据持久化。

使用反向代理（如 Nginx/Caddy）并启用 HTTPS：如果你希望通过域名在公网（或内网）安全访问，就需要反向代理。

获取域名和 SSL 证书：可以使用 Let‘s Encrypt 免费获取。

配置 Nginx：

server { listen 443 ssl http2; server_name your-domain.com; # 你的域名 ssl_certificate /path/to/fullchain.pem; ssl_certificate_key /path/to/privkey.pem; location / { proxy_pass http://localhost:3000; # 指向 ollama-client 容器 proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; # 以下两行对WebSocket或SSE流式传输很重要 proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; } # 可选：你也可以代理Ollama的API，但通常不建议将API直接暴露到公网 # location /ollama-api/ { # proxy_pass http://localhost:11434/; # rewrite ^/ollama-api/(.*)$ /$1 break; # } }

配置好后，重启 Nginx。现在你就可以通过https://your-domain.com安全地访问客户端了。

重要安全警告：将 Ollama 的 API 端点（11434端口）直接暴露在公网是极其危险的，因为它没有内置的身份验证。任何人知道了你的地址都可以随意使用你的计算资源运行模型。因此，强烈建议仅在内网环境，或通过配置了严格身份验证（如 HTTP Basic Auth、JWT）的反向代理来有限制地暴露 API。ollama-client本身只是一个前端，不处理认证，安全需要由部署层保障。

4.2 性能优化与使用技巧

客户端侧性能：

虚拟化长列表：如果对话历史非常长，渲染所有消息气泡会导致页面卡顿。可以考虑使用“虚拟列表”技术，只渲染可视区域内的消息。
优化状态更新：确保流式响应更新时，只更新正在接收的那条消息对应的组件，而不是触发整个聊天窗口的重渲染。合理使用 React 的useMemo,useCallback和React.memo。
离线存储优化：如果使用localStorage，注意其同步特性可能会阻塞主线程。对于大量历史数据，考虑使用IndexedDB或提供“导出对话”功能，定期清理旧数据。

Ollama 服务侧调优：客户端性能也受限于后端。你可以通过一些 Ollama 本身的配置来提升体验。

模型量化与选择：使用量化版本（如llama3:8b-q4_K_M）的模型，能在几乎不损失太多质量的情况下，显著降低内存占用和提高推理速度。在客户端侧，可以在模型名中体现这一点，帮助用户选择。
调整 Ollama 的并行请求数：在~/.ollama/config.json中（Ollama 服务端配置），可以设置"num_parallel": 1（默认）。如果你有强大的 GPU 和多个用户，可以适当增加，但要注意显存限制。
确保 Ollama 使用 GPU：运行ollama run时，观察输出是否显示使用了 CUDA/GPU。在客户端，你无法直接控制这一点，但可以提醒用户确保他们的 Ollama 安装正确配置了 GPU 支持。

5. 常见问题排查与实战心得

5.1 连接与网络问题

这是新手最常遇到的问题。下面是一个排查清单：

问题现象	可能原因	排查步骤与解决方案
客户端启动后，模型列表为空，或发送消息报错“无法连接到 Ollama”。	1. Ollama 服务未运行。 2.`OLLAMA_API_BASE_URL`环境变量配置错误。 3. 防火墙/网络策略阻止了连接。 4. (Docker) 容器网络不通。	1. 在终端运行`ollama list`或访问`http://localhost:11434`确认 Ollama 服务状态。 2.仔细检查环境变量：在 Docker 中运行`docker exec ollama-webui env`查看；在源码中检查`.env`文件。确保地址和端口完全正确。 3. 尝试从客户端所在环境（宿主机或容器内）用`curl http://<ollama-host>:11434/api/tags`测试连通性。 4. 对于 Docker，尝试使用`host`网络模式运行客户端容器：`docker run --network=host ...`（仅限 Linux），或使用正确的宿主机IP。
流式响应中断，回复显示不完整。	1. 网络不稳定。 2. 代理服务器干扰了 SSE (Server-Sent Events) 连接。 3. 客户端处理流的代码有 bug。	1. 检查网络连接。 2. 如果你使用了网络代理，尝试为客户端或 Ollama 服务配置绕过代理。 3. 打开浏览器开发者工具的“网络”(Network)选项卡，查看对`/api/chat`或`/api/generate`的请求，检查响应是否是“事件流”(EventStream)类型，以及是否有错误状态码。
访问客户端页面时，浏览器控制台报 CORS 错误。	Ollama 服务默认可能未正确配置 CORS 头部，而客户端是从不同源（域名/端口）发起的请求。	这是服务端的问题。你需要为 Ollama 配置 CORS。可以设置环境变量启动 Ollama：`OLLAMA_ORIGINS="http://localhost:3000" ollama serve`，或者修改`~/.ollama/config.json`加入`"origins": ["http://localhost:3000"]`。`ollama-client`作为独立前端，无法解决此问题。

5.2 功能与使用问题

问题现象	可能原因	排查步骤与解决方案
发送消息后，回复生成速度极慢。	1. 模型首次加载。 2. 硬件资源（CPU/GPU内存）不足。 3. 模型参数过大。	1. 首次使用某个模型时，耐心等待加载。 2. 检查系统资源监控。对于 GPU，使用`nvidia-smi`查看显存占用。考虑关闭其他占用显存的程序，或换用更小的量化模型。 3. 尝试在客户端中调低`num_predict`（最大生成长度）。
对话历史丢失（刷新页面后没了）。	客户端可能未实现持久化，或持久化方案失败（如`localStorage`已满、被清除）。	检查浏览器开发者工具的“应用”(Application) -> “本地存储”(Local Storage) 看是否有相关键值对。这是客户端功能限制，可能需要等待开发者添加此功能，或自行修改源码实现`IndexedDB`存储。
无法调节温度（temperature）等高级参数。	客户端界面可能未提供这些设置选项。	查看客户端的设置或会话设置面板。如果确实没有，这是一个功能缺失。你可以通过修改前端代码，在构造请求的 payload 中加入这些参数。例如，在发送请求前，将`temperature: 0.8`加入到请求的 JSON 对象中。
想同时和两个不同的模型聊天。	客户端是否支持多会话独立模型？	这是会话管理功能的一部分。检查是否可以创建新会话，并为每个会话独立选择模型。`ollama-client`应该支持此功能。

5.3 个人实战心得与建议

经过一段时间的深度使用和源码翻阅，我总结了几点心得：

“Docker + 环境变量”是最省心的部署方式，尤其适合在 NAS、云服务器等远程环境部署。务必牢记OLLAMA_API_BASE_URL的正确设置方式，这是连接的生命线。
流式体验是灵魂。一个优秀的客户端必须流畅、无卡顿地显示流式文本。如果发现文字是等全部生成完才一下子蹦出来，那多半是流式处理逻辑有问题。可以对比其他成熟的 WebUI（如 Open WebUI）的体验。
会话管理是刚需。没有好的会话管理（创建、命名、删除、持久化），这个客户端的价值就大打折扣。在考察或自建客户端时，这是需要重点评估的功能点。
参数调节是进阶玩家的需求。对于大多数简单问答，默认参数足够。但当你需要创造性写作或要求确定性高的代码生成时，调节temperature和top_p就非常必要。一个好的客户端应该让这个操作变得方便。
生态整合是未来方向。ollama-client目前聚焦于核心聊天功能。但围绕 Ollama 的生态还有很多可以整合，例如：模型库浏览与一键下载、对话内容导出为 Markdown/PDF、与本地文件系统交互进行文档问答（需要搭配 RAG 系统）等。这是一个可以不断丰富的方向。

这个项目作为一个开源的个人作品，已经很好地完成了它的核心使命：为 Ollama 提供一个干净、可用的 Web 界面。它的代码结构清晰，基于现代前端技术栈，也为想要学习如何与 LLM API 交互、如何构建流式聊天应用的前端开发者提供了一个很好的参考案例。如果你不满足于现有功能，完全可以 Fork 它，按照自己的需求进行定制，这或许才是开源项目最大的魅力所在。

查看全文

http://www.jsqmd.com/news/828641/