当前位置：首页 > news >正文

基于Supabase与pgvector构建企业级RAG智能问答系统实战

news 2026/4/29 19:33:47

1. 项目概述：从零构建一个基于文档的智能问答系统

最近在做一个很有意思的尝试：如何快速地把一堆静态文档（比如公司内部Wiki、产品手册、个人笔记）变成一个能“对话”的智能助手？想象一下，你上传一份产品说明书，然后直接问它：“这个产品的保修期是多久？”或者“安装步骤的第三步具体是什么？”，它就能从文档里找到准确信息，并用自然语言回答你。这背后的核心技术就是RAG（检索增强生成），而实现它的关键，是把文本变成计算机能理解的“向量”（也叫Embedding），然后存到向量数据库里进行相似度搜索。

我花了点时间，用Supabase和pgvector搭建了一个完整的、生产就绪的MVP。Supabase提供了开箱即用的PostgreSQL数据库、对象存储、身份认证和边缘函数，而pgvector则是PostgreSQL的向量扩展，让你能在熟悉的SQL环境里直接做向量运算。整个流程跑通，从文件上传、文档解析、向量化到最终实现对话界面，大概就两个多小时。这篇文章，我会把每一步的细节、踩过的坑，以及为什么这么设计的思考，完整地拆解给你。无论你是想给自己建一个知识库助手，还是探索AI应用落地的可能性，这套方案都值得一试。

2. 核心架构与设计思路拆解

2.1 为什么选择 Supabase + pgvector 这套组合？

在做技术选型时，我主要考虑了这几个点：开发速度、运维复杂度、成本以及生态整合度。市面上做向量存储的方案不少，有专门的向量数据库（比如Pinecone、Weaviate），也有大厂的全托管服务。但对我来说，Supabase + pgvector 的组合有几个无法拒绝的优势：

首先是开发体验的“无缝感”。Supabase本质上是一个增强了功能的PostgreSQL数据库，所有数据（用户信息、文件元数据、向量）都存在于同一个数据库实例中。这意味着我不需要在多个服务之间同步数据、处理分布式事务，或者担心数据一致性问题。当我查询“用户A上传的文档中，与问题最相关的段落”时，一个SQL JOIN就能搞定，这比在应用层拼凑多个API的返回结果要可靠和高效得多。

其次是pgvector的成熟与简单。pgvector是一个PostgreSQL扩展，安装后就像使用任何其他数据类型（如整数、文本）一样使用向量。它支持两种主流的索引类型：IVFFlat和HNSW。IVFFlat适合静态数据集，创建索引前需要先对数据进行聚类；而HNSW（我们项目中采用的）则是一种基于图的算法，对动态数据更友好，即使表是空的也可以先创建索引，后续插入数据时索引会自动更新。对于我们的场景——用户会持续上传新文档——HNSW显然是更合适的选择。

最后是Supabase的“全家桶”特性。它除了数据库，还集成了身份认证（Auth）、对象存储（Storage）、实时订阅（Realtime）和边缘函数（Edge Functions）。在这个项目里，我们用Auth来处理用户登录，用Storage来存用户上传的原始文件，用Edge Functions来跑文档解析和向量生成的异步任务。所有这些服务都通过统一的SDK和API密钥管理，大大减少了集成和配置的负担。

整个系统的数据流可以概括为：用户上传文件 -> 文件存入Storage并触发数据库触发器 -> 触发器调用Edge Function解析文档 -> 解析后的文本块存入数据库并触发向量生成 -> 用户提问时，将问题向量化，在数据库中进行相似度搜索 -> 将搜索结果（相关文本块）连同问题一起发给大语言模型（如GPT）生成最终答案。

2.2 行级安全策略：数据隔离的基石

既然是生产级应用，数据安全必须是第一位的。我们的系统需要确保用户A绝对无法访问到用户B上传的文档。这在Supabase中通过PostgreSQL的行级安全策略来实现，这是整个系统安全架构的核心。

RLS的工作原理是在表级别上定义策略（Policies），这些策略在每次数据访问（SELECT, INSERT, UPDATE, DELETE）时自动生效。在我们的documents和document_sections表中，每条记录都通过created_by字段与一个具体的auth.users记录关联。

我为documents表创建了这样的策略：

-- 用户只能插入自己创建的文档 create policy "Users can insert documents" on documents for insert to authenticated with check (auth.uid() = created_by); -- 用户只能查询自己创建的文档 create policy "Users can query their own documents" on documents for select to authenticated using (auth.uid() = created_by);

关键点在于auth.uid()这个函数。当用户通过Supabase Auth登录后，每个数据库请求的上下文中都会自动包含该用户的JWT令牌。auth.uid()就是从令牌中提取用户ID。authenticated是一个特殊的数据库角色，代表所有已登录的用户。这样，即使用户直接执行SELECT * FROM documents;，数据库引擎也会自动加上WHERE created_by = auth.uid()的条件，实现数据自动过滤。

对于document_sections表，策略稍微复杂一点，因为它需要通过外键document_id来间接关联用户：

create policy "Users can query their own document sections" on document_sections for select to authenticated using ( document_id in ( select id from documents where created_by = auth.uid() ) );

这个策略的意思是：允许用户查询那些document_id存在于“该用户拥有的文档ID集合”中的段落。这种链式权限检查确保了数据隔离的完整性。

实操心得：RLS策略的测试在开发过程中，一定要用不同用户的身份（比如在浏览器无痕窗口登录另一个账号）来测试数据隔离是否真的生效。一个常见的错误是只在应用层做过滤，而忽略了数据库层面的直接查询。Supabase客户端默认会携带用户的JWT，所以RLS会自动生效。但如果你在Edge Function或后台任务中直接使用服务端密钥（service_role key）连接数据库，这些策略就会被绕过，需要格外小心。

3. 核心模块实现细节与实操要点

3.1 文件存储与安全上传策略

文件上传是入口，这里的安全性和健壮性至关重要。我们使用Supabase Storage来存储用户上传的原始文件，它底层是AWS S3，但提供了更简单的API和与数据库的深度集成。

创建存储桶和策略首先，我们需要在数据库中初始化一个存储桶。这不是在管理界面上点按钮，而是通过SQL迁移文件完成的，保证了环境的一致性。

-- 在迁移文件中 insert into storage.buckets (id, name) values ('files', 'files') on conflict do nothing;

on conflict do nothing是一个很好的实践，确保这个迁移可以安全地重复运行。

接下来是核心的安全策略。我们不仅要防止用户访问他人的文件，还要防止用户通过构造特殊路径进行越权操作。最初的策略只检查了bucket_id和owner：

create policy "Authenticated users can upload files" on storage.objects for insert to authenticated with check ( bucket_id = 'files' and owner = auth.uid() );

但这个策略有个漏洞：用户虽然不能指定owner（系统会自动设置），但他们可以控制上传的路径（path）。如果路径设计不当，可能会带来安全问题。

改进：路径UUID校验我采用了一个更严格的方案：要求上传路径的第一段必须是一个有效的UUID。这样做的目的是将每个用户的文件都隔离在一个由UUID命名的“文件夹”下，路径看起来像这样：/550e8400-e29b-41d4-a716-446655440000/my-document.pdf。

首先，创建一个辅助函数来安全地验证字符串是否为UUID：

create or replace function private.uuid_or_null(str text) returns uuid language plpgsql as $$ begin return str::uuid; -- 尝试转换 exception when invalid_text_representation then return null; -- 转换失败返回null end; $$;

这个函数用了PL/pgSQL的异常处理块。如果转换失败，它优雅地返回null而不是让整个查询崩溃。

然后，更新插入策略，利用PostgreSQL的数组函数path_tokens（Storage服务会自动将路径按/分割成数组）来校验第一段：

create policy "Authenticated users can upload files" on storage.objects for insert to authenticated with check ( bucket_id = 'files' and owner = auth.uid() and private.uuid_or_null(path_tokens[1]) is not null -- 关键校验 );

这样，任何试图上传类似/etc/passwd或../other-user-file.txt的路径都会被RLS策略拒绝。

前端上传实现在前端，使用Supabase JavaScript客户端上传非常简单：

const supabase = createClientComponentClient(); const file = event.target.files[0]; const filePath = `${crypto.randomUUID()}/${file.name}`; // 生成UUID路径 const { error } = await supabase.storage .from('files') .upload(filePath, file); if (error) { // 处理错误，可能是RLS策略拒绝 console.error('Upload failed:', error.message); }

crypto.randomUUID()是浏览器原生API，用于生成版本4的UUID，确保了路径的唯一性和随机性。

3.2 文档解析与分块策略

文件上传后，需要将其内容提取出来，并分割成适合检索的“块”。这一步直接决定了后续检索的质量。我们处理的是Markdown文件，因为它结构清晰，包含标题、列表、代码块等语义信息。

为什么按标题分块？常见的分块策略有：固定长度重叠分块、按句子/段落分块、按语义分块。对于技术文档，按标题分块有显著优势：

语义完整性：一个标题下的内容通常围绕一个主题展开，作为一个整体来理解更准确。
结构保持：保持了文档的层级关系，检索时能知道这段内容属于哪个章节。
长度适中：通常不会过长或过短，适合作为LLM的上下文。

我们使用一个预写的processMarkdown函数（基于mdast语法树库）来实现。它的核心逻辑是遍历Markdown的AST（抽象语法树），遇到标题节点（如## 二级标题）时，就认为前一个章节结束，新章节开始，然后将该章节下的所有内容（段落、列表、代码块等）合并成一个文本块。

数据库表设计解析后的数据存入两张表：

documents: 存储文档的元信息，如名称、关联的存储对象ID、创建者。
document_sections: 存储文档分块后的内容，每个块包含所属文档ID、文本内容以及最重要的embedding向量字段。

这里有一个设计细节：我们创建了一个视图documents_with_storage_path，通过JOIN将documents表和storage.objects表关联起来，方便一次性获取文档的元信息和它在Storage中的实际路径。视图加了security_invoker = true选项，意味着查询视图时会检查底层表的RLS策略，保证了安全性的传递。

自动化处理管道整个解析过程是自动化的，由数据库触发器驱动：

用户在Storage中上传文件，storage.objects表插入新记录。
on_file_upload触发器被触发。
触发器函数private.handle_storage_update()执行： a. 向documents表插入一条新记录。 b. 使用pg_net扩展，向/functions/v1/process这个Edge Function发起一个HTTP POST请求，将新文档的ID传递过去。
Edge Function下载文件，解析Markdown，将分块结果插入document_sections表。

注意事项：触发器的异步性这里触发器调用Edge Function是异步的（net.http_post是非阻塞的）。这意味着文件上传的API调用会立即返回成功，而实际的文档解析在后台进行。这对于用户体验是友好的，但需要在前端设计相应的状态提示（如“文档处理中…”）。同时，要确保Edge Function具有幂等性，即使因为网络问题被重复调用，也不会产生重复数据。

3.3 向量生成与嵌入策略

文本分块后，下一步是将这些文本块转换为向量（Embedding）。我们使用Supabase AI提供的gte-small模型在Edge Function中本地运行，无需调用外部API，速度快且成本低。

通用触发器设计为了让向量生成逻辑可复用，我设计了一个通用的触发器函数private.embed()。它通过TG_ARGV（触发器参数）来动态确定：

TG_ARGV[0]: 包含文本内容的列名（如content）。
TG_ARGV[1]: 要存储向量的列名（如embedding）。
TG_ARGV[2]: 批处理大小（默认5）。
TG_ARGV[3]: 请求超时时间（默认5分钟）。

这样，只需要在目标表上创建一个触发器，并传入参数即可：

create trigger embed_document_sections after insert on document_sections referencing new table as inserted for each statement execute procedure private.embed('content', 'embedding', 5, 300000);

referencing new table as inserted语法允许我们在触发器函数中通过inserted这个表名来引用本次插入的所有新行。

批处理与错误处理触发器函数内部会计算需要分成多少批，然后为每一批数据调用一次/embedEdge Function。批处理能平衡单次请求的负载和总体的并发数。

这里有一个生产环境必须考虑的问题：如果某次Edge Function调用失败了（网络波动、模型推理错误等），对应的文本块就会缺失向量。我们的触发器没有内置重试机制。在生产中，常见的补偿方案有：

手动修复脚本：写一个SQL函数或管理界面，可以手动触发对缺失向量记录的重新计算。
定时扫描任务：创建一个Scheduled Edge Function，定期扫描document_sections表中embedding IS NULL的记录，并重新处理。为了避免和正常触发器冲突，可以加一个processing_lock字段或使用SKIP LOCKED特性。

Edge Function中的向量生成在embedEdge Function中，关键代码如下：

const model = new Supabase.ai.Session('gte-small'); // ... 获取数据 ... for (const row of rows) { const output = (await model.run(row.content, { mean_pool: true, // 对输出进行平均池化，得到句子级向量 normalize: true, // 归一化向量，方便后续使用余弦相似度 })) as number[]; // ... 更新数据库 ... }

gte-small是一个约3300万参数的开源文本嵌入模型，在速度和效果上取得了很好的平衡。mean_pool: true选项会将模型输出的每个token的向量进行平均，得到一个代表整个文本块的固定长度向量（这里是384维）。normalize: true使得输出向量的模长为1，这样向量点积就等于余弦相似度，是语义搜索最常用的相似度度量方式。

3.4 对话检索与生成实现

这是最后一步，也是用户体验的直接体现。当用户提出一个问题时，系统需要：

将问题转换成向量。
在document_sections表中搜索与问题向量最相似的文本块。
将这些相关文本块作为“上下文”，连同用户问题一起发送给大语言模型（如OpenAI GPT），让它生成一个连贯、准确的答案。

相似度搜索SQLpgvector提供了几种向量相似度运算符。我们使用<->运算符，它计算欧几里得距离（L2距离）。由于我们的向量是归一化的，也可以使用<=>运算符计算余弦距离，或者用<#>计算负内积（对于归一化向量，结果与余弦相似度相关）。这里使用<->：

select ds.content, ds.embedding <-> $1 as distance from document_sections ds join documents d on ds.document_id = d.id where d.created_by = auth.uid() -- RLS确保只能搜自己的文档 order by ds.embedding <-> $1 -- 按距离排序，越近越相似 limit 5;

$1是用户问题的向量。这条查询会返回当前用户文档中最相关的5个文本块。我们之前创建的HNSW索引会极大地加速这个排序过程。

构建提示词将检索到的文本块直接扔给LLM是不够的，需要精心构造提示词（Prompt）：

你是一个专业的文档助手。请根据以下上下文信息回答用户的问题。如果上下文信息不足以回答问题，请直接说“根据提供的文档，我无法回答这个问题”。 上下文信息： --- {这里拼接检索到的文本块，用分隔符隔开} --- 用户问题：{用户的问题} 请根据上下文，用中文给出清晰、准确的回答：

这个提示词做了几件事：定义了角色、设定了回答边界（防止幻觉）、清晰地分隔了上下文和问题、指定了回答语言。

前端流式输出为了更好的用户体验，我们使用Vercel的AI SDK来实现流式响应。这样，答案是一个词一个词地显示出来，而不是等待全部生成完毕。

import { useChat } from 'ai/react'; const { messages, input, handleInputChange, handleSubmit } = useChat({ api: '/api/chat', // 指向我们自己的API路由 streamProtocol: 'text', // 使用文本流 }); // 在组件中 <form onSubmit={handleSubmit}> <input value={input} onChange={handleInputChange} /> </form> <div> {messages.map(m => (<div key={m.id}>{m.content}</div>))} </div>

在后端的API路由中，我们需要调用OpenAI的Chat Completion API，并将stream: true的响应转发给前端。

4. 部署、优化与生产环境考量

4.1 本地开发与云部署切换

Supabase的一个强大之处在于提供了完全一致的本地开发体验。你可以用Docker在本地运行全套服务（数据库、Auth、Storage、Edge Functions），也可以直接连接云端项目。

本地开发

npx supabase start

这个命令会启动一系列Docker容器。之后，通过npx supabase status可以获取本地服务的URL和密钥，填入.env.local文件即可。本地Edge Functions通过npx supabase functions serve来运行和调试，支持热重载，打印的日志会直接显示在终端，非常方便。

连接云端项目当你需要测试云环境，或者准备部署时：

npx supabase link --project-ref=your-project-ref npx supabase db push # 推送本地迁移到云端 npx supabase functions deploy embed process # 部署边缘函数

db push命令会计算本地迁移文件和云端数据库的差异，并安全地应用更改。这比直接执行SQL脚本更可靠。

重要提示：环境变量与密钥本地开发时，Edge Function可以通过Deno.env.get('SUPABASE_URL')自动获取到本地服务的URL。但在云端，你需要手动在Supabase仪表板的“Settings -> API”中找到URL和anon密钥，并将其设置为Edge Function的环境变量。对于像OpenAI API密钥这样的敏感信息，务必使用Supabase的密钥管理功能（vault.secrets），而不是硬编码在代码中。

4.2 性能调优与监控要点

向量索引优化我们使用了HNSW索引，创建语句是：

create index on document_sections using hnsw (embedding vector_ip_ops);

vector_ip_ops表示使用内积（inner product）作为距离度量运算符。对于归一化后的向量，内积等于余弦相似度。索引创建时可以调整几个参数来平衡构建速度、查询速度和内存占用：

m：每个节点在图中连接的边数（默认16）。增加m可以提高召回率，但会增大索引大小和构建时间。
ef_construction：构建时动态候选列表的大小（默认64）。增加它可以让图的质量更高，但也会让构建更慢。

对于千万级以下的数据集，默认参数通常足够。你可以通过EXPLAIN ANALYZE来查看查询是否使用了索引，以及查询计划。

Edge Function的冷启动与超时Supabase Edge Function运行在Deno Deploy上。函数在闲置一段时间后会被“冷冻”，下次调用时会有冷启动延迟。对于/embed这种对延迟不太敏感的后台任务，影响不大。但对于/api/chat这种同步对话接口，如果用户感知到明显的延迟，可以考虑：

使用更轻量的模型（如gte-small而不是gte-base）。
实现一个简单的“心跳”机制，定期ping一下自己的函数来保持其活跃（需注意成本）。
在函数中做好错误重试和超时设置，给用户友好的提示。

日志与监控Supabase Dashboard提供了Edge Function的调用日志和错误报告。对于生产应用，建议：

在关键步骤（如开始处理文档、生成嵌入、调用OpenAI）添加结构化的日志。
监控函数的错误率、延迟和调用次数。
对于数据库，可以关注pg_stat_statements视图，找出慢查询。

4.3 扩展性与后续迭代方向

这个MVP只是一个起点，有很多可以扩展和深化的地方：

多格式文件支持目前只处理Markdown。可以通过在processEdge Function中集成pdf-parse、mammoth（用于Word）等库来支持PDF、Word、Excel等格式。文本提取后，可以统一转换成Markdown格式再进行分块。

混合搜索单纯的向量搜索（语义搜索）有时会漏掉精确的关键词匹配。可以结合PostgreSQL的全文搜索（使用tsvector和tsquery）进行混合搜索。例如，可以先通过全文搜索过滤出包含某些关键词的文档块，再在这些结果中进行向量相似度排序，或者将两种搜索的分数进行加权融合。

对话历史与多轮问答当前的实现是“单轮”问答，没有记忆上下文。可以在数据库中增加一个conversations表来存储会话，一个messages表来存储每轮问答的历史。当用户提出新问题时，除了检索文档，还可以将最近的对话历史也作为上下文提供给LLM，实现连贯的多轮对话。

更精细的分块与元数据可以尝试不同的分块策略，比如按段落、按固定字符数（如500字）重叠分块。还可以为每个文本块提取元数据，如所属的标题层级、包含的代码语言、创建时间等，在检索时可以利用这些元数据进行过滤或加权。

成本与缓存优化如果使用OpenAI等付费API生成Embedding或进行对话，成本是需要考虑的。可以对常见问题或高频查询的“问题-向量”对进行缓存。对于文档内容，一旦生成向量，除非文档更新，否则不需要重复生成。

5. 常见问题与故障排查实录

在实际搭建和测试过程中，我遇到了不少典型问题，这里整理出来供你参考。

5.1 数据库迁移与版本控制

问题：多人协作或在不同环境（开发、测试、生产）部署时，如何保证数据库结构一致？解决：始终坚持使用迁移文件（Migration Files）。Supabase CLI通过supabase/migrations文件夹管理迁移。每次对数据库的修改（建表、加字段、创建策略）都必须通过npx supabase migration new <name>创建新的迁移文件。这些文件应该被纳入Git版本控制。部署时，使用npx supabase db push（云端）或npx supabase migration up（本地）来按顺序应用所有迁移。绝对不要直接通过Dashboard的SQL编辑器修改生产数据库结构。

问题：迁移文件执行失败怎么办？解决：迁移文件中的SQL必须是幂等的。使用CREATE TABLE IF NOT EXISTS、DROP TABLE IF EXISTS、CREATE OR REPLACE FUNCTION等语句。如果已经手动修复了生产数据库，需要创建一个新的迁移文件，其内容与当前生产状态一致，以确保后续迁移能正确运行。

5.2 权限与RLS策略失效

问题：在Edge Function中操作数据库，RLS似乎不生效，能查到所有用户的数据。原因：Edge Function默认使用service_role密钥（拥有最高权限）连接数据库，会绕过RLS。解决：在创建Supabase客户端时，必须手动传递原始请求中的Authorization头，这样Supabase后端会使用这个JWT来识别用户身份，RLS才会生效。

const authorization = req.headers.get('Authorization'); const supabase = createClient(supabaseUrl, supabaseAnonKey, { global: { headers: { authorization } }, auth: { persistSession: false }, });

问题：用户能上传文件，但documents表里没有记录，或者processEdge Function没被触发。排查：

检查Storage触发器on_file_upload是否成功创建：\df+ private.handle_storage_update。
检查触发器内的SQL逻辑，特别是net.http_post调用。查看Edge Function的日志，确认是否收到请求。
检查storage.objects表中新记录的owner字段是否正确（应为用户UID）。确保前端上传时用户已登录。

5.3 向量搜索相关性问题

问题：搜索返回的结果与问题不相关。排查步骤：

检查文本分块质量：直接查询document_sections表，看看分块后的内容是否合理，有没有被意外截断或包含过多无关信息（如大量代码或链接）。
检查向量生成：确认embedding字段不为NULL，并且其JSON数组长度是384（gte-small模型的维度）。可以手动调用/embed函数，或者写一个SQL查询来验证。
验证相似度计算：手动将一个已知的问题文本通过Edge Function生成向量，然后写一个SQL查询，计算它与几个已知段落向量的距离，看排序是否符合直觉。
调整搜索参数：尝试增加limit返回更多结果，或者使用不同的距离度量方式（如将<->欧氏距离改为<=>余弦距离）。

问题：搜索速度很慢，尤其是文档数量增多后。解决：

确认HNSW索引已创建：\di查看索引列表。
使用EXPLAIN ANALYZE分析慢查询，确认是否真的走了索引扫描（Index Scan using ...）。
考虑调整HNSW索引的m和ef_construction参数，重建索引。
确保查询条件能有效利用索引。例如，先通过document_id或created_by过滤出少量数据，再进行向量搜索，比全表扫描快得多。

5.4 Edge Function 部署与调试

问题：本地Edge Function运行正常，部署到云端后失败。解决：

检查环境变量：云端Edge Function的环境变量需要在Dashboard中单独设置。确保SUPABASE_URL、SUPABASE_ANON_KEY以及可能用到的OPENAI_API_KEY等都已正确配置。
检查依赖：确保import_map.json中所有依赖的URL都是可访问的，并且版本兼容。有时esm.sh上的特定版本可能有问题，可以尝试去掉版本号或换用其他CDN。
查看日志：Supabase Dashboard的Edge Function日志是首要的调试工具。注意Deno的权限标志，如果你的函数需要网络访问，部署命令需要包含--allow-net标志（Supabase CLI通常会处理）。

问题：Edge Function 超时。解决：Edge Function默认有10秒的执行超时限制。对于/process这种可能处理大文件的函数，很容易超时。

优化处理逻辑：对于大Markdown文件，分块处理时可以边解析边插入数据库，而不是全部解析完再一次性插入。
增加超时时间：在Supabase Dashboard中，可以为单个函数配置更长的超时时间（最高可达300秒）。
拆分为小函数：将“下载文件”、“解析”、“存储”拆分成多个函数，通过队列或链式调用来完成，每个函数负责一个快速完成的任务。

5.5 前端状态与用户体验

问题：文件上传后，列表没有实时更新。解决：前端使用了React Query来管理状态。确保在文件上传成功的回调函数中，调用queryClient.invalidateQueries(['files'])来使files这个查询缓存失效，从而触发重新获取数据。也可以考虑使用Supabase的Realtime功能，让数据库的插入操作主动推送通知到前端。

问题：聊天回答速度慢，或中途中断。解决：

检查网络，确保到OpenAI API或Supabase AI服务的连接稳定。
在前端实现流式接收时，做好加载状态和错误边界的UI处理。
如果使用OpenAI，检查是否达到了速率限制。可以考虑对请求进行排队、重试，或者升级API套餐。

整个项目搭建下来，最深的体会是，利用Supabase这样的一体化后端平台，确实能让我们把精力集中在业务逻辑和创新上，而不是繁琐的基础设施搭建。从文件上传到智能对话，每一个环节都有清晰、可靠的解决方案。虽然过程中需要仔细处理权限、异步任务和错误处理这些细节，但整体的开发体验是流畅且高效的。如果你也想快速验证一个AI结合个人数据的想法，这套技术栈是一个非常棒的起点。

查看全文

http://www.jsqmd.com/news/720653/