Dify 实战系列(4):实现新闻内容概要生成
在快节奏的信息时代,每天海量的新闻涌来,如何快速抓住核心要点?今天,我们来聊聊如何利用Dify、Jina Reader和LLM(大语言模型)构建一个高效的新闻内容概要生成工具。这个组合不仅简单易用,还能让你在几分钟内从网页链接中提取并总结关键信息,特别适合内容创作者、研究者和新闻爱好者。
Jina Reader:网页内容提取利器
什么是 Jina Reader?
Jina Reader 是 Jina AI 推出的专业网页内容提取 API,能够将复杂的 HTML 网页转换为适合 LLM 处理的纯文本格式。
核心优势
智能内容识别 - 自动提取正文,去除广告、导航栏等干扰元素
多格式输出 - 支持 Markdown、HTML、Text、JSON 等多种格式
动态内容处理 - 支持 SPA 单页应用和 JavaScript 渲染的页面
图像理解 - 可为图片自动生成描述文本(Alt Text)
快速使用
只需在任意 URL 前添加https://r.jina.ai/http://,即可获取干净的内容:
https://r.jina.ai/http://example.com/news/article实现步骤详解
假设你已注册Dify账号(免费版即可)或者参考我的这篇文章Dify智能体开发平台安装
安装Jina AI插件
创建Dify工作流
- 登录Dify,点击“创建应用” > 选择“工作流”模式。
- 在画布上添加“Jina Reader”节点,用于调用Jina Reader API。
- Jina Reader的使用非常简单:API端点是 https://r.jina.ai/{URL},其中{URL}是新闻链接。请求方法为GET,返回Markdown内容。
配置Jina Reader节点
第一次使用时要先从jina.ai获取API Key
添加LLM节点
- 拖入“LLM”节点,连接到Jina Reader节点的输出。
- 配置LLM模型(如使用Qwen3-8B)。
- 设置Prompt(提示词)例如:请基于以下新闻内容生成一个简洁的概要,包括主要事件、关键人物和影响。内容长度控制在200字以内。
添加输入和输出
- 在工作流开头添加“用户输入”节点,让用户输入新闻URL
- 结尾添加“输出”节点,返回LLM生成的概要
- 保存并发布应用,就可以通过Dify的聊天界面或API调用它
完整流程流
实际示例
输入一个新闻链接,
如“https://www.163.com/dy/article/KML69USK0519DDQ2.html”
Jina Reader节点提取内容:去除页面杂项,输出纯文本Markdown。
LLM节点:生成新闻的概要
测试中,这个流程处理一篇新闻只需几秒钟,准确率高。
通过Dify + Jina Reader + LLM,你可以轻松实现新闻内容概要生成,节省时间,提升效率。
