当前位置：首页 > news >正文

Qwen1.5-1.8B-Chat-GPTQ-Int4效果实测：中文情感分析、观点抽取、舆情摘要生成

news 2026/3/27 0:24:06

Qwen1.5-1.8B-Chat-GPTQ-Int4效果实测：中文情感分析、观点抽取、舆情摘要生成

1. 模型简介与测试背景

通义千问1.5-1.8B-Chat-GPTQ-Int4是一个经过量化压缩的中文对话模型，基于Qwen1.5架构开发。这个模型特别适合在资源有限的设备上运行，同时保持了相当不错的文本理解能力。

我们这次测试的重点是看看这个模型在实际应用中的表现，特别是三个常见但很重要的任务：中文情感分析（判断一段文字是正面还是负面情绪）、观点抽取（从大段文字中找出关键观点）、舆情摘要生成（把长篇评论压缩成简短摘要）。

测试环境使用了vllm部署框架，这是一个专门为大规模语言模型设计的高效推理引擎，能够显著提升模型的响应速度。前端界面通过chainlit搭建，提供了一个简单易用的聊天式交互界面。

2. 中文情感分析效果测试

情感分析是自然语言处理中最基础也最实用的功能之一，无论是电商评论分析、社交媒体监控还是客服质量评估，都需要准确判断文本的情感倾向。

2.1 测试案例与结果

我们准备了多种类型的中文文本进行测试：

商品评论分析

输入： "这款手机拍照效果真的很棒，夜景模式特别出色，但是电池续航有点短，一天要充两次电。" 模型输出： "整体评价偏正面。用户赞赏手机的拍照效果，特别是夜景模式表现优秀，但对电池续航能力表示不满意，认为需要频繁充电。"

社交媒体情绪判断

输入： "今天项目终于上线了！团队辛苦了三个月，虽然过程中遇到了很多困难，但看到成果觉得一切都值得。" 模型输出： "积极正向的情绪。表达了对项目成功的喜悦和对团队努力的认可，尽管提到过程中有困难，但整体情绪是积极和满足的。"

2.2 效果分析

从测试结果来看，模型在情感分析方面表现相当不错：

准确性高：能够准确识别文本中的主要情感倾向，不会因为个别负面词汇就错误判断整体情感
细致度高：不仅能判断正负面，还能识别出混合情感（如总体上正面但包含某些批评）
解释合理：给出的分析理由与原文内容高度吻合，不是泛泛而谈

对于一般的情感分析需求，这个1.8B的量化版本已经完全够用，响应速度也很快，通常在2-3秒内就能返回结果。

3. 观点抽取能力实测

观点抽取是从较长文本中提取核心观点和关键信息的能力，这在处理用户反馈、市场调研数据时特别有用。

3.1 实际测试案例

我们使用了一段真实的用户反馈进行测试：

输入文本： "我使用这个学习软件已经一个月了，课程内容很丰富，讲解也很清晰，特别是数学和英语部分做得很好。 不过软件有时候会卡顿，尤其是在切换章节的时候。希望可以优化一下性能，还有增加更多的互动练习。 总体来说是款不错的软件，我会继续使用并向朋友推荐。" 模型输出： 主要观点提取： 1. 正面评价：课程内容丰富，讲解清晰，数学和英语部分表现突出 2. 负面意见：软件存在卡顿问题，特别是在切换章节时 3. 改进建议：优化软件性能，增加更多互动练习 4. 总体评价：软件评价积极，用户表示会继续使用并推荐给他人

3.2 性能评估

观点抽取测试显示了模型的一些有趣特点：

优势明显：

能够准确识别不同类别的观点（赞美、批评、建议）
提取的信息完整且准确，没有遗漏重要观点
结构化输出，便于后续处理和分析

局限性：

偶尔会对一些隐含的观点理解不够深入
在处理特别长的文本时，可能会忽略一些次要但仍有价值的信息

在实际应用中，这个水平的观点抽取能力已经能够满足大多数自动化处理需求，比如自动生成用户反馈报告或者产品改进建议。

4. 舆情摘要生成测试

舆情摘要要求模型能够将长篇的讨论、评论或文章压缩成简洁的概要，同时保留核心信息和情感倾向。

4.1 多场景测试结果

电商产品评论摘要

原始评论（多条评论组合）： "用户A：手机收到用了几天，运行很流畅，打游戏不卡顿，充电速度也快，就是价格有点贵。 用户B：拍照效果确实好，夜景模式很强大，但是电池不如宣传的那么耐用。 用户C：外观设计漂亮，手感很好，系统操作流畅，值得购买。" 模型生成摘要： "用户普遍对手机的运行性能、拍照效果和外观设计表示满意，特别是游戏流畅度和夜景拍摄获得好评。 主要批评集中在价格偏高和电池续航未达预期。整体评价偏向正面，多数用户认为值得购买。"

新闻评论区摘要

原始评论： "网友A：这个政策出发点很好，但执行起来可能会有困难。 网友B：支持政府尝试新方法，希望能真正惠及百姓。 网友C：担心会有漏洞被人钻空子，需要加强监管。 网友D：早就该这样做了，支持！" 模型生成摘要： "评论显示对该政策存在多元看法：多数人认可政策初衷并表示支持，但同时担忧执行过程中的实际困难和可能存在的漏洞。 建议加强监管确保政策有效实施。整体情绪谨慎乐观。"