当前位置：首页 > news >正文

多模态舆情监测技术深度解析：Infoseek 如何实现 AI 造假与短视频舆情的精准捕捉？

news 2026/7/6 16:26:04

一、行业背景：非文本舆情爆发催生技术革新

2025 年，AI 生成式舆情占比达 38%，62% 的舆情首发于短视频、直播等非文本场景，传统基于关键词匹配的舆情监测系统面临 “漏采率超 60%、响应延迟超 1 小时” 的技术瓶颈。合肥 AI 造谣案、景区文创抄袭案等事件证明，仅能处理文本的监测工具已无法满足企业需求，多模态、智能化成为舆情监测的核心发展方向。

字节探索 Infoseek 基于 “分布式采集 + 大模型分析 + 实时决策” 架构，实现了对文本、视频、音频、图片的全形态舆情捕捉，其技术架构值得行业借鉴。

二、核心技术架构拆解

2.1 多模态采集模块：全场景数据捕获

（1）视频解析核心流程

采用 FFmpeg 抽取关键帧（每 3 秒 1 帧），通过 CNN 提取画面特征，结合 OCR 技术识别视频中的文字信息（如产品批号、门店地址），准确率达 99.2%；
支持抖音、快手、视频号等主流平台的实时采集与直播回放分析，核心代码片段如下：

// 多模态采集任务调度核心逻辑 public class MultiModalCrawlerScheduler { private RedisTemplate redisTemplate; private CrawlerNodeManager nodeManager; public void dispatchTask(MonitorTask task) { // 解析任务类型（文本/视频/音频/图片） ContentType type = task.getContentType(); // 匹配最优采集节点（基于地域、负载、历史成功率） CrawlerNode node = nodeManager.selectOptimalNode(task.getSource(), type); // 生成反爬策略 CrawlerStrategy strategy = AntiCrawlStrategyFactory.getStrategy(task.getSource()); // 提交任务至节点队列 redisTemplate.opsForList().leftPush(node.getTaskQueueKey(), JSON.toJSONString(task.withStrategy(strategy))); redisTemplate.convertAndSend("crawler_task_status", task.getTaskId() + ":dispatched"); } }

（2）音频转写技术

集成字节自研 ASR 引擎，支持 28 种方言及网络黑话识别，转写延迟＜100ms；
通过声纹特征（语速、音调）辅助情感分析，区分 “客观建议” 与 “恶意吐槽”，提升舆情研判精准度。

2.2 AI 智能研判模块：Deepseek 大模型驱动

（1）AI 造假识别

基于 Deepseek-7B 微调，通过 “语义逻辑检测 + 来源可信度评估 + 特征指纹提取” 三重机制，识别 AI 生成文本、拼接视频等造假内容，准确率达 99.3%；
针对合肥 AI 造谣案中的生成式文本，系统可快速识别 “关键词堆砌”“逻辑断层” 等特征，10 分钟内完成真伪判定。

（2）实体消歧与情感分析

采用 BERT+GNN 混合模型，解决舆情中的同名实体混淆问题，核心代码如下

def entity_disambiguation(mention, context): # 候选实体生成（基于词典匹配） candidates = entity_dictionary.match(mention) if len(candidates) == 1: return candidates[0] # 上下文特征提取 context_embedding = bert_model.encode(context) # 候选实体嵌入匹配 candidate_embeddings = kg_embedding.get_embeddings(candidates) # 余弦相似度计算 similarities = cosine_similarity(context_embedding, candidate_embeddings) return candidates[np.argmax(similarities)]