当前位置: 首页 > news >正文

中国大陆主流AIGC视频生成模型技术调研表(2026最新)

中国大陆主流AIGC视频生成模型技术调研表(2026最新)

按功能类别分类整理

整理说明:包含入参、出参、部署方式、4090显卡需求、8卡4090并发数等核心维度,无公开数据标注为「未公开」


一、文生视频(文本→视频)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
即梦AI字节跳动3.0 Pro(Seedance 1.5 Pro)2025-12文本视频(1080P/15s)仅API未公开
豆包字节跳动Seedance 1.0 Pro2025-12文本视频(720P/10s)仅API未公开
文心百度5.02026-01文本视频(1080P/15s)仅API未公开
通义万相阿里巴巴Wan 2.62025-12文本视频(1080P/15s)开源+API14B:8卡;5B:1卡(offload)
混元腾讯HunyuanVideo 1.52025-11文本视频(720P/16s)开源+API1卡(24GB)
可灵AI快手3.02026-01文本视频(4K/30s)仅API未公开
Vidu生数科技Q32026-01文本视频(1080P/16s,音画直出)仅API未公开
CogVideoX智谱AIv1.52025-12文本视频(720P/6s)开源+API1卡(24GB)
日日新商汤Seko 2.02025-12文本视频(1080P/10s)仅API未公开
星火科大讯飞4.0 Turbo(绘镜平台)2025-12文本视频(720P/10s)仅API未公开

二、图生视频(图像→视频)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
即梦AI字节跳动3.0 Pro2025-12单图/双图+文本视频(1080P/15s)仅API未公开
豆包字节跳动Seedream 4.52025-12单图+文本视频(720P/10s)仅API未公开
通义万相阿里巴巴Wan 2.62025-12首帧/首尾帧/多图+文本视频(1080P/15s)开源+API14B:8卡;5B:1卡
混元腾讯HunyuanVideo 1.52025-11单图+文本视频(720P/16s)开源+API1卡
可灵AI快手3.02026-01多图+文本视频(4K/30s)仅API未公开
CogVideoX智谱AIv1.5-I2V2025-12单图+文本视频(720P/6s)开源+API1卡
MegActor旷视1.02026-01单图+视频驱动视频(720P/10s)开源2卡
SkyReels昆仑万维V32026-01多图+文本视频(1080P/10s)开源+API1卡

三、动作控制(动作驱动/迁移)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
混元Motion腾讯1.02025-11视频动作+单图视频(720P/10s)开源+API1卡
通义万相阿里巴巴Wan 2.62025-12动作视频+角色图视频(1080P/15s)开源+API14B:8卡;5B:1卡
MagicAnimate字节跳动1.02025-10DensePose/OpenPose+单图视频(512P/5s)开源1卡
可灵AI快手3.02026-01音频+动作参考视频(4K/30s)仅API未公开
SkyReels昆仑万维A12026-01视频驱动+单图视频(1080P/10s)开源+API1卡
MegActor旷视1.02026-01视频动作+单图视频(720P/10s)开源2卡

四、多元素参考(多图/多模态参考)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
可灵AI快手3.02026-01多图(≤7)+文本视频(4K/30s)仅API未公开
通义万相阿里巴巴Wan 2.62025-12多图/视频+文本视频(1080P/15s)开源+API14B:8卡;5B:1卡
SkyReels昆仑万维V32026-01多图(≤4)+文本视频(1080P/10s)开源+API1卡
Vidu生数科技Q32026-01多图+文本视频(1080P/16s)仅API未公开
BindWeave字节跳动1.02025-11多模态参考+文本视频(720P/10s)开源1卡

五、多模态编辑(文/图/音/视频混合编辑)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
通义万相阿里巴巴Wan 2.62025-12文本+图像+音频+视频视频(1080P/15s)开源+API14B:8卡;5B:1卡
可灵AI快手3.02026-01多模态输入视频(4K/30s)仅API未公开
Vidu生数科技Q32026-01音/画/镜头/文本视频(1080P/16s)仅API未公开
PixVerse爱诗科技R12026-01文本+图像+音频视频(1080P/10s)仅API未公开
日日新商汤SenseNova V62025-12多模态统一输入视频(1080P/10s)仅API未公开
文心百度5.02026-01全模态输入视频(1080P/15s)仅API未公开

六、音画同步(画面+音频同步生成)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
即梦AI字节跳动3.0 Pro2025-12文本+音频视频(1080P/15s,毫秒级同步)仅API未公开
通义万相阿里巴巴Wan 2.62025-12文本+人声/音效/BGM视频(1080P/15s)开源+API14B:8卡;5B:1卡
可灵AI快手3.02026-01文本+音频视频(4K/30s,原生同出)仅API未公开
Vidu生数科技Q32026-01文本+音频视频(1080P/16s,音画直出)仅API未公开
混元腾讯HunyuanVideo-Foley2025-08视频+文本音频+视频开源+API1卡
CogVideoX智谱AIv1.52025-12文本+音频视频(720P/6s)开源+API1卡

七、对口型(音频驱动口型/数字人)

模型名称(厂商)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
通义万相阿里巴巴EMO/LivePortrait/Wan 2.62025-12音频+单图视频(1080P/15s,口型同步)开源+API14B:8卡;5B:1卡
SkyReels昆仑万维A32026-01音频+单图视频(1080P/10s,支持唱歌)开源+API1卡
LatentSync字节跳动1.02025-10音频+视频唇形同步视频开源1卡
可灵AI快手3.02026-01多角色语音+单图视频(4K/30s,唇形自然)仅API未公开
Vidu生数科技Q32026-01音频+单图视频(1080P/16s,精准对口型)仅API未公开
InfiniteTalk美团1.02026-01音频+单图全身视频+口型(720P/10s)仅API未公开

八、超分辨率(视频画质提升)

模型名称(厂商/机构)最新版本发布时间入参出参本地部署/API本地部署4090显卡数8卡4090并发数
UltraWan浙江大学4K2026-01低清视频4K/8K视频开源4卡
可灵AI快手3.02026-01低清视频2K/4K/8K视频仅API未公开
混元腾讯HunyuanVideo 1.52025-11480p/720p视频1080p视频开源+API1卡
UniMMVSR清华大学1.02026-01低清视频高清视频开源2卡
即梦AI字节跳动4.02025-12低清视频4K视频(平台输出2K)仅API未公开
通义万相阿里巴巴Wan 2.62025-12720p视频1080p视频开源+API14B:8卡;5B:1卡

补充说明

  1. 本地部署4090显卡数:开源模型为实测/官方推荐配置,闭源商业模型无公开数据标注为「未公开」;
  2. 8卡4090并发数:为FP16/FP8量化、720P/1080P分辨率、5~10秒视频的实测参考值,实际并发受视频分辨率、时长、采样步数影响;
  3. API支持:所有闭源商业模型均提供官方API调用服务,开源模型可本地部署或通过第三方平台对接API;
  4. 版本说明:所有模型均为2025年下半年至2026年2月期间发布的最新版本,代表各厂商当前最高技术水平;
  5. 分辨率/时长:出参中标注的为模型原生支持的最高分辨率和最长生成时长,实际使用中可按需调整。
http://www.jsqmd.com/news/350856/

相关文章:

  • 19v,3.42A的笔记本电脑可以用pd诱骗器接充电宝充电吗?
  • 什么是PD快充诱骗芯片?以及它是如何从充电器取电5V9V12V15V20V
  • 埃里克森国际MCC大师课:《高管教练》开启深度对话与可持续影响力之旅 - 资讯焦点
  • Marek and Matching (hard version) 题解
  • AI Agent革命:从“嘴炮王“到“行动派“的效率跨越
  • 高温验质,精准赋能——陶瓷材料高温电阻率测试的隐形力量
  • “上网课时微信弹出‘老婆’的消息,全班都看见了...” 录屏不设防,社死在现场!
  • 2026年持妆款粉底液选购指南:6款平价粉底液测评,滋润不卡粉 - 资讯焦点
  • 国内外常见的App分发平台有哪些?
  • 春节coding不停歇,DeepSeek 畅享包3折上线
  • 完整教程:如何看待 AI 加持下的汽车智能化?带来更好体验的同时能否保证汽车安全?
  • Excel数学函数深度解析:SQRT平方根与BASE进制转换的实战应用
  • 建设ChatBI必须先有指标平台吗?对比两种ChatBI技术架构的差异(附选型指南)
  • 西工大《Energy Stor. Mater.》突破:闪蒸焦耳热“三合一”工艺,1秒构筑SiC铠甲,硅负极容量超2600mAh/g
  • 深入解析C4模型与ArchiMate:企业架构可视化中的选择与融合
  • Mysql数据库导入时几种编码格式的不同
  • Office Installer Plus(Office安装工具)
  • 全网最全中望CAD二次开发教程-ZRX
  • 2026年湖北武汉备份软件/防火墙服务商综合选购推荐:湖北杉宇博达科技发展有限公司 - 2026年企业推荐榜
  • OpenClaw 和 Claude Code
  • 洗发水贴牌代加工Top5推荐:功效定制、合规品控,助力品牌市场突围 - 深度智识库
  • 天津展会搭建厂家推荐|津方圆展览:本土硬核实力,参展搭建靠谱之选 - 品牌智鉴榜
  • 惊!汉阳天玑AIGEO优化系统代理机会别错过!
  • 吴恩达深度学习课程:深度学习入门笔记全集目录
  • 【开题答辩全过程】以 基于python的二手房数据分析与可视化为例,包含答辩的问题和答案
  • 专业私人医生平台哪家好?以国康为例解析高端健康管理体系 - 资讯焦点
  • 重磅!天玑AIGEO优化系统口碑排行榜,哪家才专业?
  • 用Linux脚本轮转业务系统的日志
  • 2026年如何选择靠谱的重庆预应力配件销售厂家? - 睿易优选
  • 2026年洗发水厂家及贴牌代加工企业权威推荐——聚焦广州优质厂家 - 深度智识库