当前位置: 首页 > news >正文

HeartMuLa - 用AI创作歌曲 输入歌词即可创作音乐 支持50系显卡 一键整合包下载

HeartMuLa 是一个开源的“音乐大模型工具库”,它能把歌词和标签转化为完整的音乐作品,还能做歌词转录、音乐编码和跨模态检索。它的特点是多语言支持(中、英、日、韩、西班牙语等)、高保真音频生成,以及和文字描述的紧密结合。应用领域包括音乐创作、歌词转录、音乐检索、AI伴奏和多媒体内容生产。


简单的说,你给它几句歌词 + 一点风格描述(比如“伤感钢琴情歌”“激昂摇滚”“古风仙侠”),它就能自动给你生成一首还挺像样的歌,包括人声+伴奏,无需专业的音乐知识,无需复杂的参数设置。

今天分享的HeartMuLa一键包基于最新开源的 HeartMuLa 3B模型打包,测试下来,效果非常好,超越之前发布的几款开源模型,效果甚至可以跟2025年前后的一些商业AI音乐工具比一比了,尤其在中文歌词的表现上特别友好。缺点是目前生成速度略慢,且资源占用高。我在官方原版的基础上稍作优化,提升了生成速度,降低了资源占用。官方也把提升生成速度加入了后期优化的计划中,期待官方的优化版。

下载地址:点此下载

核心特点

音乐生成模型 HeartMuLa:输入歌词和标签(如“浪漫、钢琴、婚礼”),即可生成对应风格的音乐,支持多语言。
高保真音乐编码 HeartCodec:一种 12.5Hz 的音乐编码器,能高质量重建音频,保证生成音乐的清晰度。
歌词转录 HeartTranscriptor:基于 Whisper 调优的模型,专门用于把歌曲里的歌词转成文字。
跨模态检索 HeartCLAP:把音乐和文字描述映射到同一个空间,方便用文字搜索音乐或用音乐找描述。
多语言支持:不仅支持英文,还能处理中文、日文、韩文、西班牙语等歌词。
开源与可本地部署:基于 Apache 2.0 协议,用户可以下载模型权重,在本地运行生成音乐。



应用领域

音乐创作:帮助音乐人快速生成伴奏或完整曲目,适合灵感捕捉和草稿创作。
歌词转录:自动识别歌曲中的歌词,方便字幕制作或音乐分析。
音乐检索:通过文字描述找到对应的音乐片段,适合音乐库管理或推荐系统。
多媒体制作:为视频、游戏、广告生成定制化的背景音乐。
教育与研究:作为 AI 音乐生成的研究平台,探索跨模态学习和音乐语言建模。




使用教程:(建议N卡,显存12G起,支持50系显卡)

下载主程序压缩包和模型文件(ckpt文件夹),解压主程序,并把模型文件移动到主程序目录下

输入歌词,可以参考默认的标签,比如 副歌、桥段等,设置参数,比如最大音频长度(毫秒)等
最后点生成歌曲。

模型切换这里官方暂时开放了3B模型,后期开放7B下载后,即可自由切换。

软件目录结构

📂 HeartMuLa/
├── 📂 ckpt/
│ ├── 📂 HeartMuLa-oss-3B/
│ │ └── model-00001-of-00004.safetensors
│ │ └── model-00002-of-00004.safetensors
│ ├── 📂 HeartCodec-oss/
│ │ └── model.safetensors
📂 deepface/
......

http://www.jsqmd.com/news/275874/

相关文章:

  • 基于SpringBoot+Vue的华强北商城二手手机管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】
  • 性价比高的半自动穿管机企业
  • 三轴MEMS加速度计感知万物运动,精准赋能无限可能
  • 动态住宅IP是什么呢?都有什么用途?
  • 基于SpringBoot+Vue的夕阳红公寓管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】
  • 4款免费低代码工具推荐:中小企业数字化转型的零成本解决方案
  • 2026年 GIS工具精选:从专业级到轻量化的5款实用软件
  • 从初级测试工程师进阶中级测试岗,一篇避开弯路...
  • GPEN判别器训练技巧?学习率与epoch数调参经验分享
  • 基于PLC的六部十层电梯控制系统设计
  • GPT-OSS与RAG结合:知识库问答系统搭建案例
  • Go语言对接天远车辆二要素核验API接口调用代码流程、接入方法以及应用场景
  • Java Web 在线家具商城设计与实现系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • 德风新征程冲刺港股:9个月营收2.75亿亏1亿 创新工场与招商局创新是股东
  • GPEN批量处理失败图片保留原图机制说明
  • 大模型训练学习方法详解:从有监督到强化学习,一篇全掌握(建议收藏)
  • 药捷安康完成配售:募资1.9亿港元 无营收,半年亏损过亿
  • 大模型应用:电商智能推荐:基于本地大模型的冷启动智能推荐系统实例.61
  • 前后端分离mvc高校办公室行政事务管理系统系统|SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程
  • 2026年1月最新武汉货架租赁品牌哪家可靠?三大实力服务商深度解析
  • 2026年最新评价高的重型货架源头厂家综合评估与精选推荐
  • Ubuntu 26.04安装数据库管理工具datagrip
  • 2026年现阶段有实力的货架批发厂家推荐几家
  • 华为云国际版对象存储OBS有多快?云端未来YDWLCloud做了极限测试
  • 3款视觉大模型工具推荐:Glyph免配置镜像部署快速体验
  • 多软件协同工作流:ZBrush+SP+Blender角色资产全流程解析
  • 全网最细,接口测试流程与面试+回答,一套上高速...
  • 别再盲目刷题!C++ 后端面试这样准备,大厂 HR 更认可
  • 马斯克的X平台的算法已经正式开源了
  • 图像格式:RGB、BGR、RGBA、BGRA