当前位置: 首页 > news >正文

部署NotaGen模型并按照风格生成古典音乐曲谱

参考资料

  • https://electricalexis.github.io/notagen-demo/
  • https://github.com/ElectricAlexis/NotaGen/tree/main

最近发现了一个有趣的模型,NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。模型的训练过程和说明参考论文,https://electricalexis.github.io/notagen-demo/

NotaGen 借鉴了现代 LLM的原理,基于 Transformer 架构训练。创新点在于引入了 DPO(Direct Preference Optimization,直接偏好优化)。这意味着模型不仅在学习海量乐谱,还通过人类的审美偏好进行了“对齐”,使得生成的乐谱在听感上更接近人类大师的作品。

本次使用机器为g4dn,部署过程如下

下载模型权重

modelscope download --model ElectricAlexis/NotaGen weights_notagenx_p_size_16_p_length_1024_p_layers_20_h_size_1280.pth

环境初始化

conda create --name notagen python=3.10
conda activate notagen
conda install pytorch==2.3.0 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install accelerate
pip install optimum
pip install -r requirements.txt 

启动gradio服务,当然也可以访问官方在 Huggingface Space 上为 NotaGen-X 提供的在线 gradio 演示

$ python demo.py
Parameter Number: 515738880
* Running on local URL:  http://0.0.0.0:7861To create a public link, set `share=True` in `launch()`.

UI界面可以选择时期、作曲家和乐器作为 NotaGen 的条件生成的提示组合,目前的提示组合数量有限制(112 个。这里选择老柴的风格作曲输出结果如下,输出结果为ABC 记谱法

image-20260127132031821

将输出导出为xml格式20260127_052036_Romantic_Tchaikovsky, Pyotr_Keyboard.xml,然后在musescore中打开

image-20260127132304546

整体上听起来还是呆呆的,大师还是大师差距还很遥远,但是希望未来类似的模型能够表现更好让普通人也能够将自己的想法和风格谱成曲子。

http://www.jsqmd.com/news/308008/

相关文章:

  • 2026年企业微信怎么开通?零基础也能快速上手的完整操作流程
  • 全面解析!2026年企微联系方式的创新功能与应用场景深度盘点
  • 2026年小孩头皮痒用什么儿童洗发水效果好?五大小朋友适用效果卓越的儿童洗发水榜单
  • CA-IS3050CU替代CA-IS3050U主要参数对比
  • Elasticsearch:一切都与这些分块有关!
  • 香港研究生留学机构:最新口碑排名揭晓,学员满意度高引关注
  • 高频注入法详细教程:从理论到产品实现
  • 新加坡研究生留学中介权威排名揭晓,申请成功率高的机构全面解析
  • 千匠数字化园区解决方案,助力打造园区与企业的发展共同体
  • 2026国内最新环保板材品牌top10推荐!优质高品质环保板材厂家权威榜单发布,健康家居之选环保板材推荐
  • 英国top10研究生留学机构推荐:反馈及时,服务专业且高效
  • 重庆研究生留学中介口碑排名揭晓,学员满意度高成热议焦点
  • 2026年北京搬家公司权威测评报告:基于百家客户匿名反馈的口碑深度解析。
  • 2026年北京搬家公司推荐:基于服务覆盖与用户口碑的TOP5权威榜单
  • BUU-[BUUCTF 2018]Online Tool
  • 2026年北京搬家公司专项甄选报告:头部优质机构全景梳理及专业选型指南
  • 2026年北京搬家公司推荐榜单:深度评测与选型指南,东岳搬家领跑服务体验
  • 美团智能体SOTA模型LongCat-Flash-Thinking-2601开源
  • 文件上传漏洞原理
  • SpringCloud网页如何上传大文件夹并保留目录?
  • SpringMVC分块上传大文件有什么技巧?
  • UEDITOR的ELECTRON版本如何优化WORD图片转存速度?
  • 农业数据平台如何利用UEDITOR在ELECTRON中导入WORD图表?
  • 如何解决UEDITOR在ELECTRON下WORD图片上传失败的问题?
  • 金融系统开发中,UEDITOR的ELECTRON插件如何处理WORD报表图片?
  • 好写作AI:用AI写论文一年后,我的学术能力被“废了”还是“进化了”?
  • 完整教程:sward零基础学习,如何在sward文档中集成Kanass事项
  • 好写作AI:当“学术保姆”遇见“智能伙伴”,你的论文该跟谁走?
  • 如何使用 OKHttp 达成 HTTP/2 多路复用?
  • 好写作AI:让论文投稿从“手动相亲”进化到“精准速配”