当前位置: 首页 > news >正文

用LFM2.5-Audio-1.5B-GGUF模型处理文字转语音和语音转文字

按照模型主页:https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/summary 的提示下载模型

C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/LFM2.5-Audio-1.5B-Q4_0.gguf 100 663M 100 663M 0 0 12.8M 0 0:00:51 0:00:51 --:--:-- 12.5M C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf 100 48.2M 100 48.2M 0 0 9996k 0 0:00:04 0:00:04 --:--:-- 10.7M C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf 100 209M 100 209M 0 0 10.3M 0 0:00:20 0:00:20 --:--:-- 12.2M C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf 100 103M 100 103M 0 0 10.7M 0 0:00:09 0:00:09 --:--:-- 12.5M C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/liquid_audio_chat.py 100 17543 100 17543 0 0 45627 0 --:--:-- --:--:-- --:--:-- 45684 C:\d\models>/d/llama8/llama-liquid-audio-cli -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf -sys "Perform TTS." -p "Hi, how are you?" --output $OUTPUT_WAV '/d/llama8/llama-liquid-audio-cli' is not recognized as an internal or external command, operable program or batch file.

标准llama的目录中没有llama-liquid-audio-cli运行工具

需要单独下载运行工具

C:\d\models>curl -LO https://www.modelscope.cn/models/LiquidAI/LFM2.5-Audio-1.5B-GGUF/resolve/master/runners/llama-liquid-audio-ubuntu-x64.zip 100 12.6M 100 12.6M 0 0 8900k 0 0:00:01 0:00:01 --:--:-- 12.8M

将工具解压保存到llama-audio目录。
因为没有windows版本,所以进入wsl环境。

C:\d\models>wsl root@DESKTOP-59T6U68:/mnt/c/d/models# cd audio root@DESKTOP-59T6U68:/mnt/c/d/models/audio# llama-audio/llama-liquid-audio-cli -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf -sys "Perform TTS." -p "Hi, how are you?" --output $OUTPUT_WAV llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (required by llama-audio/llama-liquid-audio-cli) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.38' not found (required by llama-audio/llama-liquid-audio-cli) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.38' not found (required by /mnt/c/d/models/audio/llama-audio/libliquid-audio.so) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.32' not found (required by /mnt/c/d/models/audio/llama-audio/libliquid-audio.so) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.38' not found (required by /mnt/c/d/models/audio/llama-audio/libmtmd.so.0) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.38' not found (required by /mnt/c/d/models/audio/llama-audio/libllama.so.0) llama-audio/llama-liquid-audio-cli: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.38' not found (required by /mnt/c/d/models/audio/llama-audio/libggml-base.so.0)

提示缺少高版本GLIBC和GLIBCXX,于是打开docker 容器 gcc。

14.2和15.1的gcc容器的版本带的GLIBC不够高,临时拉取一个15.2的,满足要求了。

gcc version 15.1.0 (GCC) root@DESKTOP-59T6U68:/par/models/audio# strings /lib/x86_64-linux-gnu/libc.so.6|grep GLIBC_2.3 GLIBC_2.3 GLIBC_2.3.2 GLIBC_2.3.3 GLIBC_2.3.4 GLIBC_2.30 GLIBC_2.31 GLIBC_2.32 GLIBC_2.33 GLIBC_2.34 GLIBC_2.35 GLIBC_2.36 root@DESKTOP-59T6U68:/par/models/audio# exit root@DESKTOP-59T6U68:/mnt/c/d/models/audio# docker pull docker.1ms.run/gcc:15.2 Trying to pull docker.1ms.run/gcc:15.2... Getting image source signatures Copying blob a793e3c6bce8 skipped: already exists Copying blob 9da421ddeb65 skipped: already exists Copying blob 866771c43bf5 skipped: already exists Copying blob ed881fbf1b07 skipped: already exists Copying blob c9c9bdd0804b done Copying blob 933ec911a9d9 done Copying blob 93f6a80119c4 done Copying blob 303d1dc2b7db done Copying config 47a721da1a done Writing manifest to image destination Storing signatures 47a721da1addefee38fea4a35a48c0da7492ca616794cc5fcb64f9c198fb2c94 root@DESKTOP-59T6U68:/mnt/c/d/models/audio# sudo docker run -itd -v /mnt/c/d:/par --network host --name gcc152 docker.1m s.run/gcc:15.2 92399a235cfe7a6440ffa6e015f55ba1f5df4b5056eb59b52e9825172edecc4c root@DESKTOP-59T6U68:/mnt/c/d/models/audio# docker exec -it gcc152 bash root@DESKTOP-59T6U68:/# strings /lib/x86_64-linux-gnu/libc.so.6|grep GLIBC_2.3 GLIBC_2.3 GLIBC_2.3.2 GLIBC_2.3.3 GLIBC_2.3.4 GLIBC_2.30 GLIBC_2.31 GLIBC_2.32 GLIBC_2.33 GLIBC_2.34 GLIBC_2.35 GLIBC_2.36 GLIBC_2.38 <--------- GLIBC_2.39

用模型主页提供的示例命令行,-sys的提示词报错了。

llama-audio/llama-liquid-audio-cli -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf -sys "Perform TTS." -p "Hi, how are you?" --output OUTPUT.WAV ERR: Unsupported system prompt. Supported prompts are: - Perform TTS. Use the US male voice. - Perform TTS. Use the UK male voice. - Perform TTS. Use the US female voice. - Perform TTS. Use the UK female voice. - Perform ASR. - Respond with interleaved text and audio.

改为如下可以了:这段英文摘自演讲《I have a dream》。

文生音 llama-audio/llama-liquid-audio-cli -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf -sys "Perform TTS. Use the US male voice." -p "I have a dream that one day this nation will rise up and live out the true meaning of its creed:“We hold these truths to be self-evident,that all men are created equal." --output OUTPUT.WAV 音生文 llama-audio/llama-liquid-audio-cli -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf -sys "Perform ASR." --audio OUTPUT.WAV === GENERATED TEXT === I have a dream that one day this nation will rise up and live out the true meaning of its creed. We hold these truths to be self-evident, that all men are created equal.

模型主页还提供了服务器命令行,但是不能用浏览器执行交互,而是要运行python脚本,里面还要引入别的包,不试验了。

llama-liquid-audio-server -m LFM2.5-Audio-1.5B-Q4_0.gguf -mm mmproj-LFM2.5-Audio-1.5B-Q4_0.gguf -mv vocoder-LFM2.5-Audio-1.5B-Q4_0.gguf --tts-speaker-file tokenizer-LFM2.5-Audio-1.5B-Q4_0.gguf
http://www.jsqmd.com/news/481015/

相关文章:

  • 2026年南京AI搜索推广方案排名,看看哪家值得选 - mypinpai
  • 小白救星!降AIGC工具 千笔·专业降AI率智能体 VS 文途AI 本科生专属
  • 创建型设计模式(工厂、builder、原型、单例)
  • 2026年等边镀锌角钢采购,这些厂家表现出色!目前镀锌角钢厂家找哪家行业优质排行榜亮相 - 品牌推荐师
  • 导师严选!全领域适配的一键生成工具 —— 千笔
  • 在 Windows 上,如果忘记了 MySQL 密码 重置密码
  • 分析广东靠谱的巴沙鱼厂家推荐,哪家性价比高? - 工业品牌热点
  • 毕业论文神器!继续教育专属AI论文软件 —— 千笔·专业学术智能体
  • 非遗新中式2026年新趋势,这些设计单品值得收藏,非遗新中式推荐排行榜精选综合实力TOP企业 - 品牌推荐师
  • 2026年氧化铜、氧化镁生产厂家排名,看看哪家更专业 - 工业品网
  • AI时代新赛道:一文看懂GEO优化服务商
  • 促销装PEVA桌布价格贵吗,金华物色日用品这家服务商靠谱吗 - myqiye
  • 直接上结论:更贴合本科生的降AI率软件,千笔 VS 万方智搜AI
  • 聊聊靠谱的直流调速器维修企业,价格费用如何考量? - 工业设备
  • 书匠策AI:期刊论文写作的“魔法棒”,解锁学术新境界
  • SpringAI MCP Server:让你的 AI 服务像 Spring Boot 一样简单
  • 书匠策AI:期刊论文写作的“魔法棒”大揭秘
  • 技术分析:RemoteApp和Web
  • 剖析PCB生产线系统加工厂,靠谱的品牌有哪些推荐? - 工业推荐榜
  • 分析VOCs废气处理设备加工厂,深圳天浩洋环保性价比高 - mypinpai
  • 计算机毕业设计Python+PySpark+DeepSeek-R1大模型B站弹幕评论情感分析 视频情感分析 视频推荐系统 视频数据可视化大屏 大数据毕设
  • 论文写作“黑科技”:书匠策AI,期刊论文的智能魔法棒
  • AI agent : MiroFish AI智能体项目介绍
  • 如何选择小红书代运营?2026年口碑公司横向对比,抖音代运营团队/抖音代运营/抖音推广,小红书代运营服务商推荐榜单 - 品牌推荐师
  • 2026年观音桥评价好的社区火锅品牌推荐榜,火锅店/社区火锅/美食/特色美食/火锅,社区火锅品牌推荐榜 - 品牌推荐师
  • 探讨GEO优化公司选择要点,哪家口碑好 - 工业品牌热点
  • 2026-3
  • 聊聊氧化铜、氧化镁、氧化铈生产厂家,推荐哪家性价比高 - 工业品网
  • 华为企业数字化运维运营体系建设综合解决方案:运维运营体系架构、统一运维运营平台、多云管理与集成、组织设计与流程架构
  • 国防军工领域Vue如何集成百度WebUploader插件支持卫星数据大附件的秒传断点?