当前位置: 首页 > news >正文

2026-1-18 humann工作流总结

环境的搭建和激活
点击查看代码
conda create --name biobakery3 python=3.7
conda activate biobakery3
##### 设置conda的环境 `conda config --add channels defaults conda config --add channels bioconda conda config --add channels conda-forge conda config --add channels biobakery`

设置conda的环境

conda config --add channels defaults
conda config --add channels bioconda
conda config --add channels conda-forge
conda config --add channels biobakery

安装HUMAnN3的软件的demo数据库(用于测试软件)

conda install humann -c biobakery

检测软件是否安装成功 但是这部分软件我并未成功安装,数据库下载之后始终没有和软件相匹配,因而上部分的内容就权且用于参考吧。但总而言之,humann的安装首先要安装数据库和metaphlan4的软件

查看软件的版本

conda activate humann4
humann --version

软件运行

humann --input $SAMPLE --output $OUTPUT_DIR

$SAMPLE 的意思是:“在这里,您应该放入您自己的输入文件的路径和文件名”,而$OUTPUT_DIR 的意思是:“在这里,您应该放入您想创建的输出目录的路径”

下面是不同格式文件的输入方式(输入的文件是demo.不同格式的话)

humann --input examples/demo.fasta --output $OUTPUT_DIR
humann --input examples/demo.fastq --output $OUTPUT_DIR
humann --input examples/demo.sam --output $OUTPUT_DIR
humann --input examples/demo.m8 --output $OUTPUT_DIR

workflow

1. 对存放在 $INPUT_DIR 目录下的每一个过滤好的 fastq 样本文件,逐一运行 HUMAnN 软件进行分析,并把所有生成的结果文件都保存到 $OUTPUT_DIR 目录里

for $SAMPLE.fastq in $INPUT_DIR #(待分析的文件)

humann --input $SAMPLE.fastq --output $OUTPUT_DIR

Replace $SAMPLE.fastq with the name of the fastq input file

Replace $OUTPUT_DIR with the full path to the folder to write output

输出文件为$SAMPLE_2_genefamilies.tsv和$SAMPLE_4_pathabundance.tsv.

2. 对丰度输出文件进行标准化处理(如针对SAMPLE_2_genefamilies.tsv文件)

humann_renorm_table --input $SAMPLE_2_genefamilies.tsv --output $SAMPLE_2_genefamilies_relab.tsv --units relab

3. 将所有样本的 HUMAnN 运行结果中的输出文件(基因家族和丰度)合并为三个文件(但官方文档只提了前两种,输出的结果文件分别为humann_2_genefamilies.tsv和humann_4_pathabundance.tsv)

3.1 合并基因家族文件

humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/genefamilies.tsv --file_name 2_genefamilies_relab.tsv

3.2 合并丰度文件

humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/pathabundance.tsv --file_name 4_pathabundance.tsv

3.3 合并其他文件(如SAMPLE_3_genefamilies.tsv)

humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/other.tsv --file_name 3_genefamilies.tsv

http://www.jsqmd.com/news/262318/

相关文章:

  • vue3+python+django的流量卡售卖系统的设计与实现
  • 一封“2FA更新”邮件,险些让数亿开发者中招——NPM供应链钓鱼事件揭示开源生态的致命软肋
  • 揭秘专业的渠道经理吴嘉林怎样拓展渠道,有何独特方法? - 工业品牌热点
  • 总结2026年宁波镇海实力强的刑事律师事务所,浙杭律师事务所实力雄厚 - 工业品牌热点
  • Django+vue3课程教学作业批改系统 远程在线教育系统
  • 当“猎头私信”变成钓鱼入口:LinkedIn成企业安全新盲区,AitM攻击绕过MFA引发警报
  • python+vue3非遗手工品展示与商城交易平台
  • 当“图片”会执行代码:SVG钓鱼载荷引爆新型供应链攻击,Amatera窃密与PureMiner挖矿暗流涌动
  • 【中国科学院光电研究所-张建林组-AAAI26】追踪不稳定目标:基于外观引导的运动建模在无人机拍摄视频中实现稳健的多目标跟踪
  • vue3+python +django 的茶文化交流平台
  • Java微服务连接同个MySQL实例报错“Too many connections”
  • 2026年市场上评价好的船用减压阀公司口碑排行,船用疏水阀/船舶配件/船用舷侧阀/船用安全阀,船用减压阀直销厂家口碑排行 - 品牌推荐师
  • 2104.25万,深圳市气象局数字孪生(CIM)创新应用项目
  • spring webflux响应式编程学习
  • 2026年市场评价好的实心钢棒定制加工怎么选择,不锈钢带/不锈钢冷轧板/不锈钢天沟,实心钢棒生产厂家怎么选择 - 品牌推荐师
  • 1.17-1.23日博客之星投票,每日可投
  • 学术探险家的智能罗盘:书匠策AI解锁本科论文写作新次元
  • 【信号去噪】基于雪橇犬算法SDO优化变分模态分解SDO-VMD数字信号去噪(优化K值 alpha值 综合指标 适应度函数包络熵)附Matlab代码
  • 【含文档+PPT+源码】基于SpringBoot+Vue的智能机场交通管理系统
  • AI Coding学习——dw|ali(持续更新)
  • 【语音识别】哼唱识别系统附Matlab代码
  • 深度洞察与未来前瞻:医学影像自动诊断系统行业分析 (2025年总结版.上) - 实践
  • 口碑引领方向:2026柠檬酸颗粒污泥直销厂家优选,国内柠檬酸颗粒污泥供应商口碑排行技术实力与市场口碑领航者 - 品牌推荐师
  • 2026年国产时序数据库盘点:格局嬗变下的多模态融合新锐
  • 2025年市场做得好的清障车源头厂家哪个好,折臂高空作业车/蓝牌清障车/二手蓝牌平板拖车/重载清障车,清障车品牌有哪些 - 品牌推荐师
  • 贴广告的ChatGPT,一夜之间让全球网友破了防,未来会不会使用之前先刷30秒广告?
  • 2026年南京、镇江靠谱的阁楼货架厂家厂家排名 - 工业品牌热点
  • AI代码审查工具:软件测试工程师的技术革命
  • 基于VUE的宠物商城管理系统[VUE]-计算机毕业设计源码+LW文档
  • 最基础数据的视频数据获取方法-轮廓及空间信息