当前位置: 首页 > news >正文

WGCNA分析-生物信息学机器学习研究方法

1.概念

解释:WGCNA分析,中文全称即是加权基因共表达网络分析。该分析方法旨在是寻找协同表达的基因模块,并且去找基因网络和关注的表型之间的联系,以及网络中的核心基因。简单说即用于描述不同样本中基因相关性的模式

实例:例如在之前寻找生姜和胃癌的治疗靶点的时候,利用WGCNA去寻找胃癌差异性表达基因和生姜核心成分的基因寻找出二者的相关性强的的基因模块(一组表达相关性较为强的基因组)

2.原理和方法

2.1首先获得基因相关性表达矩阵


其中第一列为样本名称,第一行是基因名称,将该所有样本的基因表达情况进行相关性的计算,获得相关性表达矩阵表

其中相关性表达矩阵表格中,例如RPS4Y1基因和自身的相关性为1,大于零为正相关,而小于零为负相关,构建完成相关性表达矩阵后就可以利用WGCNA去构建相关性表达网络

2.2相关性网络(需要构建什么样的网络?)

在网络中,节点代表基因,线代表相关性。如上图两种网络当中,我们要构建的的是无尺度网络,该网络服从幂律分布,即少数的节点的连接数较高,大部分节点连接数较低。而不是随机网络,该网路服从正态分布,即大多数节点的连接数较高,而少部分的连接数较低。原因是,在生物体内只有少数蛋白质或者基因参与大量的相互作用,形成信号枢纽的作用,无尺度网络中连接度较高的节点,即是我们研究的重点,其作为枢纽作用,研究价值更高。假如在随机网络中,是大多数蛋白质都参与大量的相互作用,这样的话不就成混乱体系了吗?

2.3选择合适的软阈值(Power,判断基因是否具有相关性阈值)

2.3.1软阈值和硬阈值的区别差异

为了衡量两个基因是否具有相似表达模式,一般需要设置阈值来进行筛选,高于阈值就认为是相似的,但是这种设置阈值的方法存在问题,假如设定阈值为0.8,那么基因间相关性为0.81和0.79很难说明是有显著差异的,即无法区分。这种设置阈值的方法称为硬阈值

为了解决上述难以区分显著差异的问题,因此WGCNA分析时,采用相关系数加权值,即对基因相关系数取N次幂,这样计算出的是基因相关性的权重大小,我们只需要选取合适的N次幂即可,这种设置阈值的方法称为软阈值。

其中硬阈值是简单二元化的“有无”关系,这种方法是一刀切的筛选,大于设定阈值就符合否则就不符合。这样分析出的结果更趋近于正态分布,构建的网络也更趋近于随机网络是不符合生物学规律的。而软阈值则是连续的“权重关系”,而非单纯的“有无”,这样分享出的结果更符合幂律分布,构建出的网络更符合无尺度网络,因为幂次运算会放大强相关的边,而弱化弱相关,如相关性0.9取幂次后更接近1,而0.5则更接近0,使富者更富,贫者更贫,这样就会符合幂律分布,而硬阈值一刀切的方式,使得分布更随机。

2.3.2软阈值的筛选

挑选出合适的软阈值

图一:无尺度拓扑拟合图,纵轴为拟合优度,横轴为Power值,拟合优度越趋近于1证明构成的网络越趋近于无尺度网络。

图二:平均连接度图,纵轴为平均连接度,横轴为Power值,在Power值增加的情况下,平均连接度会降低

判断软阈值的方法一般是根据这两个核心图来判断所需要的Power值,图一为无尺度拓扑拟合图,图二为平均连接度图。判断Power值的时候需要根据两个图一起判断,根据图一中的Power值与无尺度网络拟合度(R²)越高,但必须注意对应Power值对应在图二中的平均连接度不能太低。两者必须结合。

http://www.jsqmd.com/news/254190/

相关文章:

  • 2026年GEO源代码优选,源头厂商直供推荐 - 源码云科技
  • ProfiNet转DeviceNet协议转换网关:PLC与东步进电机驱动器指令交互保障电机运行平稳性
  • 军用无人机反制技术综述 - MKT
  • 御享臻品开展“千村赞助”公益行,助力乡村构筑健康生活圈
  • 树莓派5-TB6612电机驱动模块完整实战教程 - 教程
  • 2026年 景观设计公司推荐排行榜:园林景观、景观灯设计,专业创意与生态美学深度解析 - 品牌企业推荐师(官方)
  • vLLM KVCache 评估
  • 旅美经济学家向凌云院士获聘秘鲁驻华大使馆“中秘友好交流使者”
  • 2026年一键式闪测仪厂家推荐排行榜:影像式/全自动闪测仪,高精度智能测量设备实力品牌深度解析 - 品牌企业推荐师(官方)
  • 基于MATLAB GUI的条形码识别探索
  • 深度测评!10个AI论文网站:本科生毕业论文必备工具全解析
  • 【咸鱼RK3399】网络摄像头
  • AI技术如何重塑搜索引擎优化的核心策略与方向
  • 国内色选机市场主要参与者技术特点与选型参考分析
  • 导师推荐!9款AI论文工具测评:本科生毕业论文必备
  • 30 段速三菱 PLC 程序在橡筋机生产线的实践与分享
  • 2026年GEO源码搭建源头优选,技术实力厂商排行 - 源码云科技
  • 2026年南京AI搜索服务商推荐榜单:AI搜索推广、优化、拓客、获客与运营一站式解决方案深度解析 - 品牌企业推荐师(官方)
  • 你的手势冲突解决了吗?鸿蒙事件拦截机制全解析
  • 2026年智能农业应用国产头部企业深度推荐:山东建大仁科领航全国,技术赋能农业现代化 - 深度智识库
  • 数据库not exists 运算符
  • 搜维尔科技:Tesollo公司开发出紧凑轻便的人形机械手“DG-5F-S”
  • 实验室污水设备哪里买?2026年热门厂家盘点,帘式MBR膜/美国滨特尔水泵,实验室污水设备销售厂家哪家靠谱 - 品牌推荐师
  • 2026 年 1 月紫外线光源厂家推荐排行榜:汞灯/汞齐灯/中压灯/磁吸灯/台灯/灭蚊灯/爬宠补钙灯/虫情监测灯/耐老化灯专业制造与创新应用深度解析 - 企业推荐官【官方】
  • 2026年 激光冷水机厂家推荐排行榜,半导体/TEC/无压缩机冷水机,低噪音便携型温控设备专业选购指南 - 品牌企业推荐师(官方)
  • 详细介绍:vs Code 中 ESLint 插件 和 npm install eslint 的区别
  • vllm推理加速之 - continuous batching +Rag合并请求优化
  • 2026年1月办公写作工具综合实力榜单:AI写作、AI会议纪要、AI润色 - 深度智识库
  • 三菱FX2N实现对台达变频器ASCII通信控制全解析
  • 2026年温控模块厂家推荐榜单:压缩机/PCR仪/探针台/激光器/芯片测试座/光电器件/流式细胞仪/血液分离机/微流控芯片核心器件温控专业解决方案 - 品牌企业推荐师(官方)