当前位置: 首页 > news >正文

转录组分析(一):比对、表达定量、标准化

一、准备

1. 三张表:样本特征信息、表达矩阵、基因注释信息

image

2. 表达矩阵

获得方法:

  • 表达芯片:敏感度低、范围小、只检测已知转录本、低成本
  • RNA-seq:

二、测序数据标准分析:获得表达矩阵

1.spliced alignment比对

image

(1)比对到基因组

将转录本(RNA)比对到参考基因组(DNA),有的read比对到上一段外显子末尾、下一段开始,中间的内含子把read切开

image

bwa、tophat->hisat->hisat2(推荐用最新的hisat2)、STAR[效果非常好,比对慢、耗内存]

主流软件:

  • hisat2:做动植物方向,基因组本身精度不高,再提升精度意义小
  • STAR:做人的方向,对精度要求高,推荐

(2)比对到转录组:Bowtie2

image

(3)比对结果统计

image

mapped reads:使用现有主流软件比对率>80% ,低的原因:

  • ①参考基因组质量差;
  • ②测序样本污染,测到细菌RNA;
  • ③参考基因组品种与测序品种差异大

uniquely mapped reads:只在参考基因组/转录组匹配到唯一位置,基因表达定量分析(如使用featureCounts、HTSeq、RSEM等工具)中,通常只使用uniquely mapped reads来计算每个基因或转录本的计数。

2. quantification表达定量

比对时只是将测序数据和参考基因组比对,未统计比对到哪一个基因

问题1:多处比对的reads如何分配?一个reads比对到两个以上的基因位置,

  • 扔掉:多拷贝基因表达量被低估
  • 一边各一半:0.5+0.5
  • 计算概率,按概率分配:0.7+0.3

image

问题2:在基因层次还是isoform层次定量?

一般不同isoform功能相似,建议在基因层次定量

3. normalization标准化

reads counts:比对和定量完后,被明确归属于某个特定基因(或转录本、外显子等基因组特征)的测序读数(reads)的数量。

image

问题1:在样本1中,基因B的表达量比基因A高?
不确定,因为基因长度不同。越长碎片越多

问题2:基因A在样本3中的表达比样本2中高?
不确定,测序深度不一样。

(1)标准化

  • fpkm:比对到基因的片段数/基因长度/总片段数
  • tpm:比对到基因的片段数/基因长度/标准化后的总片段数

image

(2)校正

问题3:一个基因表达异常高导致其他基因表达低,解决方法:

  • 内参基因:不同组织、不同条件下表达稳定。计算使各个样本中数值一样,如样本一:3,样本二:6,所有样本一数据都×系数2
  • 非常见物种,未研究内参基因。假设大多基因是没有差异表达的(TMM),×校正系数后使多数基因表达水平相同

 

http://www.jsqmd.com/news/90367/

相关文章:

  • 转录组分析(二):差异表达分析、功能分析、表达验证
  • 华硕笔记本性能优化终极指南:G-Helper完全掌控手册
  • Luckysheet性能突破:轻松驾驭百万行数据的实战指南
  • Luckysheet性能优化终极指南:百万级数据处理完整教程
  • AutoGPT应急预案生成AI代理
  • 2、滑翔伞设计与模拟技术全解析
  • 游戏中的抛物线:从手雷到弓箭的物理轨迹
  • 3D渲染:视锥体与平面方程揭秘
  • 游戏开发必备:距离与投影的实战解析
  • JavaEE进阶——Spring原理深度解析:新手必懂的作用域详解(新手友好版)
  • TaskFlow:重新定义Java任务流程管理的轻量级编排框架
  • Pig权限管理系统:15分钟搭建企业级微服务架构的终极指南
  • 33、Unix 系统下 SMB/CIFS 文件共享访问全解析
  • TouchGAL终极指南:快速搭建纯净Galgame社区的完整教程
  • 34、Unix系统下SMB/CIFS共享访问工具全解析
  • BasePopup完整指南:从零开始打造Android弹窗应用
  • 37、UNIX基础与vi编辑器入门指南
  • 35、SMB和Net命令的使用指南
  • 解放生产力!用Lan Mouse打造多设备统一控制中心
  • 36、Samba故障排除全攻略
  • 38、Vi编辑器:高效文本编辑指南
  • 37、Samba故障排除指南
  • 38、Samba服务故障排查全攻略
  • Obsidian Git插件完全配置手册:打造永不丢失的笔记备份系统
  • 39、深入探索vi编辑器:从基础到高级应用
  • 39、Samba故障排除:名称服务、网络地址与NetBIOS名称问题解决
  • AppleRa1n终极教程:iOS设备激活锁完全绕过方案
  • 蚂蚁集团inclusionAI重磅发布Ming-flash-omni Preview:100B参数多模态模型引领AI交互新范式
  • Java开发必看:UUIDv7标准化革命
  • 35、谷歌网站使用指南:内容编辑与对象插入全解析