当前位置: 首页 > news >正文

Blast网站序列比对以及进化树的构建

#本篇为基于学校生物信息课的所讲内容记录,可能在记录的过程会加入自己的理解或者发生偏差,所以文章仅供参考(同时也为了完成老师布置的大作业hhhh),如果有错漏的地方欢迎交流指正/(ㄒoㄒ)/~~

1.Blast网站的用处

BLAST(Basic Local Alignment Search Tool)网站的核心用途是进行生物序列的相似性比对,帮助研究人员在公开数据库中快速找到与目标序列相似的核酸或蛋白质序列。以下是其主要用途:

①功能注释:通过比对已知功能的基因或蛋白序列,推测未知序列的功能。

②物种鉴定:将未知物种的序列与数据库比对,判断其所属物种或近缘种。

③进化分析:寻找直系或旁系同源基因,用于构建系统发育树。

④变异检测:比对突变体与野生型序列,识别突变位点。

⑤引物设计验证:检查PCR引物是否特异性结合目标区域,避免非特异扩增。

⑥转录本分析:验证EST(表达序列标签)是否来自选择性剪接。

2.Blast网址

BLAST: Basic Local Alignment Search Tool

3.Blast的页面

Blast主页分为四个板块分别为

板块名称我的序列是什么我去搜什么数据库核心用途
Nucleotide BLAST(常指 blastn/blastn-short)一段核(DNA/RNA)

核酸数据库(nt、refseq_rna、

16S 等)

用核酸找核酸——看这条基因/片段在哪些物种里出现过,或检查引物特异性。
Protein BLAST(常指 blastp/psi-blast一段蛋白质序列蛋白数据库(nr、Swiss-Prot、RefSeq_protein 等)用蛋白找蛋白——注释未知蛋白功能、找同源蛋白、构建进化树。
blastx一段核酸(通常是转录本或基因组片段)蛋白数据库先把核酸按 6 框翻译成蛋白,再去搜蛋白库——最常用于 EST/转录组/基因组草图的功能注释:“我这段 DNA 可能编码什么蛋白?”
tblastn一段蛋白序列

核酸数据库(但库会被

动态 6 框翻译)

用蛋白搜“可能藏在 DNA 里的同源基因”——找基因组中尚未注释的编码区、验证基因预测、跨物种找同源基因。

其实blast就是一个序列对齐的过程,让序列对到最齐。

4.blast的使用(以ARUKA基因在植物里面的进化为例进行展示)

4.1首先打开NCBI搜索AURKA基因

  1. 查找得到人源的AURKA基因,并点击

3.点击下载

4.下载基因序列的Fasta格式

5.点击blast

6.点击“Nucleotide Blast”

7.将下载好的AURKA基因的Fasta格式输入到上方的框中,并按照下图设置好需要Blast的对象

8.得到以下界面,Blast的结果图中可以粗略看到检索出来的物种之间的进化关系

9.根据物种、综合得分以及同源性下载不同植物物种的序列

10.以fasta格式进行下载

11.打开Mega软件

12.点击下图所示图标“Algin”,并新建一个文件

13.选择“DNA”

14.导入我们刚刚下载的Fasta格式文件

15.对数据进行比对之后,随后进行亲缘关系分析以及建树

16.建树

17.结果

以上是以人缘的AURKA基因在植物里面进行比较,同时也可以使用其他物种里面的AURKA基因进行比对,这里以拟南芥为例。

http://www.jsqmd.com/news/694329/

相关文章:

  • 2025 GitHub Docs性能优化实战:从卡顿到毫秒级响应的蜕变
  • Esptool:揭秘ESP芯片固件编程的3个高级技巧与实战指南
  • 容器迁移 java 应用 OOM 事件
  • 从‘手动挡’到‘自动挡’:PyTorch实现MLP的两种姿势对比(含完整代码与性能分析)
  • WebPlotDigitizer完全指南:3步从图表图像提取精准数据的终极解决方案
  • Qwen3.5-4B-AWQ参数详解:temperature/top_p/max_tokens调优指南
  • 海南最推荐的做饭阿姨公司服务机构有哪些?2026年海口等地市场选择前五排名 - 十大品牌榜
  • 会员积分链上管理程序,积分发行,消耗过期规划上链,平台无法随意清零,篡改规则。
  • 从一道经典C语言题出发:手把手教你封装gcd和lcm函数,提升代码复用性
  • Navicat无限试用终极指南:macOS版14天限制一键破解方案
  • 别再写满屏的if(user!=null)了!用JDK1.8的Optional优雅处理空值,附SpringBoot实战案例
  • notion(模块化数字工作台)笔记
  • AI Agent Harness Engineering 的监控大盘设计:核心指标与异常预警
  • 婚礼礼金记账程序,礼金记录链式存储,公开透明避免账目不清,亲友误会。
  • ESP-IDF C++ RTTI实战指南:突破类型限制的终极解决方案
  • CLIP ViT-H-14保姆级部署指南:2.5GB本地模型+CUDA加速+Web界面
  • 终极Dokploy API文档生成指南:Swagger UI与OpenAPI规范快速上手
  • Jimeng AI Studio部署教程:NVIDIA驱动版本适配要求与CUDA环境检查脚本
  • FSDB和VCD到底选哪个?从文件原理到工具链,聊聊芯片验证与功耗分析中的波形格式选择
  • 从抓包到自动化:如何用Python搞定快手关键词搜索与用户主页数据采集?
  • 微电网主从控制孤岛-并网平滑切换分析报告
  • 如何将微信对话转化为个人AI训练数据集:本地化数据主权实践指南
  • 如何快速获取B站完整评论数据:Bilibili评论爬虫终极指南
  • 164.乐理实战:和声与旋律小调如何塑造音乐情绪
  • ESP-IDF中RMT模块在特定数据长度下陷入循环问题的终极分析指南
  • 动手实践:用Python仿真一个简易的捷联惯导系统(SINS)
  • Python的元组解包与星号表达式在可变参数传递中的灵活运用
  • 2026年如何集成Hermes/OpenClaw?阿里云部署及token Plan配置教程
  • Windows安卓应用安装终极指南:告别臃肿模拟器
  • 智能座舱电机的振动噪声研究