相分离数据库实操指南④:如何利用PhaSeDis挖掘相分离-疾病关联及潜在干预小分子?
引言
前三篇我们分别拆解了三大相分离数据库:
1.PhaSePro:脚手架蛋白“金标准”,告诉你哪些蛋白是已被严格验证的驱动蛋白;
2.LLPSDB v2.0:体外实验“条件宝库”,为你提供蛋白浓度、pH、盐浓度等具体实验参数;
3.PhaSepDB 3.0:相分离蛋白“百科全书”,帮你快速获取蛋白的功能、调控与疾病全景信息。
但你有没有遇到过这样的问题:
“我知道某蛋白能相分离,也查到了体外实验条件,但它到底和哪些疾病直接相关?有没有小分子能干预它的相分离异常?我想做转化研究,该从哪里下手?”
这正是PhaSeDis要回答的问题。作为2024–2025年间最新发布的相分离数据库,PhaSeDis由北京大学李婷婷团队在前期MloDisDB基础上重磅升级,首次系统整合了“相分离因子—疾病—小分子”三方关联,将基础研究数据与转化医学需求连接起来。
今天丸子就带大家上手PhaSeDis,学会利用它挖掘疾病机制、寻找潜在干预分子,并结合前三个数据库完成从“新蛋白发现”到“转化线索挖掘”的全链条分析。
1. 数据库概况与核心特色
PhaSeDis是目前唯一专门收录相分离-疾病关联及干预小分子的数据库。相比前身MloDisDB,PhaSeDis实现了三大飞跃:
① 数据规模翻倍:收录931条条目,其中185条为相分离(PS)相关条目(来源于2020–2022年发表的123篇文献);
② 新增体内证据分级:为每个PS条目标注了4类经典体内验证实验(FRAP、1,6-HD处理、球形形态、融合/分裂现象),形成证据等级0–4,评估结论可信度;
③ 首创小分子模块:同时整合低通量文献证据(直接报道的干预分子)和高通量数据库交叉证据(来自BindingDB、PDBBind、DrugBank的潜在配体/药物)。
PhaSePro告诉你“谁能相分离”,PhaSepDB告诉你“它有什么功能”,LLPSDB告诉你“怎么在体外做”,而PhaSeDis告诉你“它致病吗?有药吗?”
2. 首页导航与浏览功能
访问首页:http://mlodis.phasep.pro
首页提供三种主要检索入口:
▶ 关键词搜索:支持按相分离因子(蛋白/RNA名称、基因ID、UniProt ID)、疾病名称、MLO(无膜细胞器)或物种检索;
▶Browse页面:可按“证据类型”(Evidence)或“分类”(Class)筛选,例如只看“LLPS”条目或“体内验证级别≥2”的条目;
▶MLOs页面:图形化展示30余种无膜细胞器,点击任一MLO(如应激颗粒、核仁)即可看到所有相关疾病条目;
▶Diseases页面:按疾病分类罗列所有条目,神经退行性疾病和癌症是两大主力。
【丸子划重点】如果你关心某个疾病(比如ALS),直接进Diseases页面点选,就能看到所有与ALS相关的相分离因子及其小分子信息。
3. 条目页面深度解析
以TDP-43和ALS相关的某一条目为例(MDID可点击),进入详情页后包含四大模块:
① 基础信息(Basic information)
▶MLO类型:如应激颗粒(Stress granule)
▶因子信息:蛋白名称、基因名、UniProt ID、物种
▶疾病信息:疾病名称、MeSH、ICD-10、OMIM等标准ID
② 文献描述(Description from paper)
这是最核心的文本模块,包含:
▶MLO/凝聚体变化:原文报道的相分离液滴在大小、数量、组装动态等方面的改变;
▶致病机制描述:例如“TDP-43的相分离异常导致其异常聚集,形成毒性寡聚体,引发运动神经元死亡”;
▶实验证据摘要:直接引用原文结论,并附上PMID。
③ 因子变化(Factor change)
记录原文中报道的突变、表达变化、翻译后修饰(PTM)及其对病理状态的影响。
④ 相关小分子(Related small molecules)
这是PhaSeDis的独家亮点,分为两栏:
▶低通量证据:来自原文直接验证的小分子,附有“Interference note”说明其作用。
▶高通量证据:从BindingDB、PDBBind、DrugBank交叉匹配得到的潜在小分子/药物,按数据库来源分别列出,并提供PubChem CID或DrugBank ID链接。
【丸子提醒】高通量证据仅表示这些小分子与目标蛋白有结合记录,不保证它们通过调控相分离发挥作用——但它们是你筛选候选药物的绝佳起点。
4. 体内证据分级:判断条目可信度的利器
PhaSeDis为每个PS条目标注了是否在体内开展了以下4类经典验证实验:
每做一项记为1分,总分0–4即为“证据等级”。统计显示:
▶等级0:24个条目(无任何体内验证)
▶等级2–3:大多数条目
▶等级4:仅18个条目(四项实验全部完成)
实操建议:做精细机制研究时,优先筛选证据等级≥3的条目;做大规模分析时,可适当放宽至等级1–2。
此外,每个因子还标注了PS角色:
▶Scaffold:主要驱动相分离的脚手架蛋白
▶Client:被招募进凝聚体的客户蛋白
▶Self:单组分自行相分离
5. 示例场景:TDP-43与ALS的相分离干预探索
场景:你想系统了解TDP-43在ALS中的相分离异常机制,并查找是否有小分子可以干预。
操作步骤:
①进入PhaSeDis首页,搜索“TDP-43”或“TARDBP”。
②浏览返回的条目列表,筛选疾病为“Amyotrophic lateral sclerosis”。
③点击任意条目(如某MDID),进入详情页:
▶ 阅读“Description from paper”,记录TDP-43相分离异常如何导致ALS(如“液-固转化加速”、“毒性聚集”)。
▶ 查看“Factor change”栏,留意是否有疾病相关突变(如A315T、Q331K)及其对相分离的影响。
▶ 跳转到“Related small molecules”:
a.低通量部分:看是否有原文直接测试的小分子(如某些激酶抑制剂、多酚类化合物),阅读其作用机制。
b.高通量部分:浏览BindingDB/PDBBind/DrugBank中匹配的小分子列表,挑出感兴趣的候选物(如已上市药物)。
④记录PMID,回查原文验证实验细节。
⑤ 交叉验证:
▶ 回PhaSePro确认TDP-43是脚手架蛋白。
▶ 到LLPSDB v2.0查看TDP-43体外相分离条件(蛋白浓度、盐浓度等),为后续实验设计做准备。
▶ 到PhaSepDB 3.0查看TDP-43的protein-wise summary page,了解其PTM调控。
6. 多数据库联动实战(三大典型场景)
场景一:新发现蛋白的全方位调查
▶背景:蛋白质组学筛到一个新蛋白Protein X,怀疑它有相分离能力,想快速判断它是脚手架还是客户,以及是否与疾病相关。
▶流程:
① PhaSepDB 3.0:搜索Protein X → 如果有PS条目,高度怀疑脚手架;如果仅在MLO条目中出现,可能是客户蛋白。
② PhaSePro:确认是否被收录为驱动蛋白 → 若收录,直接获得驱动区域信息。
③ LLPSDB v2.0:查找同源蛋白的体外实验条件,作为自己实验的参考。
④ PhaSeDis:搜索Protein X是否与疾病关联 → 若有,获取机制及潜在小分子线索。
场景二:预测算法的数据准备
▶背景:开发相分离预测模型,需要高质量正负样本集。
▶流程:
① 正样本:PhaSePro全部条目(最严格) + PhaSepDB 3.0中PS条目(较全面) + LLPSDB v2.0中“Yes”条目。
② 负样本:LLPSDB v2.0中“No”条目(独家来源!) + PDB典型球状蛋白 + DisProt非LLPS无序蛋白。
注意:区分“脚手架蛋白”与“客户蛋白”的序列特征,分别建模或评估。
场景三:转化研究线索挖掘
▶背景:想系统筛选“相分离—神经退行性疾病—小分子”三角关系。
▶流程:
① PhaSeDis:浏览神经系统疾病分类,导出所有PS条目,按小分子证据排序。
② PhaSePro / PhaSepDB 3.0:对Top候选蛋白,查看其脚手架身份、PTM调控位点(寻找可成药的修饰酶)。
③ LLPSDB v2.0:确认体外实验条件,设计小分子筛选的阳/阴性对照。
④ 整合:构建“蛋白—疾病—小分子—实验条件”四位一体研究方案。
小结
至此,我们完成了相分离四大核心数据库的全系列实操指南:
数据库中收录的均为已有文献报道的实验数据。若你的研究对象是尚未被注释的新蛋白,或希望在特定样本中系统筛选相分离候选分子,则需借助实验手段进行高通量鉴定。数据库检索与实验筛选相结合,可大幅提升研究效率。
⬇️⬇️⬇️
谱度众合B-isox MS:相分离蛋白初筛首选解决方案
谱度众合B-isox MS一站式高通量筛选服务,依托二十年质谱技术沉淀,实现相分离倾向蛋白的无偏精准鉴定,覆盖从样本处理、蛋白富集到质谱检测的全实验流程,更配套IDR区域预测评分、蛋白互作网络分析等深度数据挖掘服务。
参考资料
Chen T , Tang G , Li T, et al. PhaSeDis: A Manually Curated Database of Phase Separation-disease Associations and Corresponding Small Molecules. Genomics Proteomics Bioinformatics. 2025;23(1):qzaf014. doi:10.1093/gpbjnl/qzaf014
