空间多组学模拟数据的联合表示分析
使用mmspao系统进行联合分析
系统mmspao是博主在实验室里研发的一套用于多模态空间多组学融合的框架,可以使用pip进行下载,博主是在Linux环境下使用PyTorch==2.1.0+cu121和NVIDIA A40进行的实验,务必提前下载好torch相关的环境。
pip install torch==2.1.0--index-url https://download.pytorch.org/whl/cu121 pip install mmspao配置随机数种子和训练设备
frommmspao.utilsimport*frommmspaoimportmmspaoimportscanpyassc set_random_seed(42)device='cuda'从此处下载空间多组学模拟数据,存放在data目录下。
加载模拟数据保存RNA观测空间
#Load data and perform necessary preprocessingrna=sc.read('./data/Sim_tri/adata_RNA.h5ad')adata=rna.copy()rna=getX(rna,modality='rna')protein=sc.read('./data/Sim_tri/adata_ADT.h5ad')protein=getX(protein,modality='protein')atac=sc.read("./data/Sim_tri/adata_ATAC.h5ad")atac=getX(atac,modality='atac')配置视图和组合并训练
这里使用’all’指定配置所有视图和组合进行融合特征的拼接
model=mmspao([rna,protein,atac],sel_views='all',combination='all',sparse=False,device=device)model.train(2000)Leiden聚类adata观测空间
model.cluster(adata,n_domains=5,end=0.7)绘制空间聚类可视化
sc.pl.spatial(adata,color="leiden",spot_size=0.1,show=True)