当前位置: 首页 > news >正文

seq2cells 框架的模型输入、处理流程及输出细节

seq2cells 框架的模型输入、处理流程及输出细节如下:


一、 模型输入

模型的输入主要由以基因为中心的基因组序列信息组成:

  • DNA 序列: 围绕给定基因的 转录起始位点 (TSS) 对齐的长度为 196,608 bp (约 \(200\text{ kb}\) )的 DNA 序列 。
  • 编码方式: 该序列被转化为 one-hot 编码 矩阵,作为模型的原始输入 。
  • 样本范围: 研究使用了 Gencode V41 中所有 19,986 个 蛋白质编码基因的规范 TSS 。

二、 处理流程与架构交互

模型通过两个核心模块的串联处理输入数据:

  1. Seq2Emb 模块(序列到嵌入)

    • 使用预训练的 Enformer 模型主干作为特征提取器 。
    • 输入 \(196,608\text{ bp}\) 的序列,通过卷积和 Transformer 块进行特征聚合 。
    • 该模块输出中心 \(896\) 个序列窗口(每个窗口 \(128\text{ bp}\) )的 3,072 维 序列嵌入 。
    • 关键交互: 模型仅提取与 TSS 重叠的那个序列嵌入,将其定义为该基因的 “基因嵌入” (Gene Embedding)
  2. Emb2Cell 模块(嵌入到细胞)

    • 这是一个专门训练的多层感知器 (MLP) 。
    • 它将 \(3,072\text{ 维}\) 的基因嵌入映射到一个 瓶颈层 (维度通常为 \(1,000\)\(2,000\) ),然后经过 Dropout 和 ReLU 激活处理 。
    • 最后通过线性层和 Softplus 激活函数 映射到最终的细胞表达空间 。

三、 模型输出

模型的输出是该基因在特定单细胞数据集中的 单细胞分辨率基因表达量

  • 具体形式: 为数据集中的每个细胞预测一个连续的输出值 。
  • 数据属性: 预测值对应于经过标准化、 \(\log(x+1)\) 转换及批次校正后的单细胞计数 。

训练损失函数

模型在训练时使用基于余弦相似度的损失函数,以平衡跨基因和跨细胞的相关性 :

\[loss = 1 - cos\_sim_{genes}(\hat{p} - \bar{\hat{p}}, t - \bar{t}, \epsilon) + 1 - cos\_sim_{cells}(\hat{p} - \bar{\hat{p}}, t - \bar{t}, \epsilon) \]

其中 \(p\) 代表预测值, \(t\) 代表观察到的目标值, \(\epsilon\) 为防止除以零的极小值 \(1 \times 10^{-8}\)


您是否需要我为您详细对比该模型在 HSC、T 细胞发育和 T 细胞激活这三个数据集上的具体参数差异?

http://www.jsqmd.com/news/339777/

相关文章:

  • 红色工作汇报PPT模板
  • AI知识库实战:语义搜索+轻量生成的完美结合
  • 简单理解:门电路
  • spring6-bean的生命周期与循环依赖
  • 当计算机专业站在十字路口:近屿智能看见了什么?
  • ViT图像分类-中文-日常物品GPU算力优化教程:4090D高效部署方案
  • TDengine TSDB 3.4.0.0 上线:虚拟表、流计算性能显著提升,安全能力全面进阶
  • Qwen3-Reranker-0.6B实战教程:Python API调用+批量文档重排代码实例
  • 大数据分析:Spark与Hadoop的对比与结合
  • CCMusic Dashboard效果展示:AI识别出‘雷鬼’音乐中反拍节奏在时频域的稀疏能量分布
  • Chord基于Qwen2.5-VL的视觉定位参数详解:max_new_tokens与精度平衡
  • 解读大数据领域HDFS的元数据管理
  • Qwen3-ASR-0.6B实战:如何用Gradio搭建语音识别Web界面
  • 开源大模型部署新趋势:Qwen2.5镜像免配置实操手册
  • ClearerVoice-Studio模型热切换:Web界面动态加载FRCRN/MossFormer2实操
  • 阿里每日100W次登录请求场景下的JVM参数优化配置详解
  • 从RNN到LSTM:循环神经网络的进化之路
  • 雀巢赋能创新:徐福记投建智能软糖车间,筑牢春节市场保障
  • div水平垂直居中
  • 《揭秘!AI应用架构师如何实现AI系统集成的卓越最佳实践》
  • 小白也能轻松玩转:yz-女生-角色扮演模型的5个实用技巧
  • 文库、网盘业务重组,百度剑指AI to C话语权
  • SeqGPT-560M零样本应用:电商评论自动分类实战
  • StringRedisTemplate简单操作redis
  • 从BLIP到Deepbooru:揭秘AI图像标注背后的语言学博弈
  • MetaTube效能提升指南:解决媒体库管理难题的7个实战方案
  • AI读脸术JavaScript调用:前端直接集成可能性分析
  • 【网络攻防】ARP 欺骗深度解析:双向欺骗 + arpspoof,轻松达成 100% 断网操作!
  • Qwen3-4B-Instruct企业应用:技术文档自动生成与代码辅助开发
  • HG-ha/MTools一文详解:开源桌面AI套件在中小企业内容生产中的落地实践