当前位置: 首页 > news >正文

concat graph构造

在蛋白质图神经网络(Protein GNN)中,"concatgraph"(拼接图)通常指将多种异构特征拼接后作为图的初始表示,而不是某种固定维度的标准图。它的构造方式主要分为三个层面:节点特征拼接边特征拼接、以及图/多模态级别拼接


1. 节点特征拼接(最常见)

这是最核心的构造方式。每个残基(Residue)作为图的一个节点,其初始特征向量由多种来源拼接而成:

特征类型 典型维度 内容
序列编码 20 / 25 20 种标准氨基酸的 one-hot;有时加 5 个特殊 token(未知、缺失等)
物化性质 4–10 疏水性、电荷、极性、分子量、芳香性等
预训练语言模型嵌入 320 / 640 / 1024 / 1280 ESM-2、ProtT5、ProtBert、SeqVec 等
结构特征 6–10+ 二面角(φ, ψ, ω)的正弦/余弦;Cα 坐标、二级结构等

典型构造示例:

  • GVP + LLM 分类器:节点特征 = DistilProtBert 嵌入(1024 维)拼接 二面角正弦/余弦(标量)+ 相邻 Cα 单位向量(向量)
  • PepLM-GNN:节点特征矩阵由肽和蛋白质的 ProtT5 嵌入直接拼接 而成,使每个节点携带完整序列语义信息
  • PPI 预测:节点使用 ProtBert/SeqVec 的残基级嵌入,替代传统 one-hot + 物化性质,再输入 GCN/GAT

关于你提到的 L×9 vs 20×9:如果 "9" 指物化性质维度,一种常见做法是 20 (one-hot) + 9 (物化性质) = 29 维 的节点特征;也有工作将 20 维 one-hot 与 9 维特征分别处理后再拼接。L 是序列长度,因此 L×29 是更常见的节点特征矩阵形状。单纯 "20×9" 不太常见,除非是某种特定的外积或邻接矩阵构造。


2. 边特征拼接

边通常基于 Cα-Cα Contact Map(如 10 Å 截断)或 K-近邻 构建,边特征也会拼接多种信息:

  • 距离编码:RBF 高斯基函数(如 16 维,覆盖 0–20 Å)
  • 序列位置编码:残基在序列上的距离 |i-j|(反映一维顺序)
  • 方向向量:连接两个 Cα 的单位向量(向量特征)

3. 图级别 / 多模态拼接

在更高层次,"concatgraph" 也指将不同图或不同模态的表示拼接:

拼接层级 做法 示例
多子图嵌入拼接 对同一蛋白构建多个语义子图(如 GO Molecular Function 图 + Cellular Component 图),分别过 GNN 后将节点嵌入拼接 并行 GNN 架构
多尺度层拼接 将 GNN 每一层的 READOUT 输出拼接,形成最终图表示 SICGNN 各层 GIN 输出拼接
蛋白-配体/肽拼接 分别编码蛋白图和配体图,将两个图级向量拼接后做预测 GNNAS-Dock、BridgeDPI 等
序列+结构拼接 图编码的结构表示与 CNN/Transformer 编码的序列表示拼接 X-DPI 中蛋白图与 TAPE 序列嵌入拼接

总结:一般构造流程

输入:蛋白质序列 / PDB 结构│▼
┌─────────────────┐
│ 节点特征构造     │  ← 拼接 one-hot / 物化性质 / ESM嵌入 / 结构特征
│ (残基级)        │
└─────────────────┘│▼
┌─────────────────┐
│ 边构造           │  ← Contact Map (Cα-Cα < 10Å) 或 KNN
│ (空间/序列邻居)  │  ← 边特征:距离RBF + 序列距离 + 方向向量
└─────────────────┘│▼
┌─────────────────┐
│ GNN 消息传递     │  ← GCN / GAT / GIN / GVP
│ (多层)          │
└─────────────────┘│▼
┌─────────────────┐
│ 输出拼接 (可选)  │  ← 多层输出拼接 / 多图拼接 / 与其他模态拼接
└─────────────────┘

如果你提到的 "L×9" 或 "20×9" 来自某篇具体论文或课程讲义,提供上下文后我可以帮你精确解读那个特定工作中的维度定义。

http://www.jsqmd.com/news/984382/

相关文章:

  • 2026上海虹口区黄金回收+白银回收+铂金回收最新行情 大盘同步报价商家 - 沪上贵金属口碑推荐官
  • Flowframes完整教程:从零开始掌握视频插帧技术,让视频流畅度翻倍!
  • 校园二手交易平台---项目验收
  • 消保委提醒:2026上海普陀区黄金回收+白银回收+铂金回收选择这几家更安全 - 沪上贵金属口碑推荐官
  • 告别‘马赛克’边缘:手把手用DeepLabV3+实现图像分割的精细优化(附TensorFlow/PyTorch配置)
  • 2026资质筑基技术赋能深耕实体:融景科技打造花都GEO优化服务标杆 - 广东科技观察
  • 融景科技:花都 GEO 行业标杆,凭双国标资质与自研技术领跑大湾区 - 广东科技观察
  • 主流7z解压工具怎么选:四款产品深度对比与避坑指南
  • 兰州卫生纸批发市场诚信格局分析:区域供应商服务能力与行业趋势观察(2026年) - 优质品牌商家
  • 保姆级教程:在Win11上搞定MySQL 8.0.28安装与配置(附常见报错排查)
  • Python+Django实战|企业会议室预约管理系统:会议室档案、设备管控、在线预约、多级审批、签到核验、超时提醒、使用数据统计
  • 别再手动建库了!Kettle资源库一键初始化脚本(Oracle版)保姆级分享
  • 2026年西安汽车音响改装市场格局与服务机构能力分析 - 优质品牌商家
  • 2026年新发布承德AI搜索服务机构找哪家?深度解析与本地服务商推荐 - 2026年企业资讯
  • 技术拆解:融景 AI.GEO + 智能体双核系统,重构企业 AI 获客逻辑 - 广东科技观察
  • 即将读博的我,决定开始重新学编程...
  • 从“国际消费中心”到“全球AI认知枢纽”——2026年上海企业GEO选型战略指南 - GEO优化
  • 项目启动之相关方分析
  • 2026广州精品搬家公司深度测评推荐|日式精细打包拆装、同城短途、别墅高端搬家一站式攻略 - gzdjxd
  • 2026年香格里拉民宿行业观察:从草原到雪山的住宿新趋势与多维度评测 - 优质品牌商家
  • 构建安全可靠的后端系统:关键技术与最佳实践
  • Java项目安全管理看这篇就够了!
  • 成都木跳板回收与木方租赁市场格局分析:服务主体与行业趋势研究 - 优质品牌商家
  • 如何用Untrunc拯救损坏的MP4视频文件:完整修复指南
  • 猫抓cat-catch终极指南:如何在3分钟内掌握浏览器视频下载技巧
  • Calibre豆瓣元数据插件:让电子书管理告别信息孤岛
  • 别再纠结选哪个了!手把手教你用Qt和C#快速搭建一个简易SCADA监控界面
  • Adobe软件激活革命:GenP 3.0如何用5分钟解锁创意无限
  • 从“首善之都”到“AI认知战略高地”——2026年北京企业GEO选型战略指南 - GEO优化
  • 小程序毕设项目:基于springboot+微信小程序的演唱会售票系统小程序 (源码+文档,讲解、调试运行,定制等)