图神经网络(GNN)一个领域的系统性鸟瞰
一、开篇:为什么整个世界都是图?
图 1:从社交到分子、从知识图谱到交通网络、从金融到推荐系统——图数据无处不在。
过去十年,深度学习的主线是 CNN 统治计算机视觉、Transformer 统治自然语言处理。但随着这两大架构的边界被不断逼近,研究者们开始意识到一个事实:大量最有价值的数据既不是规则的图像,也不是线性的序列,而是拓扑复杂的图。
- 社交网络:Facebook 有 30 亿用户,每个人都是节点;好友、关注、点赞是边。
- 分子结构:每一种药物、蛋白质都是一个图——原子是节点、化学键是边。
- 知识图谱:Google Knowledge Graph 包含 50 亿实体、5000 亿关系三元组。
- 交通网络:高速公路、地铁、航线——都是图。
- 金融交易:银行账户、转账、借贷关系天然是有向图。
- 推荐系统:用户和商品构成二部图,点击、购买、收藏是边。
这些数据有三个共同的挑战,CNN 和 Transformer 都处理不好:
- 拓扑
