PAT天梯赛L2-2病毒溯源题解:用邻接表和DFS找最长变异链(附C++代码避坑点)
PAT天梯赛L2-2病毒溯源:邻接表与DFS实战解析
病毒变异问题在算法竞赛中经常以树形结构或图论形式出现。这道L2-2题目要求我们找出最长的变异链,本质上是在寻找树中的最长路径。与常规DFS应用不同,本题还需要处理路径排序和回溯等细节,这正是许多参赛者容易失分的地方。
1. 问题分析与数据结构选择
题目描述了一个病毒变异的有向无环图(DAG),其中每个节点最多有一个父节点,这实际上构成了一棵树。我们需要找到从根节点到叶节点的最长路径,当存在多条相同长度的路径时,选择字典序最小的那条。
邻接表的优势:
- 空间效率高,仅存储存在的边
- 遍历子节点方便,时间复杂度O(1)
- 适合处理稀疏图(本题中每个节点的子节点数量有限)
vector<int> v[maxn]; // 邻接表存储关键点在于如何高效表示这种变异关系。使用邻接表而非邻接矩阵,可以节省大量空间(从O(N²)降到O(N)),这对N≤10⁴的规模至关重要。
2. 解题框架与核心算法
2.1 寻找根节点
病毒源头是没有父节点的那个唯一节点。我们可以通过标记法快速定位:
int t[maxn] = {0}; // 初始化所有节点为无父节点 // 输入处理时标记子节点 for(int i=0; i<n; i++){ while(k--){ cin >> x; v[i].push_back(x); t[x] = 1; // x有父节点 } } // 寻找根节点 int root = -1; for(int i=0; i<n; i++){ if(!t[i]){ root = i; break; } }2.2 DFS实现与回溯机制
深度优先搜索是解决树形结构问题的利器。本题需要特别注意两点:
- 维护当前路径
- 及时回溯避免路径污染
vector<int> temp; // 存储最终最长路径 vector<int> p; // 存储当前路径 void Dfs(int index, vector<int>& p){ if(p.size() > temp.size()){ temp = p; // 找到更长路径,更新结果 } for(int i=0; i<v[index].size(); i++){ p.push_back(v[index][i]); // 选择当前子节点 Dfs(v[index][i], p); // 递归探索 p.pop_back(); // 回溯,移除当前子节点 } }注意:传递路径vector时务必使用引用(&),否则会因频繁拷贝导致内存问题和性能下降。
3. 关键优化与避坑指南
3.1 字典序处理技巧
题目要求当存在多条最长路径时,输出字典序最小的那条。这需要在搜索前对子节点进行排序:
for(int i=0; i<n; i++){ if(v[i].size()){ sort(v[i].begin(), v[i].end()); // 子节点按编号升序排列 } }这样DFS会优先探索编号较小的子节点,当找到第一条最长路径时,自然就是字典序最小的解。
3.2 常见错误与调试技巧
- 忘记回溯:这是DFS中最常见的错误,会导致路径包含错误节点
- 根节点判断错误:确保正确识别唯一的无父节点
- 内存问题:避免vector的频繁拷贝,使用引用传递
- 边界条件:考虑N=1或链状结构等特殊情况
调试时可以打印中间结果:
// 调试用:打印邻接表 for(int i=0; i<n; i++){ cout << i << ": "; for(auto x : v[i]) cout << x << " "; cout << endl; }4. 完整代码实现与性能分析
将上述思路整合,我们得到完整解决方案:
#include <bits/stdc++.h> using namespace std; const int maxn = 10001; vector<int> v[maxn]; vector<int> temp; int t[maxn] = {0}; void Dfs(int index, vector<int>& p){ if(p.size() > temp.size()){ temp = p; } for(int i=0; i<v[index].size(); i++){ p.push_back(v[index][i]); Dfs(v[index][i], p); p.pop_back(); } } int main(){ int n, k, x; cin >> n; // 构建邻接表并标记子节点 for(int i=0; i<n; i++){ cin >> k; while(k--){ cin >> x; v[i].push_back(x); t[x] = 1; } if(v[i].size()){ sort(v[i].begin(), v[i].end()); } } // 寻找根节点 int root = -1; for(int i=0; i<n; i++){ if(!t[i]){ root = i; break; } } // DFS搜索 vector<int> p; p.push_back(root); Dfs(root, p); // 输出结果 cout << temp.size() << endl; for(int i=0; i<temp.size(); i++){ if(i) cout << " "; cout << temp[i]; } return 0; }时间复杂度分析:
- 邻接表构建:O(N + E),E为总边数
- 子节点排序:最坏情况下O(NlogN)
- DFS遍历:O(N)
- 总体复杂度在题目约束下是可接受的
5. 同类问题扩展与实战应用
这种基于邻接表和DFS的解法可以推广到多种树形和图论问题:
- 二叉树最长路径:无需处理多子节点情况
- 家族关系图谱:查找最远的亲属关系
- 依赖解析:如软件包依赖的最长安装顺序
- 组织结构分析:公司汇报链的最长路径
在实际比赛中,建议将这种DFS模板抽象出来,根据具体问题调整路径记录和比较逻辑。例如,可以修改为:
// 通用DFS框架 void dfs_template(int node, vector<int>& path, vector<int>& result){ // 终止条件判断 if(/*满足条件*/){ // 更新结果 return; } for(auto child : children[node]){ path.push_back(child); dfs_template(child, path, result); path.pop_back(); // 回溯 } }掌握这种模式后,可以快速解决PAT、蓝桥杯等竞赛中的类似题目。在最近的几场比赛中,这种题型出现的频率相当高,建议重点练习。
