蒋老师讲话:学科交叉融合
vcworld:“白盒”虚拟细胞,预测过程可读且分步,知识支撑下的机制推断(而非纯监督学习)
生物知识库检索(针对新查询:这个药物是否会影响这个基因,检索药物或基因这些机制相似的历史案例作为证据。相似度考虑基于LLM的语义相似度和基于知识图谱路径或拓扑关系的结构相似度。正反两种案例,即相似并且会影响/相似并且不会影响都找,组织成推理题)、LLM上下文增强(把检索到的局部知识图谱读懂,翻译成可解释文本)、规则化机制表达、基因表达预测(输出预测标签以及文本解释)
genetak数据集:包含348种药物扰动的5个不同细胞系,作为检索的证据托举
开放世界生物知识图谱的构建:整合多个开放知识库。图谱不是越大越好
评价两个指标:模型判断准确性和LLM推理鲁棒性(不能放弃推断)
