当前位置: 首页 > news >正文

智能体AI崛起:本体论如何赋能药物研发新纪元?——2026智能体年深度解析

智能体AI作为生成式AI的进化方向,赋予AI决策和行动能力,在生命科学领域应用前景广阔。本文探讨了智能体AI的定义、架构及应用,重点分析了本体论如何通过语义标准化和跨系统映射,解决智能体在处理复杂科学知识、实现跨语言和系统语义互操作性方面的挑战,强调本体论在提升智能体透明度、可信度和科学严谨性中的关键作用。


What is Agentic AI and is there a role for ontologies?

01

摘要

2025年被业界誉为"智能体年"。智能体AI作为生成式AI的重要进化方向,赋予AI系统决策和行动的能力,能够自动完成多步骤复杂任务。在生命科学领域,从药物靶点优先排序到临床试验,智能体AI具有广阔应用前景。然而,其透明性、可信度与科学严谨性面临挑战。本文深度探讨智能体AI的定义、架构、应用场景及本体论对其的赋能作用。

02

详细内容

一、生成式AI的爆炸式增长与下一步演进

2024年,生成式AI(GenAI)迎来了前所未有的发展契机。 无论是公开还是商业化的大语言模型,在各类基准测试中都取得了突破性进展,消费者接触AI的成本大幅下降,应用范围从市场营销、运营管理扩展至医疗健康和生命科学等众多领域。其中,基于检索增强生成(RAG)的问答系统成为重点应用方向,用户可以用自然语言与自有数据进行交互式对话——这确实令人瞩目。

然而,真正值得关注的是AI发展的下一个阶段。 DeepSeek的问世已被誉为AI领域的"斯普特尼克时刻",展示了如何用有限的硬件资源构建高性能模型,进一步推动了AI成本的下降趋势。这同时提醒我们,伦理透明度可能成为模型和服务提供商的核心竞争力。

二、从对话机器人到智能体:AI的关键进化

早期阶段,用户已广泛体验了第一代应用——对话机器人。现在,焦点已转向加速处理更复杂的人类工作流程。 OpenAI发布的o1模型展现了高级推理能力,能够处理复杂问题并在给出答案前形成完整的思维链。

进入2025年,被业界称为"智能体年",新一代能力型应用陆续推出。 OpenAI的Operator可以完成基于网络的任务执行,而Deep Research则能进行多步骤的复杂网络研究。"智能体年"的真正含义在于——将人类专业人士(SME)的专业知识编码化、系统化,融入软件系统之中。这种转变对生命科学领域意味着什么?在评估智能体AI时又需要考虑哪些因素?

三、什么是智能体AI?

讨论智能体AI时,首先需要理解"能动性"(agency)的定义。 能动性是指采取行动或选择行动方案的能力。由此可以定义AI智能体:在某个过程或任务中利用AI,赋予它一定程度的能动性——即在用户委托下做出决策的自主权。

智能体的设计使其能完成通常需要多步骤人工执行的特定任务。以靶点优先排序智能体为例, 它接收一个疾病领域(如二型糖尿病)作为输入,输出经过优先级排序的潜在治疗靶点列表(如GLP1R受体)。

要使智能体有效运作,必须为其配备适当的工具和函数。 以靶点优先排序为例,该智能体需要访问:

  • 描述疾病与基因关系的数据库

  • 捕捉靶点可成药性的信息库

  • 提供证据和新颖假说的文献来源

这些可视为智能体可用的工具,通常以外部API或软件形式提供。函数则用于规定数据在工具间如何流转或如何呈现给最终用户。

四、智能体设计的光谱:自主性与引导性的平衡

在构建智能体时,工具和函数的配置方式至关重要,这涉及自主性和引导性之间的权衡。 在自主性光谱的一端,可以将所有工具和函数提交给大语言模型,让其自主决定使用哪些工具、以什么顺序使用。在这种设置中,LLM不仅是推理引擎,还是规划模块,拥有将高层目标分解为可执行步骤的完全自主权。

在光谱的另一端,可以提供明确定义的线性工作流。例如:

  1. 访问疾病与基因关系数据库,提取相关基因集
  2. 检索第一步中各基因的可成药性信息
  3. 审查文献,寻找支持最具可成药性靶点的证据及相关不良事件
  4. 识别疾病相关但未在第一步中出现的其他靶点,假设其具有新颖性

在这种模式下,LLM无需定义可执行步骤(因为已预先规定),但仍能为流程注入推理能力。

此外,智能体可与其他智能体组合以完成更复杂的任务。例如,若拥有专门识别医疗需求缺口的智能体,可与靶点优先排序智能体联合使用,寻找医疗需求缺口领域的优先靶点,这称为多智能体架构。这些智能体既可由LLM自主串联,也可按预定义的线性方式组织。

除了工具和函数,智能体还需其他关键组件,包括短期记忆和对其可用工具的高层次描述(如"使用该服务评估您的蛋白靶点是否能被小分子化合物修饰")。

五、生命科学领域中的智能体应用场景

在生命科学领域,特别是制药药物开发中,存在大量耗时任务可被"智能体化",包括研发靶点识别、先导化合物鉴定、临床前毒理学研究,以及临床试验、审批和上市后监测与线扩展应用。

智能体为加速这些耗时任务提供了绝佳机遇,具有潜力大幅缩短新药上市周期和相关成本。 但须注意,生命科学是一个以证据为导向决策的领域;错误决策可能导致高成本甚至严重后果。仅基于LLM驱动智能体生成的假说构建研发管线,应当谨慎对待。

要使智能体真正发挥价值,需优先考虑以下几点:

(一)从问题出发

在开发任何解决方案前,必须深入理解待解决的问题。应避免反向思维——先有解决方案再寻找应用场景。

(二)透明性至关重要

要赢得对智能体输出的信任,可追溯性和透明性是关键。仅说"因为智能体Y告诉我们"就关注靶点X是不够的。至关重要的是理解决策的"原因"——使用了哪些工具、审查了什么数据、什么推理逻辑导出了智能体的输出结果。

(三)可访问性至关重要

为使智能体在完成任务时能考虑相关搜索空间,它必须能访问所有必要资源。这需要以工具形式呈现给智能体的有文档说明的API。资源不仅应易于访问且有清晰文档,还应提供工具"描述"供解读,例如"需要了解药物的作用机制?请访问此服务"。同时应考虑智能体访问数据时的权限问题。

(四)数据质量规则

虽然资源可访问性至关重要,但输出质量取决于所能访问数据的质量。这要求在各个业务领域拥有金标准数据。

(五)融入科学内涵

虽然LLM擅长理解语言,但在理解科学中普遍存在的同义性和歧义时往往力不从心——科学的复杂性远超语言本身。

例如,知道内部代码TA123代表基因GLP1R这一点对数据和谐化及信号放大至关重要。 从单一来源检索数据而不理解实体可被引用的多种方式是有问题的。例如,大多数开源数据库缺乏良好的语义搜索能力,仅依赖基础同义词。智能体可能使用一个同义词(如"二型糖尿病")搜索,然后评估结果,如果不满意(例如结果缺乏正确语境),可能尝试其他同义词如"T2D"再迭代——这是缓慢且成本高昂的过程。

若搜索工具能在前期更好地处理同义词和更高层次概念,搜索效率将大幅提升。此外,不同资源可用多种方式表示其数据——无论是语法上的差异(如搜索工具中的非结构化文本与图数据库中的结构化数据),还是语义上的差异(搜索系统可能使用MeSH描述疾病,而图索引使用DOID)。拥有通过映射描述等效性的能力至关重要(例如,MeSH:D003924和DOID:9352都是二型糖尿病的标识符)。

通过为理解语言的LLM配备本体论中捕获的科学知识,可在透明步骤中提供人类可解释的结果。

(六)谨慎考虑给予智能体的自主权程度

某些任务需要有限自主权,更适合线性流程。与其信任LLM决定过程中的下一步,不如给它清晰的计划,或甚至在执行下一步前请求专家输入和审查。在某些场景(如识别新颖性)中自主权可能更合适,但同样应由专家进行评估。

(七)从最小模块开始

通过专注于拥有明确的工具或函数集,可在此基础上构建多样化智能体。应采用模块化思维并尽可能记录。在开发智能体时,重要的是采用自下而上的方式。

(八)安全护栏

在构建智能体时,须确保严格的安全护栏到位,须明确说明智能体不做什么,就像明确它应该做什么一样。

(九)生命科学问题不需纯技术方案

复杂的技术架构不等同于适用的解决方案。主题专家在任何解决方案的开发、设计和至关重要的评估中必须扮演关键角色。

六、本体论如何赋能智能体AI

智能体通常可访问多种工具,这些工具中的数据可能以不同的技术或语法格式捕获,如SQL数据库、知识图谱或通过API访问的文档索引。 虽然LLM擅长翻译语言(例如将自然语言转换为SQL、Cypher或RESTful API调用等查询语言——如果有相关文档),但在将自然语言转换为这些系统内相关事物的标识符时往往力不从心。

此外, 当不同系统使用不同标准表示相同事物时,能够和谐化一个系统的输出与另一系统的输出至关重要,即理解等效性。

本体论可帮助缓解上述所有问题。 其丰富版本可用于将自然语言转换为标识符,或在构建数据库时将非结构化文本转换为机器可读标识符。可采用相同方法将字符串"类胰高血糖素肽-1"转换为ID"GLP-1"以供知识图谱查询。

这意味着本体论为智能体搭建了一座"理解之桥",使其不仅能处理语言表达的多样性,还能实现跨系统的语义互操作性。在生命科学这样一个术语众多、同义词繁杂、分类标准多元的领域,本体论的应用尤为关键。通过本体论支持的标准化和映射机制,智能体可以更精准地定位和处理信息,减少歧义和冗余,提高决策的准确性和可信度。

七、总结与展望

智能体AI代表了人工智能从感知和理解向主动行动能力的重大跨越。在生命科学和制药领域,智能体有潜力革新从靶点发现、先导化合物优化到临床试验的整个药物开发流程。然而,这一强大能力必须伴随相应的责任机制——包括确保透明可追溯、数据质量金标准、科学知识融入、合理的自主权设置和专家审查。

本体论在此过程中扮演不可或缺的角色。它不仅能帮助智能体跨越语言和系统的鸿沟,还能在复杂的科学知识体系中提供语义支撑。唯有当技术创新与科学严谨性相结合,由领域专家与AI系统形成紧密协作,智能体AI才能真正为生命科学研究和药物开发带来革命性的改进。

03

关键要点回顾

  • 2025年是"智能体年",AI正从对话能力向自主决策能力演进

  • 智能体需要明确的工具、函数、透明性和专家参与

  • 自主性与引导性的平衡至关重要,应根据具体任务场景选择

  • 生命科学应用前景广阔,但必须确保证据驱动和严谨决策

  • 本体论通过语义标准化和跨系统映射为智能体提供强大支撑

  • 主题专家的参与贯穿智能体开发的全过程

2026年AI行业最大的机会,毫无疑问就在应用层

字节跳动已有7个团队全速布局Agent

大模型岗位暴增69%,年薪破百万!

腾讯、京东、百度开放招聘技术岗,80%与AI相关……

如今,超过60%的企业都在推进AI产品落地,而真正能交付项目的大模型应用开发工程师**,**却极度稀缺!

落地AI应用绝对不是写几个prompt,调几个API就能搞定的,企业真正需要的,是能搞定这三项核心能力的人:

✅RAG:融入外部信息,修正模型输出,给模型装靠谱大脑

✅Agent智能体:让AI自主干活,通过工具调用(Tools)环境交互,多步推理完成复杂任务。比如做智能客服等等……

✅微调:针对特定任务优化,让模型适配业务

目前,脉脉上有超过1000家企业发布大模型相关岗位,人工智能岗平均月薪7.8w!实习生日薪高达4000!远超其他行业收入水平!

技术的稀缺性,才是你「值钱」的关键!

具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

AI浪潮,正在重构程序员的核心竞争力!现在入场,仍是最佳时机!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

⭐️从大模型微调到AI Agent智能体搭建

剖析AI技术的应用场景,用实战经验落地AI技术。从GPT到最火的开源模型,让你从容面对AI技术革新!

大模型微调

  • 掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。

  • 学习如何利用领域数据(如制造、医药、金融等)进行模型定制,提升任务准确性和效率。

RAG应用开发

  • 深入理解检索增强生成(Retrieval-Augmented Generation, RAG)技术,构建高效的知识检索与生成系统。
  • 应用于垂类场景(如法律文档分析、医疗诊断辅助、金融报告生成等),实现精准信息提取与内容生成。

AI Agent智能体搭建

  • 学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。
  • 构建垂类场景下的智能助手(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)。

如果你也有以下诉求:

快速链接产品/业务团队,参与前沿项目

构建技术壁垒,从竞争者中脱颖而出

避开35岁裁员危险期,顺利拿下高薪岗

迭代技术水平,延长未来20年的新职业发展!

……

那这节课你一定要来听!

因为,留给普通程序员的时间真的不多了!

立即扫码,即可免费预约

「AI技术原理 + 实战应用 + 职业发展

「大模型应用开发实战公开课」

👇👇

👍🏻还有靠谱的内推机会+直聘权益!!

完课后赠送:大模型应用案例集、AI商业落地白皮书

http://www.jsqmd.com/news/569593/

相关文章:

  • Phi-4-mini-reasoning步骤详解:supervisorctl管理服务全命令解析
  • 如何在5分钟内掌握winget-install?开源命令行工具安装指南
  • 2026年靠谱的S砖/C70S砖源头工厂推荐 - 品牌宣传支持者
  • 如何让老旧Flash内容重获新生?CefFlashBrowser开源工具给出完美答案
  • 如何找到一家靠谱的SEO文章代写网站
  • SiameseAOE模型多模态扩展探索:结合图像信息的属性抽取
  • 多模态AI:当机器真正“看懂”世界
  • TranslucentTB高效配置与本地化实践指南
  • 通俗解读:GPU和NPU,在AI中分别扮演什么角色
  • 技术突破:Bypass Paywalls Clean内容访问解决方案深度解析
  • Cmsemicon中微 BAT32G133GC20SA TSSOP20 嵌入式闪存
  • SentrySearch:开启自然语言检索原生 MP4 视频新时代
  • Mac用户福音:Qwen3-TTS声音克隆在ComfyUI上的M芯片优化方案
  • 别再手动写接口了!用Flask+Ngrok快速给MySQL做个API,Dify直接调用
  • 浏览器中的SQLite管理革命:本地数据库查看工具的创新实践
  • Java微服务集成SmallThinker-3B-Preview实战:SpringBoot构建AI服务
  • 掩膜片蚀刻加工源头厂家怎么选?一文看懂工艺与实力
  • Ollama部署translategemma-12b-it:Gemma3架构下图文联合建模能力深度解析
  • python基于大数据的森林环境监测系统 Spark+Hadoop+Hive 大数据 深度学习 机器学习
  • SketchUp STL开源工具:让3D设计无缝转化为可打印模型的完整方案
  • WeKnora部署教程(CPU友好版):低配服务器也能跑的轻量问答镜像
  • Bili2text终极指南:如何一键将B站视频转文字,快速提取核心内容
  • Pixel Couplet Gen保姆级教程:Streamlit Theming定制像素UI主题色系统
  • Pixhawk飞行日志实战:从数据到诊断的精准排障指南
  • 如何用Rough.js创建手绘风格图形:数据可视化与UI设计的终极指南
  • 实战项目:基于快马平台用ai构建openclaw与千问模型的竞品监控分析系统
  • 2026 医学装备大会 | 聚焦前沿技术,阜外孙兴国主任解读超导心磁图临床价值
  • 3个步骤,让猫抓帮你轻松捕获网页视频资源
  • 从Blender到浏览器:手把手教你将自制GLTF模型完美嵌入Cesium地球(避坑指南)
  • Hi3519 DV500上跑YOLOv5太慢?手把手教你用ATC工具优化,推理速度提升200倍