当前位置: 首页 > news >正文

谷歌搜索过时了?AnySearch想建AI时代搜索的底层世界

5月11日,一个名为AnySearch的项目正式上线。

它不像传统搜索引擎,帮人找官网、博客、教程、科普文章一样的网页,而是专门给AI Agent喂数据。

一个API Key,接通22个专业数据源,从金融行情到法律判例,从学术论文到网络安全情报,全打包。

Benchmark测试里,准确率,响应速度,两个维度都甩开Parallel和Brave。而且匿名使用、无追踪、零遥测,你的查询只属于你。

AnySearch的核心定位、就是要做AI时代的搜索基础设施,从帮人找信息,到帮AI Agent理解世界。

统一入口,通吃数据源

做Agent开发的人都知道,搜索模块的集成成本有多高。

想让一个Agent同时查企业股权、拉A股分钟级行情、搜法院裁决书、找GitHub代码实现、提交文件到VirusTotal做安全检测,你得分别注册企查查、Finnhub、PubMed、VirusTotal的账号,啃几十套不同的API文档,管几十个API Key的限流和余额,还得自己写路由逻辑判断什么查询发给哪个数据源。

这套活儿干下来,搜索模块的开发成本可能比Agent本身还高。

AnySearch把这一切打包了。一个API Key,访问AI所需的优质数据源。开发者不用当API集成工程师,接进去,剩下的交给它。

通用搜索、代码、科技、服饰、旅行、家居、购物、游戏、影视、音乐、金融、学术、法律、商业、知识产权、网络安全、教育、健康、宗教、地理、环境、能源等垂直领域全覆盖。几乎覆盖了Agent的全场景需求。

行业分析机构估算,超过90%的企业数据属于暗数据(Dark Data),被收集和存储,却从未被有效利用。

另外,互联网上占比很高的重要信息,是Google和Exa完全触及不到的。AnySearch已经替你将它们接入。

这跟索引能力无关,架构上就不可能覆盖,因为这些数据锁在付费数据库、实时金融终端、安全代码仓库、学术研究平台和专有企业系统里。

接入方式也很灵活。三种路径覆盖不同类型的用户:REST API,通用,适配任何编程语言和Agent框架;MCP(Model Context Protocol,模型上下文协议)Server,Claude Desktop、Cursor、Windsurf、OpenCode配一行JSON即可接入;Skill,直接作为Agent技能调用。

从硬核开发者到轻度极客,全照顾到了。

智能路由,精准投喂

AnySearch技术内核里有一个关键模块:智能意图路由(Intent Classifier)。

一条查询进来,内置的Intent Classifier自动识别查询意图,通过多维路由匹配,精准路由到最相关的2到3个数据源。系统不会对所有数据源做全量扇出,只查最该查的源,速度更快,Token消耗更低。

多个数据源同时返回结果时,AnySearch用RRF(Reciprocal Rank Fusion,倒数排名融合)算法做结果融合。同一条信息被多个源交叉验证时排名自动提升,URL规范化去重避免重复。

融合后再经过多维度质量重排序,Agent可以直接用分数做决策,不用再花Token做二次筛选。

输出格式上,AnySearch返回清洗后的结构化Markdown,通常每条结果500到2000个Token。

同样的查询,Agent用Exa搜10条结果,平均消耗约15000个Token;用AnySearch搜5条高质量结果,平均消耗约5000个Token。Token消耗降低60%到70%。

在Frames、FreshQA、WebwalkerQA三个数据集共300道题的评测中,AnySearch整体准确率76.4%,三项数据集中FreshQA拿到80.0%,WebwalkerQA上65.2%,比Brave高出18.4个百分点,比Parallel高出4.2个百分点。

延迟方面,AnySearch平均47.8秒完成一个QA任务,比Parallel的74.4秒快36%,比Brave的68.9秒快31%。在WebwalkerQA上,AnySearch用76.5秒,Parallel膨胀到145.6秒,Brave到133.0秒,差距接近一倍。

AnySearch与Brave在6个真实场景中对比,综合评分8.9比7.5。

安全工程师告警分析,AnySearch交叉验证多个专业情报源并给出可执行响应方案,得分9.5比8.2;开发者项目代码搜索,AnySearch返回生产级完整代码含核心算法和工程细节,9.5比7.8;商务出行实时决策,AnySearch一次查询返回航班状态、汇率和多种交通方案,8.0比5.5,Brave连航班查询都没通过,还包含事实错误。

架构级隐私,查询不留痕

Agent通过搜索接口查询的内容,可能涉及商业机密、安全敏感信息、法律风险数据。这些查询被记录、被分析、被用于训练模型,后果很严重。

AnySearch的做法是:从架构层面把隐私保护作为第一优先级。

用户的搜索查询不会被记录,不会被用于训练模型,不会被分享给第三方。系统不收集任何遥测数据,不追踪用户行为,不做用户画像。所有API请求通过加密通道传输,查询内容在处理完成后即时丢弃,不做持久化存储。

具体到技术实现,AnySearch采用零留存执行(Zero Retention Execution),处理路径上无恢复性数据;零知识凭证(Zero-Knowledge Credentials),凭证经不可逆变换且无法恢复;私有能力隔离(Private Capability Isolation),企业专属能力不进入公共范围;分层认证(Layered Authentication),无缝支持匿名和授权两种访问方式。

匿名使用、无追踪、零遥测,你的查询只属于你。

这在当前AI搜索赛道中很稀缺。大多数AI搜索工具,多多少少都在用用户查询数据优化自身模型,这几乎是公开的秘密。AnySearch选择不碰这条线,对处理敏感信息的开发者和企业用户来说,这一点尤为关键。

AI搜索的第四次范式转移

回望搜索引擎的历史,每一次范式转移,都伴随着谁在搜的改变。

1998年Google诞生,搜索帮人找网页。

2010年代移动互联网兴起,搜索帮人找服务。

2023年ChatGPT引爆LLM浪潮,Perplexity们把搜索变成帮人找答案。

2026年,搜索正在经历第四次范式转移:从帮人找信息,到帮AI理解世界。

Agent时代,搜索的消费者变了,变成了机器。机器不需要链接,不需要HTML,不需要花里胡哨的搜索结果页,需要的是结构化的、经过验证的、可以直接用于推理和决策的数据。

未来的AI不只要会思考,更需要真正看见世界、理解世界。互联网时代的搜索引擎帮助人类寻找网页;AI时代,Agent需要的不是一串链接,而是可信、结构化、可执行的信息结果。

Agent开始执行复杂任务时,真正的瓶颈往往不再是推理能力,而是信息获取能力。缺少可靠的信息获取层,再强大的AI模型,也难以真正理解现实世界。

Forrester和Gartner的研究报告指出,大部分AI项目失败或表现不佳,原因在于缺乏AI就绪(AI-ready)的数据。AI要提供真正的竞争优势,必须基于组织独特的、富含上下文的专有数据来训练和交互,面向公共网页的工具根本干不了这个活。

AnySearch给自己的定位是一家应用型AI实验室,正在构建AI时代的全新搜索基础设施。

这是一个全新的基础设施层。谁先把这一层做好,谁就拿到AI Agent生态的入场券。

参考资料:

https://www.anysearch.com/home

https://github.com/anysearch-ai/anysearch-skill

https://www.prnewswire.com/apac/news-releases/anysearch-launches-as-search-infrastructure-built-for-ai-agents-302768057.html

https://briefglance.com/articles/anysearch-launches-to-unlock-dark-data-for-ai-agents

https://letsdatascience.com/news/anysearch-launches-search-infrastructure-for-ai-agents-a94ba119

http://www.jsqmd.com/news/854683/

相关文章:

  • ACAP架构解析:从FPGA到自适应计算,如何突破冯·诺依曼瓶颈
  • GitLab分支管理避坑指南:从‘摘樱桃’到高效协作,我的团队这样用Cherry-pick
  • 别再死磕原生OpenStack了!华为云Stack HCS 8.0的极简部署与高可用设计,真香!
  • 镜像视界(浙江)科技有限公司 数字孪生·视频孪生·无感定位 行业地位核心优势 专业白皮书文案
  • HDMI转RGB,一款单端口HDMI 1.4b接收器,专门用于将HDMI输入信号转换为并行RGB/TTL数字信号输出,最大支持4K@30Hz
  • STM32MP1 Cortex-M4窗口看门狗(WWDG)配置与抗干扰应用实战
  • VT2516A板卡进阶玩法:模拟汽车线束开路/短路故障,做更真实的ECU诊断测试
  • 微信消息撤回已成往事:3分钟解锁永久防撤回功能
  • 别再死记硬背了!用Python模拟一个简单的图灵机,帮你彻底搞懂计算理论
  • 深度体验华为云CodeArts IDE:它真的是VSCode的“换皮”版吗?
  • 【Ansible 入门实战】三种变量详解
  • 车规级 AHD TX 芯片,主要用于将并行数字视频信号转换为模拟高清(AHD)信号进行传输,可广泛应用于车载360环视、倒车后视、车载流媒体、ADAS摄像头及CMS等领域。
  • 别再只靠v-html了!盘点Vue.js项目中容易被忽略的XSS风险点与防护策略
  • 从串行通信到SerDes:深入聊聊CDR电路的那些‘辅助’设计(频率捕获篇)
  • CH32V307V-R1-1V0开发板实战:手把手移植LwIP 2.1.3并跑满10M以太网
  • 面向企业安全运营的网络钓鱼暴露面收敛技术与实践研究
  • 别只当普通Office用!挖掘WPS教育考试版里那些被忽略的‘学习神器’
  • STM32开发库选型指南:标准库、HAL库与LL库的深度对比与实战应用
  • 5分钟掌握TMSpeech:完全离线的实时语音转文字终极指南
  • STM32CubeMX配置ADC多通道采样,结果两个引脚读数一样?一个Rank设置帮你搞定(F411实测)
  • 嵌入式AI四大趋势:硬件定义模型、工具链平民化、多模态融合与系统级安全
  • 别死磕数据线!聊聊EMMC BGA布线里那些能删掉的‘废脚’
  • 告别Patchwork++!用DipG-Seg算法搞定16线激光雷达200Hz实时地面分割(附保姆级代码解读)
  • bili2text终极指南:一键将B站视频转换为高质量文字稿的免费工具
  • Git仓库瘦身实战:手把手教你清理Linux下.git/objects/pack里的历史大文件
  • NFSv4服务器搭建与配置实战:从原理到避坑指南
  • 毕业设计:基于springboot欢迪迈手机商城设计与开发(源码)
  • 别只用基础框了!深度玩转CVAT属性注释模式:从人物分析到零售商品标注
  • Makefile条件判断(ifeq/ifdef)的坑,我帮你踩过了:从‘变量为空’引发的构建失败说起
  • 3小时精通:HTTrack网站离线浏览终极实战指南