当前位置: 首页 > news >正文

Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐

无论是搜索、推荐还是问答,把企业的数据资产变成可检索、可调用的智能服务,往往意味着一条漫长且高门槛的链路 —— 数据清洗、Embedding 选型、索引构建、策略配置、效果调优……

每一个环节都离不开工程投入和算法经验。

Viking AI 搜索 CLI(下文统称 SearchCLI )正式发布,代表着上述的这些复杂繁琐环节,现在都可以让 Agent 替你完成了

通过 IaC (Infrastructure as Code)范式,CLI 将数据入库、效果评测、搜推问答策略调优等一系列复杂任务,整合为一组简洁命令,搭配内置的 Skills ,Agent 可以瞬间变成企业私域数据搜索、推荐、智能问答系统的工程专家和算法专家,而你只需要在对话框中发出指令即可。

简单来说:会说话,就做搜索推荐和智能问答

SearchCLI 有什么用?来看一个实际场景:

小 V 是一名独立设计师,过去一年用 Seedream 生成了上万条素材。但素材越多,找起来反而越难:标签没打全,文件名靠不住,每次想找一张 “暖色调、带木纹质感的背景图”,都只能在缩略图里凭运气翻。

更别说搭一套搜索推荐系统 —— 光是向量索引和 Embedding 选型,就够劝退了。

小 V 痛定思痛:到底有没有个好法子,不用开发,我自己一个人能把这海量素材真正管起来,做到“需要哪张,一秒找到”?

有的兄弟,有的。 SearchCLI,只需要几条简单的命令,就能把本地素材库变成一个支持多模态搜索和相似推荐的智能图库,妈妈再也不用担心我一张张地人肉找素材了。

猜你喜欢推荐

相关物品推荐

搜索

智能问答

快速上手:一行命令开启智能搜索之旅

SearchCLI 的安装与配置极度精简,所有的繁琐操作都可以由 Agent 通过对话式交互自动完成。

1. 安装与初始化:极简授权

小 V 的第一步很简单:使用 Trae、OpenClaw、Claude Code、Codex 等 AI Agent,让它自动完成下载和配置。

复制以下提示词,发给 Agent :
“帮我下载这个 CLI:https://github.com/volcengine/SearchCLI?utm_medium=article,并告知我是否运行成功。”

安装完成后,在火山引擎官网获取 AK/SK(鉴权凭据),按照 Agent 的指示在终端输入 AK/SK,Agent 即可自动完成授权配置,整个过程几乎不需要手动操作。


获取 AK/SK


完成权限配置

如何获取 AK/SK:

点击 https://console.volcengine.com/common-buy/REC-SaaS-LLM-SEARCH%7C%7C7291580783171539244?utm_medium=article 前往 Viking AI 搜索首月体验版,注册火山账号,获取 AK/SK 以体验产品功能。

2. 智能数据预处理和导入

授权完成后,小 V 的当务之急就是要先把自己的一堆凌乱的数据清洗、处理和导入到服务中。

按传统做法,这通常需要经历繁琐的工程链路:自己写脚本遍历文件夹、提取图片特征、再一条条调用 API 上传……对于没有编程基础的小 V 来说,这几乎是一道无法逾越的鸿沟。

但有了 SearchCLI,小 V 根本不需要去管复杂的上传接口,直接把本地的图片素材发给 Agent,就可以先坐等数据预处理自动完成。原本零散的素材信息,会被自动整理成结构化数据,产出可直接入库的 Schema 和数据文件。

等数据准备好之后,导入这一步也不用她再自己折腾。Agent 会顺手完成数据集上传和入库,让这些素材真正进入搜索系统。

想尝试下智能数据导入,可以在https://github.com/Chen-chen429/viking-media-ai-search/blob/main/utm_medium=article.jsonl下载数据集,并使用小 V 的素材库~

因为 CLI 中内置了数据预检的指令,此时 Agent 会执行以下环节以确保数据质量:

数据质量确认没问题后,正式入库开始了。

面对 10,000 条正式数据的写入,CLI 预判了接口的并发限制。Agent 没有采用粗暴的单次全量上传,而是自动编写了切片脚本,将数据划分为 5 个批次(每批 2000 条),并加入了平滑的休眠等待:

小 V 看着进度条一条条跑完,直呼快哉,素材库终于不再只是一个杂乱的文件夹了!

3. 搜索、推荐、问答策略自动生成

素材导进去了,接下来就是最关键的问题:能不能搜到想要的东西?

3.1 配置搜索系统

CLI 内嵌了包含文本与图像的多模态检索配置,搜索能力即刻可用。小 V 试着搜了 “白雪皑皑的自然景观”——结果不再是靠关键词硬匹配,而是真正理解了她的意图。

CLI搜索效果

应用内搜索效果(示例)

3.2 个性化推荐与相似物品推荐

搜索能用了,但小 V 觉得还不够——每次找素材,都得自己想关键词去搜,她更想要的是:系统根据浏览习惯,主动推荐风格相近、主题相关的内容。

于是,小 V 开始尝试配置推荐策略(也是一句话的事)。CLI 敏锐地提示“缺少用户行为数据”,手头上没有行为数据不要紧,她直接把自己的偏好告诉 Agent:“我喜欢暖色调、自然质感、极简风格的素材,对卡通和赛博朋克风格不感兴趣。”

Agent 根据她的描述,自动生成了一份符合她审美偏好的模拟行为数据集,并丝滑完成上传。

CLI 自动完成了事件类型映射,并成功创建了 “首页推荐” 和 “相关推荐” 两大场景。

应用内猜你喜欢推荐效果(示例)

应用内相似图片推荐效果(示例)

3.3 配置问答助手

搜索和推荐都跑起来了,但小 V 还想更进一步:有时候有些需求一两个词讲不清楚,能不能直接用自然语言提问?

当然可以!

小 V 试着输入了"帮我找一些色彩丰富的水彩画素材",系统自动完成了意图理解、搜索召回、结果重排和答案生成,并返回了按类别整理过的素材建议。

她的素材库不再只是"等人来搜",而开始"主动引导提问"

应用内对话效果(示例)

4. 数据验证:效果评测与自动化调优

搜索推荐都跑起来了,但小 V 心里还有个疑问:效果到底好不好?如果搜不准,又该怎么调?

借助 CLI ,她实现了一套完全自动化的测试与调优闭环

4.1 批量跑搜索、推荐测试集

小 V 自己没有现成的评测集,但 CLI 提供了专门用于构造评测集的命令,Agent 调用命令主动构造了包含多种意图的 Query 评测集——“阳光落满的房间”“极简风格木画架”"带着猫的舒适沙发"等,调用 CLI 接口执行批量基准测试。

4.2 分析结果并提供策略优化建议

首次基准测试的输出显示,搜索场景的整体 Top-5 平均相关性得分只有 0.5244。

问题出在哪?Agent 分析后发现:文本权重配置偏低,导致包含明确物体特征的查询,召回了太多语义相近但实体不匹配的长尾数据。同时,推荐场景中新注册的无行为用户也获取不到推荐内容。

4.3 自动完成策略修改

明确了问题后,Agent 直接将优化建议转化为配置文件,通过 CLI 瞬时完成了线上策略的热更新——将语义检索、关键词检索的权重调至合适值,不需要填表单,不需要改代码,改完即生效。

4.4 对比优化前后效果

更新完成后,自动化评测脚本再次跑通测试集。结果很直观:调优后,包含具体物体的具象 Query 匹配精准度得到了明显改善,而抽象 Query 的效果也稳中有升。

至此,专属于小 V 的素材库就正式搭建起来了。

几天后,面对甲方“既有科技感又温暖”的抽象催图需求,她只需在对话框输入这句话,毫秒间,完美契合的图片和关联的灵感推荐就呈现在眼前。

从面对上万张杂乱素材束手无策,到拥有专属的搜索、推荐、问答一体化智能图库,小 V一行代码都没写。借助 Agent 与 SearchCLI 的配合,沉睡在硬盘里的数据被彻底激活。她终于告别了繁琐的“找图拉锯战”,把全部的时间和精力,还给了真正的设计与创作。

省流版总结:CLI 核心价值

很多时候,问题不是没有数据,而是数据还没有真正被用起来。

Wake up the data you already have—— SearchCLI 的价值,就在于把已有数据从“放着” 变成 “用起来”,让原本分散在文件、表格和业务系统里的内容,真正具备可搜索、可推荐、可对话的智能能力。

1. 数据入库:解放双手,不靠手搓

不同于传统的粗放式导入,CLI 提供了vs item profileplanapply三位一体的入库流程:

2. Search, Recommend & Chat: 三个愿望一次实现

通过 CLI,用户可以一键拉起具备搜推问一体化能力的 AI 应用:

3. AI 驱动的策略调优:让好结果自己跑出来

在传统的搜索优化中,解决一个“搜不到”或“搜不准”的问题往往需要算法专家数天的排查与参数微调。现在,这一过程被极大地自动化了:

不止于素材库:多行业全场景赋能

SearchCLI 强大的泛化能力与灵活的架构,让它能够跨越场景边界,深度赋能各行各业的业务增长:

  • 电商平台:将海量商品库一键资产化。

  • 社交/内容平台:让海量图文不再沉寂。

  • 企业知识库:将跨部门的企业知识入库,打造出一个全天候在线、懂业务的内部专家 Agent。

立即体验

数字化转型的下半场,是资产激活的竞速。Viking 家族的 SearchCLI 已经为你搭好了通往智能化的"最后一百米"高速公路。
我们邀请所有致力于探索生成式 AI 应用边界的企业与开发者,加入 Viking 的生态。
和我们一起,Wake up the data you already have !
对 SearchCLI 还有哪些期待or建议?欢迎在评论区留言~

立即试用
本 AIGC 素材库应用已开源,https://github.com/Chen-chen429/viking-media-ai-search?utm_medium=article,敬请体验~


Github cli安装包

http://www.jsqmd.com/news/934100/

相关文章:

  • 道本科技与DeepSeek联合解决方案:助力国央企合同管理数字化转型升级白皮书
  • 告别命令行恐惧:用Blue Kenue可视化TELEMAC V8P4在Windows 10下的计算结果
  • 第31篇 k8s之Ingress 进阶:TLS、重写与认证
  • DevSecOps建设之移动端自动化技能Appium
  • C#写的水准测量快速平差小工具,带闭合差分配和精度分析
  • Halcon变异模型(Variation Model)的三种模式(standard/robust/direct)到底怎么选?看完这篇就懂了
  • 手把手教你用SAM模型处理CHAOS医学CT图像:从DCM到NPZ的完整预处理流程
  • 别再自己造轮子了!用ThingsBoard开源平台,5步搞定一个物联网应用原型
  • 可重启序列:多核微处理器性能提升利器,最高让性能提升百万倍!
  • Java 程序员第 40 阶段10:从零搭建 Java 大模型完整项目,生产环境验证与持续迭代
  • 3分钟搞定NVIDIA显卡色彩校准:让宽色域显示器回归真实色彩
  • 第32篇 k8s 之 配置管理:ConfigMap 详解
  • 7-7. 开题报告等文档资料学校会查重吗?
  • 深入QNX Screen:利用screencmd命令行工具调试与动态修改窗口属性
  • 【无】2000-2024年各省人力资本水平数据(含原始数据+计算过程+计算结果)
  • 毕设直用|Python版Paillier加密联邦聚合系统(带双端一键启动脚本)
  • PC屏保画报广告5月档无与伦比的夏日经济
  • 别再只盯着ACOS了!亚马逊广告报告里的ROAS、ACOAS、ASOAS,哪个才是你该关心的核心指标?
  • AI 编程浪潮下,Zig 等开源项目为何坚守「拒绝 AI 代码」?
  • imx6ull 开发板,手机,MQTT 物联网通信实验。
  • OpenHarmony 4.0 Release版源码下载后,你的50G硬盘里到底多了些什么?
  • 【Agent】OpenCode 接入 DeepSeek-V4-Pro 开启1M上下文 保姆级教程
  • 用Python动手推导:能量守恒、勾股定理与机器学习损失函数之间的奇妙联系
  • 数字信任技术全景:从密码学基础到隐私保护实战
  • DeepSeek LeetCode 2911. 得到 K 个半回文串的最少修改次数 TypeScript实现
  • 【智能制造】- APS系列|16 生产计划与生产排程:核心概念与分类
  • Java 集成 LibreOffice 实现离线文档转换:Windows 与 Linux 环境详解
  • 快放≠质量牺牲!Sora 2 v2.3实测数据:启用motion-aware upsampling后PSNR提升11.6dB,延迟降低43%
  • Iinux:网络编程
  • 当样本量太小怎么办?Fisher精确检验实战指南(附SPSS操作避坑点)