当前位置: 首页 > news >正文

AI一文扫盲(速成)

AI一文扫盲

最近几年,AI相关名词越来越多:看着看着就懵了,所以总结一下常见的高频词,辅助大家来理解

​ ——星河璀璨

🌟 每周速递来了~ - 社区问答- OceanBase社区-分布式数据库

AI ├── LLM │ ├── Embedding ├── 向量数据库 ├── RAG │ ├── Agent │ ├── Tools │ ├── Skills │ └── Workflow │ └── Function Calling

1. AI (人工智能)

  • 定义:人工智能(Artificial Intelligence),英文缩写为AI。是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。

  • 通俗解释:AI = 让机器像人一样“理解” 和“思考”。

常见的能力包含:

  • 聊天
  • 写代码
  • 分析数据
  • 识别图片

2. LLM (大预言模型)

  • 定义:大模型LLM(Large Language Model)是指具有大规模参数和复杂计算结构的机器学习模型。

  • 通俗解释:LLM = 一个超级会说话的“语言预测机器”

他本质是在做:

根据前文预测下一个词

eg:qianwen3.5-4b、openai

# 示例 from openai import OpenAI client = OpenAI(api_key="你的API_KEY") response = client.chat.completions.create( model="gpt-4o-mini", messages=[ {"role": "user", "content": "请解释什么是SQL索引"} ] ) print(response.choices[0].message.content)

3. Prompt (提示词)

  • 定义:Prompt 是一种指令或信息,它引导或触发 AI 系统做出回应。在与 AI 如 ChatGPT 的交互中,每当我们输入一段文字,无论是问题、命令还是陈述,这段文字就是一个 Prompt。

  • 通俗解释:Prompt = 你给AI的指令

​ 写得好 → 回答质量高
写得乱 → 回答也乱

Prompt 的作用

触发回应:Prompt 是与 AI 进行交流的起点,它告诉 AI 我们需要什么样的信息或反应。

引导对话:通过使用特定的 Prompt,我们可以引导 AI 沿着特定的思路或话题进行回答。

影响输出:AI 的回应会根据 Prompt 的内容而变化。一个明确、具体的 Prompt 通常会得到更精确和相关的回答。

# 示例prompt=""" 你是一名数据库专家,请用简单语言解释: 什么是SQL索引? 并给一个例子。 """

4. Embedding (向量化)

  • 定义:Embedding(嵌入)是指把文本(也可能包括图像、视频等其他模态数据)转成能表达语义信息的浮点数向量,向量之间的数学距离可以反映对应文本之间的语义相关性

  • 通俗解释:把一句话变成一串数字。

例如:

“ERP卡顿” → [0.124, -0.334, 0.987, …]

用于:

  • 语义搜索
  • 相似度计算
# 实例response=client.embeddings.create(model="text-embedding-3-small",input="ERP系统性能优化")vector=response.data[0].embeddingprint(len(vector))# 向量维度

更多信息参考:Transformer | 一文带你了解Embedding(从传统嵌入方法到大模型Embedding) - 知乎

5. Vector Database (向量数据库)

  • 定义:向量数据库是一种专门用于存储和处理向量数据的数据库系统。它以向量为基本数据类型,将向量作为数据的主要组织形式。

  • 通俗解释:

普通数据库按“精确匹配”查数据。
向量数据库按“语义相似”查数据。


# 示例# 导入 numpy 数学计算库# numpy 主要用于向量、矩阵计算importnumpyasnp# 创建第一个向量# 你可以理解为:一句话转换成的数字表示v1=np.array([0.1,0.3,0.5])# 创建第二个向量# 代表另一句话的数字表示v2=np.array([0.1,0.2,0.4])# 计算两个向量的“点积”# 点积公式:a1*b1 + a2*b2 + a3*b3# 用于衡量两个向量的相似程度similarity=np.dot(v1,v2)# 打印相似度结果print("相似度:",similarity)

真实项目中可以用:seekdb!!

6. RAG (检索增强生成)

  • 定义:RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMS),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等,RAG模型由FacebookAlResearch(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。

  • 通俗解释:

流程:

  1. 查知识库
  2. 把结果给 LLM
  3. 再生成回答

# 假设这是从知识库检索到的内容retrieved_text="ERP卡顿通常与慢SQL和锁等待有关。"question="ERP为什么会卡顿?"final_prompt=f""" 根据以下资料回答问题: 资料:{retrieved_text}问题:{question}"""response=client.chat.completions.create(model="gpt-4o-mini",messages=[{"role":"user","content":final_prompt}])print(response.choices[0].message.content)

更多信息参考:一文彻底搞懂大模型 - RAG(检索、增强、生成)-CSDN博客

7.agent (智能体)

  • 定义:是指能够感知环境并采取行动以实现特定目标的代理体。

  • 通俗解释:

​ LLM = 大脑
​ Agent = 大脑 + 手脚 + 工具

​ 可以自动执行任务。

8. Function Calling(函数调用)

  • 定义:是一种赋予大语言模型(LLM)调用外部函数能力的机制,使其能够结合真实数据或执行特定操作来满足用户需求,而不仅仅依赖模型自身的推理能力。这一技术最早由 OpenAI 在 GPT-4 中引入,随后被其他模型广泛采用。

  • 通俗解释:让AI输出“调用哪个函数”

importjson# 模型假设返回model_output={"function":"get_cpu_usage","args":{}}ifmodel_output["function"]=="get_cpu_usage":print(get_cpu_usage())

9. Tools(工具)

  • 定义:赋予语言模型调用外部预定义函数或API的能力。模型能根据用户意图,生成包含特定函数名和参数的请求,以执行外部操作。

  • 通俗解释:让AI的手能伸出虚拟世界。当AI自己做不了某件事时(比如查实时天气、订机票),它可以“摇人”,调用外部的软件程序来帮忙完成。

  • 例如:

    • 查数据库
    • 运行Python
    • 调接口
    defrun_sql(sql):returnf"执行SQL:{sql}"question="查询用户数量"sql="SELECT COUNT(*) FROM users"print(run_sql(sql))

10. Skills(技能)

  • 定义:在 AI 界,Skills 就是让大模型按照某种特定的方法论去行动的机制
  • 通俗解释:Skill = 封装好的一类能力模块

eg: SQL优化Skill、数据分析Skill、报表生成Skill

你可以把它理解为“超级进化版的提示词”。因为它比普通提示词强得多,通常由三部分组成:

[!NOTE]

  1. 元数据 (Metadata):包含对这个技能的简短描述。它保存在全局上下文中,因为体积小,所以非常节省Tokens(省钱又省心)。
  2. 行动指南 (Action Guide):这部分才是真正的提示词,规定了 AI 每一步该怎么做。
  3. 资源文件 (Resources):这是最厉害的地方!它可能包含Python 代码或其他执行程序,保证程序在调用 Skill 时能完成复杂的动作。
defsql_optimize_skill(sql):prompt=f""" 你是数据库专家,请优化以下SQL:{sql}"""response=client.chat.completions.create(model="gpt-4o-mini",messages=[{"role":"user","content":prompt}])returnresponse.choices[0].message.contentprint(sql_optimize_skill("SELECT * FROM users"))

11. Workflow(工作流)

  • 通俗解释:多步骤流程自动执行。

  • 例如:

    1. 读取慢SQL

    2. 分析原因

    3. 生成优化方案

    4. 输出报告

http://www.jsqmd.com/news/491899/

相关文章:

  • LLM训练基本代码学习-文本动作提取训练思路
  • 市面上tpu薄膜供应商
  • LeetCode HOT100 - 二叉树的最近公共祖先
  • 互联网大厂Java面试:从基础到高并发的深度解析
  • AI 编程3:LangGraph 实现 Orchestrator-Worker(编排器 - 工作者)工作流-test6
  • eVTOL动力电驱系统功率链路设计实战:效率、功率密度与可靠性的高空平衡之道
  • ngx_nonblocking
  • 深度解析:Redis 预扣减与 RabbitMQ 异步解耦,如何完美平衡延迟与一致性?
  • 科技中介机构如何优化技术交易流程?
  • 创建型,结构型,行为型设计模式全面比较
  • 双机热备/高可用架构中常见的一个网络问题
  • 春秋云境CVE-2019-13396
  • 堆内存和栈空间对任务创建的影响
  • 深入理解计算机系统:CPU 里面根本没有减法器?揭秘计算机的 0 和 1 是如何计算的
  • 2.Adobe Animate散件、绘制对象、组、元件
  • 2026年除甲醛品牌TOP10揭晓:谁才是真正靠谱的行业首选?
  • 排土场在线监测厂家核心竞争力对比:2026高性价比品牌推荐 - 深度智识库
  • Win10/11系统中检测电池健康的工具有哪些?
  • 【ABAP】ALV 指定单元格染色
  • LeetCode Hot 100——贪心部分
  • spaCy v2.0:自定义流水线组件与扩展属性实战
  • 赋能智慧电厂:一块开发板如何重塑能源安全巡检的底层逻辑
  • 相比高防IP,为什么现在的游戏公司更倾向于选择“湘情盾”?
  • 2026年全国精密传动设备供应商选型测评:行星减速机与中空旋转平台综合指南 - 深度智识库
  • 从标准件到定制化:2026车床刀座选型全流程指南与品牌推荐 - 品牌推荐大师1
  • Linux 基础IO (五)深入理解文件系统
  • 国产化编辑器如何扩展KindEditor的Excel公式导入?
  • 将文本转化为向量化表示
  • ansys apdl 车轨耦合车桥耦合 列车模型:考虑车体、转向架、车轮质量和二系悬挂 钢轨
  • 计算机毕业设计springboot高校学生党员信息管理系统 基于SpringBoot的高校党建信息化管理平台 基于SpringBoot的智慧校园党员服务系统