当前位置: 首页 > news >正文

阶段一AI基础认知

本阶段的目标是:理解大模型的核心概念、能力边界、常见应用模式,以及成本评估方法。你不需要写代码,但需要建立起对AI应用的整体认知框架。


📌 阶段目标

  • 掌握大模型(LLM)的基本原理(非数学层面)
  • 理解 Token、上下文窗口、温度、top_p 等核心术语
  • 区分生成式AI与判别式AI
  • 了解主流模型及其特点
  • 熟悉AI应用的几种典型模式(补全、对话、RAG、Agent)
  • 学会评估模型选型(速度、质量、成本)

一、大模型(LLM)是什么?

大语言模型(Large Language Model, LLM)是一种基于海量文本数据训练的神经网络模型,能够理解和生成自然语言。它的本质是一个“文字接龙”程序:给定上文,预测下文。

  • 训练:通过阅读互联网、书籍、代码等海量文本,学习语言规律、事实知识、逻辑推理。
  • 推理:根据你的输入(Prompt),逐词生成回答。

通俗理解:你向一位博览群书的专家提问,他根据自己读过的所有内容,组织语言回答你。


二、核心术语

1. Token

Token 是模型处理文本的最小单位。它不是单词,也不是字符,而是“单词的一部分”

  • 英文hello→ 1 token;unhappinessun+happiness(2 token)
  • 中文:一个汉字 ≈ 1.5–2 token。例如“你好”约 3 token。
  • 代码:空格、缩进、括号都算 token。

为什么要关心 Token?

  • 模型有上下文窗口限制(一次能处理的 Token 总数)
  • 按 Token 计费(输入/输出价格不同)
  • 长对话、长文档会快速消耗 Token

2. 上下文窗口(Context Window)

模型一次能接收的最大 Token 数(包括你的输入 + 模型的输出)。

  • 早期模型:4K–8K Token
  • 主流模型:32K–128K
  • 超长文本模型:1M Token(如 Claude 200K,千问 Long)

影响:窗口越大,模型能“记住”的对话历史、参考的文档就越长。

3. 温度(Temperature)

控制模型回答的随机性

  • 0:最保守,每次都选概率最高的词,回答确定性强。
  • 1:随机性高,更有创意,但可能跑题。
  • 推荐:一般任务用 0.7,需要稳定输出时用 0.1–0.3。

4. Top_p

另一种控制随机性的方式(核采样)。取概率总和达到 p 的最小词集合,从中随机选。

  • 常用组合:temperature=0.7, top_p=0.9

5. 生成式 AI vs 判别式 AI

类型功能举例
生成式 AI创造新内容(文本、图像、代码)ChatGPT、Midjourney、Stable Diffusion
判别式 AI分类、判断、识别垃圾邮件分类、人脸识别

大模型属于生成式 AI,但也能通过提示完成分类任务。


三、主流模型速览

公司模型系列特点适用场景
OpenAIGPT-4o, GPT-5综合能力强,多模态,全球领先通用对话、复杂推理
AnthropicClaude 3.5/4安全性高,编程能力强,长上下文编程、长文档分析
阿里云通义千问(Qwen)中文优化好,性价比高,开源友好中文场景、企业应用
智谱AIGLM 系列开源生态好,代码能力突出编程、科研
DeepSeekDeepSeek-V3开源,成本极低高性价比场景
MetaLlama 系列开源,社区活跃本地部署、微调

选择建议

  • 通用中文:通义千问
  • 编程:Claude、GLM、DeepSeek
  • 国际业务:GPT、Claude

四、AI 应用的四种典型模式

1. 文本补全 / 对话

最基础的形式。用户输入一段文字,模型续写或回答问题。
示例

用户:用Java写一个单例模式。 模型:public class Singleton { ... }

2. 函数调用(Function Calling)

模型输出结构化数据,供程序调用外部工具(API、数据库等)。
示例:用户问“北京今天天气”,模型输出{ "tool": "get_weather", "city": "北京" },程序据此调用天气 API。

3. RAG(检索增强生成)

让模型在生成答案时参考外部知识库
流程:

  • 用户提问 → 检索相关文档片段 → 将片段 + 问题一起送给模型 → 模型基于事实回答。
    好处:避免幻觉,答案可溯源,适合企业内部知识问答。

4. Agent(智能体)

模型自主规划、调用工具、循环执行,完成复杂任务。
示例:让AI订机票,它自己会搜索航班、比价、填写表单,遇到问题会自我修正。


五、成本与评估

1. Token 计价

  • 输入(用户发送的内容)和输出(模型生成的回答)分开计费,通常输出价格是输入的 2–5 倍。
  • 示例(以阿里云 qwen3-30b 为例):
    • 输入:¥0.75 / 百万 Token
    • 输出:¥3 / 百万 Token

一次对话成本估算
假设你输入 1000 Token(约 500 汉字 + 上下文),模型输出 500 Token,则费用约为:
(1000×0.75 + 500×3) / 1,000,000 ≈ ¥0.00225,不到 1 分钱。

2. 模型选型三要素

  • 速度:实时聊天需要低延迟(<2秒),批量任务可容忍慢速。
  • 质量:简单任务用轻量模型,复杂推理、代码生成用旗舰模型。
  • 成本:权衡质量与价格,不一定总用最强模型。

策略:对 80% 的普通对话用性价比模型(如 qwen3-30b),对 20% 的复杂任务切换至高阶模型(如 qwen-max)。

3. 免费额度

几乎所有云厂商都提供新人免费额度(例如阿里云百炼主流模型各 100 万 Token 免费,90 天有效),足够你完成阶段一、二的实践。


六、实践任务(无需写代码)

  1. 注册一个云平台账号(推荐阿里云百炼)
    • 完成实名认证
    • 进入控制台,找到“模型广场”或“在线体验”
    • 尝试与不同模型对话(如 qwen-plus、qwen-max),感受差异
  2. 理解 Token 消耗
    • 在模型体验页面,输入一段文本,查看系统显示的 Token 数量
    • 对比中英文、代码片段的 Token 消耗差异
  3. 体验不同参数
    • 找支持调整温度、top_p 的界面(如百炼的“模型体验”),将温度调至 0 和 1 分别提问,观察回答变化
  4. 了解 RAG 概念
    • 阅读阿里云《RAG 技术解析》或相关科普文章
    • 设想一个你工作中可以用 RAG 解决的场景(如内部文档问答)

七、推荐学习资源

类型资源
视频吴恩达《生成式 AI 入门》系列(B站有翻译)
文章OpenAI 官方《GPT 最佳实践》英文版 中文版
文档阿里云百炼文档《模型介绍》《计量说明》
在线体验阿里云百炼 Playground
术语速查大模型术语表(Google “LLM glossary”)

http://www.jsqmd.com/news/565630/

相关文章:

  • 如何在AMD 780M APU上实现2-3倍AI性能提升?ROCmLibs优化库完全指南
  • 集团企业发票管理难?一招实现全流程集中管控
  • 大家公认的好用卫生巾品牌有哪些?2026口碑实测:奈丝公主凭细节设计圈粉 - 华Sir1
  • 高效智能转换方案:B站缓存视频一键处理实战指南
  • 2026年 包装袋厂家推荐排行榜:医药医疗包装袋、异形袋、真空袋、吸嘴袋等塑料包装袋源头企业实力解析与选购指南 - 品牌企业推荐师(官方)
  • P14464 海底列車(collapse)
  • 2026年市场口碑好的小龙虾筛选设备厂家推荐,小龙虾分选机/小龙虾筛选机/小龙虾筛选设备,小龙虾筛选设备供应商哪个好 - 品牌推荐师
  • 超越U-Net:拆解Cellpose如何用‘图像风格’和残差块实现通用分割
  • 模拟面试回答第十七问:垃圾判定算法
  • 2026商务全自动咖啡机选购指南:高效省心选机攻略 - 品牌2026
  • 3步掌握AI模型训练:让新手也能玩转个性化Stable Diffusion模型
  • 称重分拣装箱设备PLC数据采集解决方案
  • 数据字典+JWT+权限控制(RBAC)
  • 2026年高速投包机厂家推荐:广州辐艾达智能设备,碗面/杯面/泡面等全系机型供应 - 品牌推荐官
  • 说说深圳摩天智能装备创新能力如何,与对手相比谁更靠谱? - 工业设备
  • 清远鸡常见问题解答:腌制烹饪全攻略 - 速递信息
  • Windows系统卡顿?这款工具让老电脑焕发新生
  • 从集创赛实战复盘:CMOS差分对匹配、电流镜精度那些坑,你的仿真模型考虑到了吗?
  • 了解一下摩天智能装备,费用和口碑情况到底如何? - 工业品网
  • Phi-4-mini-reasoning企业实操:将推理能力嵌入CRM系统自动分析客户诉求
  • 广东省高级会计师评审辅导知名品牌
  • 2026年好用智能客服全面讲解,简单便捷适配各类场景的客服系统 - 品牌2026
  • 网络通信技术基础知识,网络通信技术数据包介绍
  • 手持式VS桌面式,2026RoHS检测仪该如何选型? - 品牌推荐大师
  • Mirage Flow 与 Claude 模型对比评测:开源与闭源的选择之道
  • WireMock完整指南:5个核心场景让API测试变得简单高效
  • Marp CLI元数据管理:如何优化SEO和社交媒体分享
  • 2026年机场/餐厅用带过滤功能商用开水器厂家推荐:多层隔热保温开水器/立式商用开水器/双龙头开水器/24小时不间断供水开水器专业供应 - 品牌推荐官
  • 2026湖南企拓GEO推广联系方式怎么选?在湖南做推广外包系统认准这个官方电话! - 精选优质企业推荐榜
  • 强化学习实战指南:在线与离线学习的核心差异与应用场景