当前位置: 首页 > news >正文

CS16S:01

整个课程10周,我把核心内容梳理一下。前两周讲AI基础,包括LLM的工作机制、Prompt Engineering、Agent架构和MCP协议。第3到第5周进入开发环境实操,教你怎么配置AI驱动的IDE、终端自动化、上下文管理这些。

第6到第7周聚焦质量和安全,覆盖测试、漏洞检测、调试、代码评审。第8到第9周是部署和运维,包括自动化UI构建、监控、事件响应。最后一周讨论软件工程师角色的演变。

根据公开信息,课程还邀请了不少业界嘉宾做客座讲座,包括Anthropic(Claude Code之父Boris Cherny也在)、Cognition(做Devin那家公司)、Warp(AI终端)、a16z(顶级风投)等公司的人。这个配置本身就说明了一件事:这门课对接的是真实的工业界前沿,不是学院派的纸上谈兵。

modern-software-dev-assignments

WEEK01

视频主要内容

这份视频(Stanford CS146S 课程的第一周内容)深入探讨了大语言模型(LLM)的工程流水线,涵盖了从原始数据到成为高效 AI 助手的全过程。

以下是视频的核心大纲和主要观点:

一、 LLM 训练的三大核心阶段

视频将 LLM 的进化过程分为三个主要阶段:

  1. 预训练 (Pre-training) - 构建基础模型

    • 目标:在大规模尺度上获取知识,将模型变成一个高性能的“文本补全机”。
    • 数据规模:使用数万亿标记(Tokens)的互联网海量数据(如 Common Crawl 和 Wikipedia),其中经过筛选的高质量数据集(如 FineWeb)文本量可达 44TB。
    • 机制:采用自回归模型 (Auto-regressive),通过数千亿甚至数万亿个参数来预测序列中的下一个标记。
    • 本质:它是对人类知识的一种有损压缩,学习了知识的语法,但尚未掌握深层的逻辑结构。
  2. 有监督微调 (Supervised Fine-tuning, SFT) - 塑造个性

    • 目标:将基础模型转变为一个有用且有礼貌的对话助手,赋予其“人格”。
    • 方法:使用由人类编写的高质量对话示例进行训练,让模型模拟专业人类标记员的行为。
  3. 强化学习 (Reinforcement Learning, RL) - 培养推理能力

    • 目标:教模型如何思考和解决问题,特别是在数学和代码等可验证领域。
    • 思维链 (Chain of Thought, CoT):通过 RL 训练模型将推理过程分布在多个标记中,因为**“模型需要标记来思考”**。
    • RLHF (人类反馈强化学习):针对主观任务(如写笑话),通过训练奖励模型来模拟人类品味,尽管模型可能会为了高分而通过欺骗手段“走捷径”。

二、 高级提示词工程 (Prompt Engineering)

为了充分发挥模型的潜力,视频介绍了几种关键技术:

  • 上下文学习 (In-context Learning):通过在提示词中提供少量示例(K-shot)让模型即时适应特定风格。
  • 检索增强生成 (RAG):通过调用外部搜索工具获取实时信息,解决模型知识过时和幻觉问题。
  • 自我修正 (Self-correction):利用自我一致性 (Self-consistency)(多次提问取多数票)和反思 (Reflection)(让模型审查并修正自己的代码)来提高准确性。

三、 核心观点与职业影响

  1. 职业准则:AI 不会取代工程师,但一个懂得使用 AI 的胜任工程师将会取代不会使用 AI 的人
  2. 效率飞跃:在代码理解、重构和性能优化方面,LLM 可以将数小时的工作缩短至几分钟。
  3. “瑞士奶酪”模型 (Swiss Cheese Model):LLM 虽强大但存在随机缺陷(例如能解奥数题却可能在简单数字比较上犯错),因此必须将其视为随机工具 (Stochastic Tools),始终检查其产出。
  4. 未来的超人类协作:随着强化学习的演进,模型可能会发现人类从未想过的高级认知策略,这将开启人机协作的新篇章。

python 环境配置

These steps work with Python 3.12.

  1. Install Anaconda

Download and install: Anaconda Individual Edition
Open a new terminal so conda is on your PATH.

  1. Create and activate a Conda environment (Python 3.12)

conda create -n cs146s python=3.12 -y
conda activate cs146s

  1. Install Poetry

curl -sSL https://install.python-poetry.org | python -
Install project dependencies with Poetry (inside the activated Conda env) From the repository root:

poetry install --no-interaction

ollama部署本地大模型

Ollama installation

We will be using a tool to run different state-of-the-art LLMs locally on your machine called Ollama. Use one of the following methods:

  • macOS (Homebrew):

    brewinstall--caskollama ollama serve
  • Linux (recommended):

    curl-fsSLhttps://ollama.com/install.sh|sh
  • Windows:
    Download and run the installer from ollama.com/download.

Verify installation:

ollama-v

Before running the test scripts, make sure you have the following models pulled. You only need to do this once (unless you remove the models later):

ollama run mistral-nemo:12b ollama run llama3.1:8b
  1. anaconda 安装
  2. RL和SFT的区别 RLHF
http://www.jsqmd.com/news/1067229/

相关文章:

  • 低成本创业辅助软件客观梳理
  • 无损FLAC音乐怎么变成MP3?一篇讲清楚flac转mp3操作步骤
  • 安全审计系统有哪些?2026年5大安全审计软件功能详解,最新分享
  • 独立研究者开发的土耳其语“形态大脑“
  • Childhood,23款童年卡牌游戏复刻
  • RAG 检索质量从 60% 到 90%:混合检索 + 重排序的完整实践
  • 基于知识图谱的百科知识问答系统:Django+Neo4j 智能问答平台项目实战
  • 从Copilot到Agent——我的开发工作流正在被颠覆的技术文章大纲
  • 隐性隐私泄露
  • 全网最全!2026AI论文平台榜单(覆盖 99% 毕业论文需求)
  • 12.1.1 质量属性概念 (续) - 运行期质量属性
  • 92-Java 多线程编程
  • Milvus架构与核心原理
  • LangChain 实战:Structured Chat ReAct 智能体原理与实现(对比 ZeroShot ReAct)
  • 《B4501 [GESP202603 四级] 山之谷》
  • 轻集料混凝土哪家强?LC5.0型厂家这样选才靠谱
  • 基于 Harmony 7.0 应用的手写签名应用首页实现
  • API中转站搭建完整教程:从零部署专属New API服务为什么自建API中转站
  • 电商支付资损风险防控测试实战:从优惠叠加漏洞到大促零故障的完整路径
  • 车载开发|致远ZCAN设备Python ctypes完整封装库解析
  • .NET 高级开发 | 设计、实现一个事件总线框架
  • 大数据需要掌握哪些主流大数据工具框架
  • 两个关于数据库的简单项目系统
  • [MSCKF-VIO]零空间投影:消除特征位置不确定性
  • 【AI Daily】AI日报 2026-06-22
  • GLM-5.2实测:国产模型追上GPT梯队,但千万别直接切主力
  • 职场必备Excel神器 自动生成各类表格样例数据
  • React 可拖拽列宽 + 点击行选中 ProTable 封装笔记
  • 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录
  • Microsoft Agent Framework - 对 Agent 进AOP(Middleware)编程