# 生成式AI:从“识别”到“创作”,AI如何画出毕加索? ## 1. 什么是生成式AI? **传统AI**:识别、分类、预测(这张图是猫,房价是100万) **生成式AI**:创造全新的、逼真的内容(画一只不存在的猫、写一首诗、生成一段音乐) > 🎨 类比: > 识别式AI像一个鉴定师,能看出画是谁的风格。 > 生成式AI像一个画家,能模仿梵高画出一幅新作品。 ## 2. 生成式AI的三次突破 ### 第一阶段:变分自编码器(VAE) - 将输入编码成潜在空间的一个分布,再从这个分布采样解码。 - 生成图像较模糊,但训练稳定。 ### 第二阶段:生成对抗网络(GAN)——两个AI打架 - **生成器**:伪造假图片,企图骗过判别器 - **判别器**:区分真图和假图,给生成器反馈 - 两者对抗博弈,最终生成器能造出以假乱真的图像 > 🥊 经典例子:StyleGAN生成的人脸,你完全分辨不出是AI画的。 ### 第三阶段:扩散模型(DALL-E 2, Stable Diffusion) - **正向过程**:不断给图像加高斯噪声,直到变成纯噪声 - **反向过程**:学习从噪声中一步步去噪,还原出清晰的图像 - 优势:生成质量极高、多样性好、训练稳定 ## 3. 大语言模型(LLM)——生成文字的天才 - GPT-3/4:基于Transformer的解码器,在海量文本上预训练,学会预测下一个词 - 涌现能力:上下文学习、推理、代码生成、角色扮演 - 指令微调+RLHF(人类反馈强化学习)让模型更听话、更有用 > 💬 例子:你输入“写一首关于夏天的五言诗”,GPT-4直接输出高质量诗作。 ## 4