当前位置: 首页 > news >正文

Llama:Meta 开源大语言模型,近 6 万 Star

文章目录

  • Llama:Meta 开源大语言模型,近 6 万 Star

Llama:Meta 开源大语言模型,近 6 万 Star

Meta 的开源大语言模型 Llama,在 GitHub 上拿到了 59,453 个 Star。

Llama 是 Meta 发布的开源大语言模型,提供 7B、13B、70B 三种参数规模,包含预训练和微调两个版本。模型权重和推理代码完全公开,研究者和企业都可以直接使用。

这个仓库目前已标记为废弃。Meta 在 Llama 3.1 发布时将项目拆分为多个独立仓库,分别负责模型本体、安全工具、推理微调工具链、智能体系统和社区示例。

模型获取

到 Meta 官网提交申请并同意许可协议后,会收到包含下载链接的邮件。链接有效期 24 小时,配合仓库中的 download.sh 脚本即可拉取模型权重和 tokenizer。

Hugging Face 上也提供了下载渠道。在模型卡片页面确认许可后,大约一小时内可以访问同版本的全部模型。

快速上手

本地运行需要 PyTorch 和 CUDA 环境。克隆仓库后执行 pip install -e . 安装依赖,再用 torchrun 启动推理:

torchrun --nproc_per_node 1 example_chat_completion.py \ --ckpt_dir llama-2-7b-chat/ \ --tokenizer_path tokenizer.model \ --max_seq_len 512 --max_batch_size 6

不同规模的模型需要不同的并行度。7B 用 1 张卡,13B 用 2 张,70B 需要 8 张。序列长度最长支持 4096 token,缓存空间根据 max_seq_len 和 max_batch_size 预分配。

预训练和微调

预训练模型没有针对对话做过调优,需要通过 prompt 引导自然续写。微调后的 chat 模型使用特定的格式化标签,包括 INST、SYS 标签以及 BOS 和 EOS token,仓库中有对应示例代码。

许可证

Llama 的模型和权重对研究者和商业实体均可使用,附带 LICENSE 文件和使用政策。Meta 还提供了负责任使用指南,帮助开发者应对模型可能带来的风险。

用政策。Meta 还提供了负责任使用指南,帮助开发者应对模型可能带来的风险。

http://www.jsqmd.com/news/1127092/

相关文章:

  • 如何快速上手SoftBR:5分钟完成软件分支跟踪环境搭建
  • 2026年:机器流量首超人类,互联网从“人类主场”变“人机丛林”?
  • 百考通AI一次成型贴合你的研究方向的开题报告
  • 工程企业erp系统如何落地,打通项目资金成本人力一体化管控
  • RePKG完整指南:5步掌握Wallpaper Engine资源提取与转换
  • 射阳冰箱维修上门服务流程
  • OWASP AISVS 1.0 解读:为AI系统量身打造的安全验证标准
  • 集人脸、刷卡、掌静脉、密码多模态于一体的嵌入式智能门禁梯控
  • AI掘金头条新闻系统 (Toutiao News)-缓存新闻列表
  • 如何在5分钟内通过手机号码实现精准地理位置定位的完整指南
  • 公司与美卫生基金会合作,为美制定电子产品可维修性自愿评分标准!
  • 3个关键步骤让Iwara视频下载变得前所未有的简单
  • 森亿智能赴港IPO:拿下800家医院,沙特开AI诊所,三年亏超7亿引资本青睐
  • 闪电云算力GPU直通技术:大模型训练性能零损耗解析
  • KPL-gmssl安装教程:5分钟在华为鲲鹏服务器上搭建加密环境
  • AdaRound 训练后量化实战:ResNet50 4-bit 权重量化,精度损失 <1%
  • 如何在Blender中完美导入导出3MF格式:3D打印工作流终极指南
  • 百考通AI开题报告给你写清楚“问题意识”“技术路线”“创新点”
  • 模组管理革命:Scarab如何让空洞骑士的模组世界不再破碎
  • 如何快速上手openeuler/security-facility?新手必备的安全工具配置教程
  • OpenEuler kata_integration 核心组件详解:Runtime、Proxy、Shim、Agent四大组件构建秘籍
  • 防静电皮革哪个靠谱
  • ## 新朝野
  • 中东液体粉末运输物流公司全解析
  • 直方图均衡化 5 大应用场景实战:医学影像、遥感与低光照图像增强
  • SillyTavern 1.18.0:5步构建企业级AI对话前端的完整技术指南
  • 硅基流动递表港交所冲击“Token工厂第一股”:高估值背后是AI水电煤还是资本泡沫?
  • 唤起 GBA 回忆!Key Boy Advance 键盘 2026 年四季度发货,起售价约 282 美元
  • 10分钟上手uos-tc-exporter:从安装到获取TC指标的快速教程
  • SoftBR配置文件转换全攻略:从perf_data.br到perf.data的完整流程