当前位置: 首页 > news >正文

YAYI 2学术引用指南:论文撰写规范与最佳实践

YAYI 2学术引用指南:论文撰写规范与最佳实践

【免费下载链接】YAYI2YAYI 2 是中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。(Repo for YaYi 2 Chinese LLMs)项目地址: https://gitcode.com/gh_mirrors/ya/YAYI2

YAYI 2是中科闻歌研发的新一代开源大语言模型,采用超过2万亿Tokens的高质量多语言语料预训练,为学术研究提供强大支持。本文将详细介绍如何在学术论文中正确引用YAYI 2模型,确保引用格式规范、信息完整,帮助研究人员高效完成论文撰写。

为什么规范引用YAYI 2至关重要?

在学术研究中,正确引用模型不仅是对原作者知识产权的尊重,也是确保研究可追溯性和可重复性的基础。YAYI 2作为支持多语言处理的开源大语言模型,其41.5%的中文语料占比和40.4%的英文语料占比(如图1所示)使其在跨语言研究中具有独特优势。规范引用能帮助读者准确获取模型信息,促进相关领域的进一步研究。


图1:YAYI 2预训练语料的语言分布比例,中文和英文占比合计超过80%,支持多语言学术研究

标准引用格式与示例

1. BibTeX引用格式(推荐)

在LaTeX论文中,推荐使用以下BibTeX条目引用YAYI 2模型:

@article{YAYI 2, author = {Yin Luo, Qingchao Kong, Nan Xu, et.al.}, title = {YAYI 2: Multilingual Open Source Large Language Models}, journal = {arXiv preprint arXiv:2312.14862}, url = {https://arxiv.org/abs/2312.14862}, year = {2023} }

2. APA格式

对于采用APA格式的论文,引用格式如下:
Luo, Y., Kong, Q., Xu, N., et al. (2023). YAYI 2: Multilingual Open Source Large Language Models. arXiv preprint arXiv:2312.14862. https://arxiv.org/abs/2312.14862

3. GB/T 7714-2015格式(中文论文)

罗荫, 孔庆超, 徐楠, 等. YAYI 2: 多语言开源大语言模型[J/OL]. arXiv preprint arXiv:2312.14862, 2023. https://arxiv.org/abs/2312.14862.

引用时需包含的核心信息

为确保引用的完整性,需包含以下关键信息:

  • 论文标题:YAYI 2: Multilingual Open Source Large Language Models
  • 作者:Yin Luo, Qingchao Kong, Nan Xu等(et.al.)
  • 发表平台:arXiv preprint
  • 论文编号:arXiv:2312.14862
  • 发布年份:2023
  • 访问链接:https://arxiv.org/abs/2312.14862

不同研究场景的引用建议

1. 模型性能对比研究

当将YAYI 2与其他模型进行性能对比时,建议同时引用技术报告和官方代码库:
"YAYI 2在CMMLU数据集上达到84.0%的准确率,显著优于同规模模型(Luo et al., 2023)。实验代码可参考training/trainer_yayi2.py实现细节。"

2. 数据或训练方法研究

YAYI 2的预训练数据包含49.6%的互联网数据和31.4%的领域特定数据(如图2所示),相关研究可引用:
"本研究采用与YAYI 2类似的数据分布策略,其中领域数据占比参考了其31.4%的配置(Luo et al., 2023)。"


图2:YAYI 2预训练数据的来源分布,涵盖互联网数据、领域特定数据和通用精选数据

常见引用错误与避免方法

  1. 遗漏论文编号:需确保包含arXiv:2312.14862,便于精准定位文献。
  2. 作者姓名拼写错误:注意作者姓名的正确拼写(如Yin Luo而非Ying Luo)。
  3. 未标注预印本状态:需注明"arXiv preprint"以区分正式发表论文。

引用检查清单 ✅

为确保引用无误,建议使用以下检查清单:

  • 包含完整的作者列表(et.al.可用于多作者情况)
  • 标题、期刊/平台、年份准确无误
  • 论文编号和URL正确
  • 格式符合目标期刊要求(BibTeX/APA/GB/T 7714等)

总结

正确引用YAYI 2不仅是学术规范的要求,也是推动大语言模型研究透明化的重要一步。通过本文提供的格式示例和最佳实践,研究人员可轻松完成规范引用,同时充分利用YAYI 2的多语言优势开展创新研究。如需进一步了解模型细节,可参考技术报告或访问项目代码库获取训练脚本(如scripts/start.sh)。

祝各位学者研究顺利,成果丰硕! 📚✨

【免费下载链接】YAYI2YAYI 2 是中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。(Repo for YaYi 2 Chinese LLMs)项目地址: https://gitcode.com/gh_mirrors/ya/YAYI2

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/523995/

相关文章:

  • 马尔可夫预测实战:用Python模拟药店市场份额变化(附完整代码)
  • Python实战:用Scikit-Learn和Matplotlib轻松绘制TSNE降维图(附完整代码)
  • nix-starter-configs与home-manager集成:统一管理你的开发环境
  • 双机H100+ROCE网络部署DeepseekSeek-R1-671B实战指南
  • Windows下OpenClaw安装指南:Qwen3-32B模型联调实战
  • 生产环境部署:rate-limiter-flexible的最佳配置与监控方案
  • tao-8k Embedding模型实战教程:本地化部署+WebUI交互+API集成
  • HALCON/C++实战:从图像处理到区域分析的完整流程
  • 保姆级教程:用CST低频求解器搞定导线磁场仿真(从建模到结果分析)
  • bug.n多显示器支持完全指南:跨屏工作流优化方案
  • GPIO模式选择指南:从开漏到PWM,手把手教你避开硬件设计中的那些坑
  • git-open:如何在5分钟内掌握这个高效的Git仓库快速访问神器
  • Llama-3.2V-11B-cot参数详解:11B模型显存占用分析与INT4量化部署指南
  • WuliArt Qwen-Image Turbo高清输出:1024×1024下可安全裁切至9:16/1:1/16:9多比例
  • Whisper Streaming API使用大全:10个实用代码示例
  • Odyssey配置完全手册:从基础到高级的详细参数解析
  • Cursor AI 编程提效实战(附 50 个 Prompt 模板)
  • 别再手动调参了!用sklearn的GridSearchCV搞定随机森林回归,附空气质量预测实战代码
  • WordPress网站开启Cloudflare CDN后出现无限重定向?3步快速排查与修复
  • 嵌入式Linux实战:用wait_event和wake_up实现按键驱动(附完整代码)
  • yz-bijini-cosplay生产环境:支持64倍数分辨率,适配抖音/小红书/B站封面
  • actionlint 安全检查:快速检测脚本注入和硬编码凭据的完整指南
  • 杰理之在恢复音频播放的时候,会出现明显延时出声音【篇】
  • WarcraftHelper:魔兽争霸3现代适配终极解决方案
  • MCP(Model Context Protocol)深度解析:让 AI Agent 真正走向标准化的“USB-C 接口“
  • World Action Model 与 VLA Model对比
  • 备考2026初中级职称选哪个课程更容易通过 - 医考机构品牌测评专家
  • 【Kylin】V10虚拟机界面“捉迷藏”?手把手教你用命令行解锁VMware最佳分辨率
  • 固件安全左移落地卡点突破:C语言检测工具必须支持的6类编译器内建函数(__builtin_arm_rbit等)识别能力深度评测(含GCC/Clang/ICC全版本兼容性清单)
  • 医考备考不用挑!阿虎医考APP,一站式搞定全程备考 - 医考机构品牌测评专家