Llama-2-7b
热度★ 4,505
组织meta-llama
来源Hugging Face
Llama-2-7b 是由 Meta 公司推出的第二代大型语言模型,属于 Llama 系列中的 70 亿参数版本。该项目定位为面向研究者和开发者的开源文本生成模型,旨在提供高效、可部署的自然语言处理基础能力。 核心能力方面,该模型支持单轮和多轮对话、文本补全、摘要生成、问答等多种文本生成任务。它基于 Transformer 架构,采用自回归生成方式,能够处理最长 4096 个 token 的输入序列。 技术亮点包括:采用分组查询注意力机制(GQA)以提升推理效率,使用监督微调(SFT)和基于人类反馈的强化学习(RLHF)进行对齐训练,从而减少有害输出并提高有用性。模型在多个基准测试中表现优于前代 Llama 1 同等规模版本,尤其在推理、代码生成和事实性问答方面有显著改进。 参数与规模方面,Llama-2-7b 拥有约 70 亿参数,训练数据来自公开网络文本,总量约 2 万亿 token。模型权重以 FP16 格式发布,支持 PyTorch 框架,可通过 Hugging Face Transformers 库直接加载使用。 适用场景包括:学术研究中的语言模型基准测试、企业级对话系统原型开发、内容生成辅助工具、以及需要本地部署的隐私敏感型应用。由于模型相对轻量,可在单张消费级 GPU(如 RTX 3090)上进行推理和微调。该模型采用 Llama 2 社区许可协议,允许商业使用,但需遵守特定使用条款。
本档案由千智坊基于公开信息整理,访问项目原文:
