Meta 发布全新大型语言模型 LLaMA

发表评论
38 views

A+

2 月 27 日消息，Facebook 母公司 Meta 近日发布全新人工智能大型语言模型 LLaMA。LLaMA 模型由 Meta 的 FAIR 团队开发，旨在帮助研究人员和工程师探索人工智能应用和相关功能，在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。

LLaMA 模型接受了 20 种语言训练，包括拉丁语和西里尔字母语言，所需的计算能力远低于之前推出的大模型。另根据 Meta 官网发布的论文，LLaMA 目前包含 70 亿、130 亿、330 亿和 650 亿这 4 种参数规模的模型。其中，参数规模最小的 LLaMA 7 B 也经过了超 1 万亿个 tokens 的训练。Meta 表示，在大多数基准测试中，参数仅为十分之一的 LLaMA-13 B 的性能优于 OpenAI 推出的 GPT3 (175 B)，也即支持 ChatGPT 的 GPT3.5 的前身。LLaMA-65 B 也可与业内领先的 Chinchilla-70 B 和 PaLM-540 B 竞争。

Meta 发言人表示，LLaMA 目前尚未被应用在 Meta 的任何产品之中。Meta 计划将这项技术优先开放给 AI 研究人员。

免责声明

发文时比特币价格：$23249

当前比特币价格：[crypto coins=”BTC” type=”text” show=”price”]

当前比特币涨幅：[crypto coins=”BTC” type=”text” show=”percent”]

免责声明：

本文不代表路远网立场，且不构成投资建议，请谨慎对待。用户由此造成的损失由用户自行承担，与路远网没有任何关系；

路远网不对网站所发布内容的准确性，真实性等任何方面做任何形式的承诺和保障；

网站内所有涉及到的区块链（衍生）项目，路远网对项目的真实性，准确性等任何方面均不做任何形式的承诺和保障；

网站内所有涉及到的区块链（衍生）项目，路远网不对其构成任何投资建议，用户由此造成的损失由用户自行承担，与路远网没有任何关系；

路远区块链研究院声明：路远区块链研究院内容由路远网发布，部分来源于互联网和行业分析师投稿收录，内容为路远区块链研究院加盟专职分析师独立观点，不代表路远网立场。