OpenAI 申请 GPT-5 商标,什么时候发布?都会带来哪些新能力?

  • A+
所属分类:关注

chatGPT账号

原文来源:AGI创新实验室

OpenAI 申请 GPT-5 商标,什么时候发布?都会带来哪些新能力?

图片来源:由无界 AI‌ 生成

8 月 1 日消息,OpenAI 已经正式为“GPT-5”提交了商标申请,该商标涵盖了以下内容:

  • 人工生成人类语音和文本的软件
  • 将音频数据文件转换为文本
  • 声音和语音识别
  • 基于机器学习的语言和语音处理

根据 GPT-5 的商标申请文件显示,GPT-5 商标涵盖了 AI 生成语音和文本的功能,还可以将音频文件转换为文本,实现声音和语音识别,并利用机器学习技术进行语言和语音处理。

这可能意味着 GPT-5 将支持语音能力,将为用户带来更先进、更高效的语音和文本处理体验,多模态能力进一步增强。

GPT-5 什么时候到来?

2023 年 3 月发布 GPT-4 时,预计 OpenAI 将在 2023 年 12 月发布下一代模型。Runway 联合创始人 Siqi Chen 此前表示,我被告知 GPT5 计划于今年 12 月完成训练,Openai 预计它能够实现通用人工智能(AGI)。这意味着我们都会激烈争论它是否真正实现了 AGI。

然而,在 4 月份的 MIT 活动中,当被问及 OpenAI 是否正在训练 GPT-5 时,OpenAI 首席执行官 Sam Altman 表示“我们不会,并且一段时间内不会”。而在今年 6 月份的采访中,OpenAI 创始人兼 CEO Sam Altman 在被问及什么推出 GPT-5 时曾表示,我也很好奇,我们没有答案,我们不会很快有 GPT-5,我们必须把安全性作为很重要的一部分。

尽管如此,一些人认为 OpenAI 可能会在 2023 年 10 月之前推出 GPT-4.5,这是 GPT-4 和 GPT-5 之间的中间版本,就像 GPT-3.5 一样。据说 GPT-4.5 最终将带来多模态功能,即分析图像和文本的能力。OpenAI 早在 2023 年 3 月的 GPT-4 开发者直播中就已经宣布并演示了 GPT-4 的多模态功能。现在微软已经在 Bing Chat 中发布了 GPT-4 的多模态功能。看来 GPT-4 的下一个重大更新即将到来。

除此之外,在开始研究 GPT-5 之前,OpenAI 目前在 GPT-4 模型上还有很多工作要做。目前,GPT-4 的推理时间非常长,而且运行成本相当昂贵。GPT-4 API 访问仍然很难通过。此外,OpenAI 最近刚刚开放了对 ChatGPT 插件和代码解释器的访问,这些插件和代码解释器仍处于测试阶段。互联网浏览功能已从 GPT-4 中删除,因为它显示来自付费网站的内容。

虽然 GPT-4 非常强大,但我想 OpenAI 意识到计算效率是可持续运行模型的关键要素之一。添加新的特性和功能,您就可以处理更大的基础设施,同时确保所有检查点都正常启动并可靠运行。因此,大胆猜测一下,如果我们假设政府机构不设置监管障碍,GPT-5 很可能会在 2024 年发布。

预测:GPT-5 特性和功能

减少幻觉

业界热议的是 GPT-5 将实现 AGI(人工智能)。除此之外,GPT-5 应该可以减少推理时间、提高效率、减少幻觉等等。让我们从幻觉开始,这是大多数用户不太相信 AI 模型的关键原因之一。

根据 OpenAI 的数据,在所有九个类别的内部对抗性设计的事实评估中,GPT-4 的得分比 GPT-3.5 高 40%。现在,GPT-4 对不准确和不允许的内容做出响应的可能性降低了 82%。在各个类别的准确度测试中,它非常接近 80% 的分数。这是对抗幻觉的巨大飞跃。

现在,预计 OpenAI 将在 GPT-5 中将幻觉减少到 10% 以下,这对于使 LLM 模型值得信赖来说将是巨大的。

计算效率模型

我们已经知道 GPT-4 的运行成本很高(每 1 K token 0.03 美元),并且推理时间也更长。而较旧的 GPT-3.5-turbo 模型比 GPT-4 便宜 15 倍(每 1 K token 0.002 美元)。根据 SemiAnalysis 最近的一份报告,GPT-4 不是一个密集模型,而是基于“专家混合”架构。这意味着 GPT-4 针对不同的任务使用 16 种不同的模型,拥有 1.8 万亿个参数。

有了如此庞大的基础设施,运行和维护 GPT-4 模型的成本就变得非常昂贵。

事实上,很多新的大模型已经开始追求“小而精”,让大模型拥有尽可能少的参数,而不是更多。

在最近对 Google PaLM 2 模型的解释中,PaLM 2 参数相当小,但性能却很快。

多感官 AI 模型

虽然 GPT-4 已被宣布为多模态 AI 模型,但它仅处理两种类型的数据,即图像和文本。借助 GPT-5,OpenAI 可能会在实现真正的多模态方面迈出一大步。它还可以处理文本、音频、图像、视频、深度数据和温度。它将能够将来自不同模式的数据流互连起来以创建嵌入空间。

长期记忆

随着 GPT-4 的发布,OpenAI 带来了 32 K token 的最大上下文长度,每 1 K token 的成本为 0.06 美元。我们在几个月内迅速看到了从标准 4 K token 到 32 K 的转变。最近,Anthropic 将其 Claude AI 聊天机器人的上下文窗口从 9 K token 增加到了 100 K token。预计 GPT-5 可能会通过更大的上下文长度带来长期记忆支持。

这有助于让人工智能角色和朋友记住你的角色和记忆,并且可以持续多年。除此之外,您还可以在单个上下文窗口中加载书籍和文本文档库。由于长期记忆的支持,可能会出现各种新的人工智能应用,而 GPT-5 可以使这成为可能。

你认为 GPT-5 什么时候发布,会带来哪些颠覆性创新?

参考资料:

免责声明

发文时比特币价格:$31249

当前比特币价格:[crypto coins=”BTC” type=”text” show=”price”]

当前比特币涨幅:[crypto coins=”BTC” type=”text” show=”percent”]

免责声明:

本文不代表路远网立场,且不构成投资建议,请谨慎对待。用户由此造成的损失由用户自行承担,与路远网没有任何关系;

路远网不对网站所发布内容的准确性,真实性等任何方面做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,路远网对项目的真实性,准确性等任何方面均不做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,路远网不对其构成任何投资建议,用户由此造成的损失由用户自行承担,与路远网没有任何关系;

路远区块链研究院声明:路远区块链研究院内容由路远网发布,部分来源于互联网和行业分析师投稿收录,内容为路远区块链研究院加盟专职分析师独立观点,不代表路远网立场。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的电报
  • 这是我的电报扫一扫
  • weinxin
chatGPT账号
路远

发表评论

您必须登录才能发表评论!