OpenAI ChatGPT 不同模型详解以及如何选择
概述
ChatGPT 具有不同功能和价格点的多种模型提供支持。新手面对众多模型选项可能会不知道各模型之间的区别以及如何选择。 本篇文章将介绍 gpt-3.5-turbo、gpt-4、gpt-4-0613、gpt-4-turbo-preview、gpt-4-32k、GPT-4o、GPT-4o mini、o1 & 01-mini有什么区别。
旗舰型号
GPT-4o
- 多功能、高智能旗舰型号
- 文本和图像输入、文本输出
- 128k 上下文长度
- 更智能的模型,更高的每个代币价格
GPT-4o mini
- 快速、经济实惠的小型型号,适用于专注任务
- 文本和图像输入、文本输出
- 128k 上下文长度
- 更快的模型,更低的每个代币价格
o1 & 01-mini
- 擅长复杂、多步骤任务的推理模型
- 文本和图像输入、文本输出
- 128k 上下文长度
- 使用其他标记进行推理
chatgpt-4o-latest 指向其各自的最新模型版本。
GPT-4o
GPT-4o(“o” 代表“omni”)是我们最先进的模型。它是多模式的(接受文本或图像输入并输出文本),具有与 GPT-4 Turbo 相同的高智能,但效率更高——它生成文本的速度提高了 2 倍,成本降低了 50%。此外,GPT-4o 在 OpenAI 所有模型中,对非英语语言的视觉和性能都最好。GPT-4o 在 OpenAI API 中可供付费客户使用。
GPT-4o 模型的知识截止时间是 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌数 |
---|---|---|
gpt-4o (gpt-4o-2024-08-06) | 128,000 tokens | 16,384 tokens |
gpt-4o-2024-11-20 | 128,000 tokens | 16,384 tokens |
gpt-4o-2024-08-06 | 128,000 tokens | 16,384 tokens |
gpt-4o-2024-05-13 | 128,000 tokens | 4,096 tokens |
chatgpt-4o-latest (GPT-4o used in ChatGPT) | 128,000 tokens | 16,384 tokens |
GPT-4o mini
GPT-4o mini(“o”代表“omni”)是一种快速、经济实惠的小型模型,适用于专注任务。它接受文本和图像输入,并生成文本输出(包括结构化输出)。它非常适合微调,并且来自 GPT-4o 等较大模型的模型输出可以提炼为 GPT-4o-mini,以更低的成本和延迟产生类似的结果。
GPT-4o-mini 模型的知识截止时间是 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌数 |
---|---|---|
gpt-4o-mini(gpt-4o-mini-2024-07-18) | 128,000 tokens | 16,384 tokens |
gpt-4o-mini-2024-07-18 | 128,000 tokens | 16,384 tokens |
01 & O1-Mini
o1 系列模型通过强化学习进行训练,以执行复杂的推理。o1 模型在回答之前会思考,在回应用户之前会产生一个漫长的内部思维链。
目前有两种型号可供选择:
- o1:旨在解决跨领域的难题的推理模型
- o1-Mini:用于专业任务的快速且经济实惠的推理模型
最新的 o1 模型支持文本和图像输入,并生成文本输出(包括结构化输出)。o1-mini 目前仅支持文本输入和输出。
o1 和 o1-mini 模型的知识截止时间是 2023 年 10 月。
模型 | 上下文窗口 | 最大输出令牌数 |
---|---|---|
o1(o1-2024-12-17) | 200,000 tokens | 100,000 tokens |
o1-2024-12-17 | 200,000 tokens | 100,000 tokens |
o1-mini(o1-mini-2024-09-12) | 128,000 tokens | 65,536 tokens |
o1-mini-2024-09-12 | 128,000 tokens | 65,536 tokens |
o1-preview(o1-preview-2024-09-12) | 128,000 tokens | 32,768 tokens |
o1-preview-2024-09-12 | 128,000 tokens | 32,768 tokens |
GPT-4(GPT-4 Turbo) 与 GPT-3.5 Turbo
模型 | 描述 |
---|---|
GPT-4 and GPT-4 Turbo | 在 GPT-3.5 基础上大版本更新的模型,可理解并生成自然语言或代码 |
GPT-3.5 Turbo | 在 GPT-3.5 基础上改进的模型,可理解并生成自然语言或代码 |
GPT-4 GPT-4 Turbo
GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比 OpenAI 以前的任何模型更准确地解决难题。GPT-4 可在 OpenAI API 中向付费客户提供。与此类似gpt-3.5-turbo,GPT-4 针对聊天进行了优化,但也适用于使用聊天完成 API 的传统完成任务。
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
gpt-4-0125-preview | New GPT-4 Turbo 最新的 GPT-4 模型旨在减少模型未完成任务的“懒惰”情况。最多返回 4,096 个输出标记 | 128,000 tokens | 截至 2023 年 12 月 |
gpt-4-turbo-preview | 目前指向 gpt-4-0125-preview | 128,000 tokens | 截至 2023 年 12 月 |
gpt-4-1106-preview | GPT-4 Turbo 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。这是预览模型。 | 128,000 tokens | 截至 2023 年 4 月 |
gpt-4-vision-preview | 除了所有其他 GPT-4 Turbo 功能之外,GPT-4 还具有理解图像的能力。目前指向gpt-4-1106-vision-preview | 128,000 tokens | 截至 2023 年 4 月 |
gpt-4-1106-vision-preview | 除了所有其他 GPT-4 Turbo 功能之外,GPT-4 还具有理解图像的能力。最多返回 4,096 个输出标记。这是预览模型版本。 | 128,000 tokens | 截至 2023 年 4 月 |
gpt-4 | 目前指向gpt-4-0613 | 8,192 tokens | 截至 2021 年 9 月 |
gpt-4-0613 | 2023 年 6 月 13 日的快照 gpt-4,改进了函数调用支持。 | 8,192 tokens | 截至 2021 年 9 月 |
gpt-4-32k | 目前指向gpt-4-32k-0613。该模型从未广泛推广,取而代之的是 GPT-4 Turbo。 | 32,768 tokens | 截至 2021 年 9 月 |
gpt-4-32k-0613 | 2023 年 6 月 13 日的快照gpt-4-32k,改进了函数调用支持。该模型从未广泛推广,取而代之的是 GPT-4 Turbo。 | 32,768 tokens | 截至 2021 年 9 月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比 OpenAI 之前的任何模型都更有能力。
GPT-4的多语言性能优于之前的大型语言模型,并且截至 2023 年,大多数最先进的系统(通常具有特定于基准的训练或手工工程)。在 MMLU 基准(涵盖 57 个科目的英语多项选择题套件)上,GPT-4 不仅在英语方面远远优于现有模型,而且在其他语言方面也表现出了强劲的表现。
GPT-3.5 Turbo
GPT-3.5 Turbo 模型可以理解并生成自然语言或代码,并已针对使用聊天完成 API 的聊天进行了优化,但也适用于非聊天任务。
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
gpt-3.5-turbo-0125 | New Updated GPT 3.5 Turbo 最新的 GPT-3.5 Turbo 模型在响应请求的格式时具有更高的准确性,并修复了导致非英语语言函数调用的文本编码问题的错误。最多返回 4,096 个输出标记 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo | 目前指向gpt-3.5-turbo-0125 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-1106 | GPT-3.5 Turbo 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-instruct | 与 GPT-3 时代型号类似的功能。与旧版完成端点兼容,但不与聊天完全兼容 | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-16k | 即将废弃 目前指向gpt-3.5-turbo-16k-0613 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-0613 | 即将废弃2023 年 6 月 13 日的快照。gpt-3.5-turbo将于2024 年 6 月 13 日弃用 | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-16k-0613 | 即将废弃 2023 年 6 月 13 日的快照。gpt-3.5-16k-turbo将于2024 年 6 月 13 日弃用 | 16,385 tokens | 截至 2021 年 9 月 |
规则
模型命名规则,以 gpt-4-0125-preview
为例 gpt-4
代表这是第四代GPT模型,preview
意味着这是一个预览版。数字 0125
是一个内部版本号 (发布日期的标识) 用于区分不同的迭代或更新。
turbo
代表改进版本vision
代表视觉,允许输入图片16k
32k
通常指的是模型可以处理的最大令牌数(token count)
目前最新最强大的就是 o1-preview
。