OpenAI API 由具有不同功能和价格点的多种模型提供支持。您还可以通过微调,针对您的特定用例对我们的模型进行定制。
模型 | 描述 | GPT-4 Turbo和 GPT-4 | 一组改进 GPT-3.5 的模型,可以理解并生成自然语言或代码 | GPT-3.5Turbo | 一组改进 GPT-3.5 的模型,可以理解并生成自然语言或代码 | 达尔·E | 可以在自然语言提示下生成和编辑图像的模型 | 语音合成 | 一组可以将文本转换为听起来自然的语音的模型 | 耳语 | 可以将音频转换为文本的模型 | 嵌入 | 一组可以将文本转换为数字形式的模型 | 适度 | 可以检测文本是否敏感或不安全的微调模型 | GPT基础 | 一组无需遵循指令即可理解并生成自然语言或代码的模型 | 已弃用 | 已弃用的型号的完整列表以及建议的替代品 |
我们还发布了开源模型,包括Point-E、Whisper、Jukebox和CLIP。
型号持续升级
gpt-4-turbo、gpt-4、 并gpt-3.5-turbo指向各自的最新型号版本。您可以通过发送请求后查看响应对象来验证这一点。响应将包括所使用的特定模型版本(例如gpt-3.5-turbo-0613)。 我们还提供固定模型版本,开发人员可以在引入更新模型后继续使用至少三个月。随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们针对不同用例改进模型。如果您有兴趣,请查看OpenAI Evals存储库。 在我们的弃用页面上了解有关模型弃用的更多信息。
GPT-4 Turbo和 GPT-4
GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。 GPT-4 可在 OpenAI API 中向付费客户提供。与此类似gpt-3.5-turbo,GPT-4 针对聊天进行了优化,但也适用于使用聊天完成 API 的传统完成任务。在我们的文本生成指南中了解如何使用 GPT-4 。
模型 | 描述 | 上下文窗口 | 训练数据 | GPT-4-涡轮 | 新的
带视觉功能的 GPT-4 Turbo
具有视觉功能的最新 GPT-4 Turbo 型号。视觉请求现在可以使用 JSON 模式和函数调用。 目前指向gpt-4-turbo-2024-04-09. | 128,000 个代币 | 截至 2023 年 12 月 | GPT-4-涡轮-2024-04-09 | GPT-4 Turbo 与 Vision 模型。视觉请求现在可以使用 JSON 模式和函数调用。 gpt-4-turbo目前指向这个版本。 | 128,000 个代币 | 截至 2023 年 12 月 | gpt-4-turbo-预览 | GPT-4 Turbo 预览模型。目前指向gpt-4-0125-preview. | 128,000 个代币 | 截至 2023 年 12 月 | gpt-4-0125-预览 | GPT-4 Turbo 预览模型旨在减少模型未完成任务的“懒惰”情况。最多返回 4,096 个输出 标记。了解更多。 | 128,000 个代币 | 截至 2023 年 12 月 | gpt-4-1106-预览 | GPT-4 Turbo 预览模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调 用等。最多返回 4,096 个输出标记。这是预览模型。了解更多。 | 128,000 个代币 | 截至 2023 年 4 月 | gpt-4-视觉预览 | 除了所有其他 GPT-4 Turbo 功能之外,GPT-4 模型还具有理解图像的能力。这是预览 模型,我们建议开发人员立即使用,gpt-4-turbo其中包含视觉功能。目前指向gpt-4- 1106-vision-preview. | 128,000 个代币 | 截至 2023 年 4 月 | gpt-4-1106-视觉预览 | 除了所有其他 GPT-4 Turbo 功能之外,GPT-4 模型还具有理解图像的能力。这是预览 模型,我们建议开发人员立即使用,gpt-4-turbo其中包含视觉功能。最多返回 4,096 个输出标记。了解更多。 | 128,000 个代币 | 截至 2023 年 4 月 | GPT-4 | 目前指向gpt-4-0613.查看型号的不断升级。 | 8,192 个代币 | 截至 2021 年 9 月 | GPT-4-0613 | 2023 年 6 月 13 日的快照gpt-4,改进了函数调用支持。 | 8,192 个代币 | 截至 2021 年 9 月 | gpt-4-32k | 目前指向gpt-4-32k-0613.查看型号的不断升级。该模型从未广泛推广,取而代之的 是 GPT-4 Turbo。 | 32,768 个代币 | 截至 2021 年 9 月 | GPT-4-32K-0613 | 2023 年 6 月 13 日的快照gpt-4-32k,改进了函数调用支持。该模型从未广泛推广, 取而代之的是 GPT-4 Turbo。 | 32,768 个代币 | 截至 2021 年 9 月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都更有能力。
多语言能力
GPT-4 的性能优于之前的大型语言模型,并且截至 2023 年,大多数最先进的系统(通常具有特定于基准的训练或手工工程)。在 MMLU 基准(涵盖 57 个科目的英语多项选择题套件)上,GPT-4 不仅在英语方面远远优于现有模型,而且在其他语言方面也表现出了强劲的表现。
GPT-3.5Turbo
GPT-3.5 Turbo 模型可以理解并生成自然语言或代码,并已针对使用聊天完成 API 的聊天进行了优化,但也适用于非聊天任务。
模型 | 描述 | 上下文窗口 | 训练数据 | GPT-3.5-turbo-0125 | 新的
更新的 GPT 3.5 Turbo
最新的 GPT-3.5 Turbo 模型在响应请求的格式时具有更高的准确性,并修复了导致非英语语言 函数调用的文本编码问题的错误。最多返回 4,096 个输出标记。了解更多。 | 16,385 个代币 | 截至 2021 年 9 月 | GPT-3.5-涡轮 | 目前指向gpt-3.5-turbo-0125. | 16,385 个代币 | 截至 2021 年 9 月 | gpt-3.5-turbo-1106 | GPT-3.5 Turbo 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最 多返回 4,096 个输出标记。了解更多。 | 16,385 个代币 | 截至 2021 年 9 月 | gpt-3.5-turbo-指令 | 与 GPT-3 时代型号类似的功能。与旧版完成端点兼容,但不与聊天完成兼容。 | 4,096 个代币 | 截至 2021 年 9 月 | gpt-3.5-turbo-16k | 遗产
目前指向gpt-3.5-turbo-16k-0613. | 16,385 个代币 | 截至 2021 年 9 月 | GPT-3.5-turbo-0613 | 遗产
gpt-3.5-turbo2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。 | 4,096 个代币 | 截至 2021 年 9 月 | gpt-3.5-turbo-16k-0613 | 遗产
gpt-3.5-16k-turbo2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。 | 16,385 个代币 | 截至 2021 年 9 月 |
Dall·E
DALL·E是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。 DALL·E 3 目前支持根据提示创建具有特定尺寸的新图像的功能。 DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。 DALL·E 3可通过我们的图像 API与DALL·E 2一起使用。您可以通过ChatGPT Plus尝试 DALL·E 3 。
模型 | 描述 | dall-e-3 | 新的
DALL·E 3
2023 年 11 月发布的最新 DALL·E 型号。了解更多。 | dall-e-2 | 之前的 DALL·E 模型于 2022 年 11 月发布。DALL·E 的第二次迭代具有比原始模型更真实、更准确且分 辨率提高 4 倍的图像。 |
语音合成
TTS 是一种人工智能模型,可将文本转换为听起来自然的语音文本。我们提供两种不同的模型变量,tts-1针对实时文本到语音用例进行了优化,并tts-1-hd针对质量进行了优化。这些模型可以与音频 API 中的语音端点一起使用。 [td]模型 | 描述 | tts-1 | 新的
文本转语音 1
最新的文本转语音模型,针对速度进行了优化。 | tts-1-hd | 新的
文本转语音 1 HD
最新的文本转语音模型,针对质量进行了优化。 |
Whisper
Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 和whisper-1模型名称获取。 目前, Whisper 的开源版本和通过我们的 API 提供的版本没有区别。然而,通过我们的 API,我们提供了优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。
Embeddings
Embeddings是文本的数字表示,可用于衡量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。
模型 | 描述 | 输出尺寸 | 文本嵌入 3-large | 新的
Embedding V3 large
适用于英语和非英语任务的最强大的嵌入模型 | 3,072 | 文本嵌入-3-小 | 新的
嵌入 V3 小
与第二代 ada 嵌入模型相比性能有所提高 | 1,536 | 文本嵌入-ada-002 | 最强大的第二代嵌入模型,取代 16 个第一代模型 | 1,536 |
Moderation
审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。您可以在我们的审核指南中了解更多信息。 审核模型接受任意大小的输入,该输入会自动分解为 4,096 个令牌的块。如果输入超过 32,768 个令牌,则会使用截断,在极少数情况下,可能会在审核检查中省略少量令牌。 每个对审核端点的请求的最终结果显示每个类别的最大值。例如,如果一块 4K 令牌的类别分数为 0.9901,另一块的分数为 0.1901,则结果将在 API 响应中显示 0.9901,因为它更高。
模型 | 描述 | 最大代币数 | text-moderation-latest | 目前指向text-moderation-007. | 32,768 | text-moderation-stable | 目前指向text-moderation-007. | 32,768 | text-moderation-007 | 所有类别中最有能力的审核模型。 | 32,768 |
GPTbase
GPT 基础模型可以理解并生成自然语言或代码,但未接受以下指令的训练。这些模型旨在替代我们原来的 GPT-3 基本模型,并使用旧版 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。
模型 | 描述 | 最大代币数 | 训练数据 | babbage-002 | GPT-3ada和babbage基本型号的替代品。 | 16,384 个代币 | 截至 2021 年 9 月 | davinci-002 | GPT-3curie和davinci基本型号的替代品。 | 16,384 个代币 | 截至 2021 年 9 月 |
自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的好处之一是,随着时间的推移,模型可能会越来越适合您的用例。 为了帮助识别滥用行为,API 数据最多可保留 30 天,之后将被删除(除非法律另有要求)。对于拥有敏感应用程序的值得信赖的客户,零数据保留可能是可用的。在零数据保留的情况下,请求和响应主体不会持久保存到任何日志记录机制中,并且仅存在于内存中以便为请求提供服务。 请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,例如ChatGPT或DALL·E Labs。
默认使用策略
端点 | 用于训练的数据 | 默认保留 | 符合零保留资格 | /v1/chat/completions* | 不 | 30天 | 是的,图像输入除外* | /v1/assistants | 不 | 直至被客户删除 | 不 | /v1/threads | 不 | 60 天* | 不 | /v1/threads/messages | 不 | 60 天* | 不 | /v1/threads/runs | 不 | 60 天* | 不 | /v1/threads/runs/steps | 不 | 60 天* | 不 | /v1/images/generations | 不 | 30天 | 不 | /v1/images/edits | 不 | 30天 | 不 | /v1/images/variations | 不 | 30天 | 不 | /v1/embeddings | 不 | 30天 | 是的 | /v1/audio/transcriptions | 不 | 零数据保留 | - | /v1/audio/translations | 不 | 零数据保留 | - | /v1/audio/speech | 不 | 30天 | 是的 | /v1/files | 不 | 直至被客户删除 | 不 | /v1/fine_tuning/jobs | 不 | 直至被客户删除 | 不 | /v1/batches | 不 | 直至被客户删除 | 不 | /v1/moderations | 不 | 零数据保留 | - | /v1/completions | 不 | 30天 | 是的 |
*通过模型(或之前)输入的图像不符合零保留条件。gpt-4-turbogpt-4-vision-preview *对于 Assistants API,我们仍在评估 Beta 期间的默认保留期。我们预计 Beta 结束后默认保留期将保持稳定。 有关详细信息,请参阅我们的API 数据使用政策。要了解有关零保留的更多信息,请联系我们的销售团队。
模型端点兼容性
端点 | 最新型号 | /v1/助手 | 所有 GPT-4 和 GPT-3.5 Turbo 型号(gpt-3.5-turbo-0301受支持除外)。该retrieval工具 需要gpt-4-turbo-preview(以及后续日期模型版本)或gpt-3.5-turbo-1106(以及后续版本)。 | /v1/音频/转录 | whisper-1 | /v1/音频/翻译 | whisper-1 | /v1/音频/语音 | tts-1,tts-1-hd | /v1/聊天/完成 | gpt-4和日期模型版本,gpt-4-turbo-preview和日期模型版本,gpt-4-vision-preview和gpt -4-32k日期模型版本,gpt-3.5-turbo和日期模型版本,gpt-3.5-turbo-16k和日期模型版本, 微调版本gpt-3.5-turbo | /v1/完成(旧版) | gpt-3.5-turbo-instruct, babbage-002,davinci-002 | /v1/嵌入 | text-embedding-3-small, text-embedding-3-large,text-embedding-ada-002 | /v1/fine_tuning/工作 | gpt-3.5-turbo, babbage-002,davinci-002 | /v1/节制 | text-moderation-stable,text-moderation-latest | /v1/图像/世代 | dall-e-2,dall-e-3 |
此列表不包括我们所有已弃用的型号。 |