英伟达发布Nemotron-4 340B通用模型：生成合成数据的突破性进展 ...

2024-6-21 00:18| 发布者: 总版主| 查看: 508| 评论: 0

摘要: 2024年6月14日，英伟达宣布发布Nemotron-4 340B通用模型，这个模型专为生成训练大语言模型的合成数据设计，可能彻底改变训练大模型时合成数据的生成方式。今天，我们就来详细介绍一下这个模型及其亮点特色。Nemotron ...

2024年6月14日，英伟达宣布发布Nemotron-4 340B通用模型，这个模型专为生成训练大语言模型的合成数据设计，可能彻底改变训练大模型时合成数据的生成方式。今天，我们就来详细介绍一下这个模型及其亮点特色。

Nemotron-4 340B模型概述

Nemotron-4 340B是一个突破性的通用模型，设计用于生成合成数据，标志着AI行业的一个重要里程碑。与传统需要昂贵真实世界数据的方式不同，Nemotron-4 340B能够使用合成数据创建性能强大、特定领域的大模型。其性能已经超越了现有的多种顶级模型，包括Mixtral 8x22B、Claude sonnet、Llama3 70B和Qwen 2，甚至可以和GPT-4一较高下。

三个版本：Base、Instruct和Reward

Nemotron-4 340B包括三个版本：

基础模型（Base）：用于生成基础语言理解和生成任务。

指令模型（Instruct）：专为指令跟随任务设计，优化了用户指令响应能力。

奖励模型（Reward）：用于筛选和评估生成的合成数据质量。

模型对比

常识推理任务性能

常识推理任务包括ARC-Challenge、MMLU和BigBench Hard基准测试。

合成数据生成与实际数据对比

通过这些对比，我们可以清晰地看到Nemotron-4 340B在各个方面的卓越表现，尤其是在生成合成数据和常识推理任务中的出色性能。这个模型不仅在技术参数上领先，而且在实际应用中也展示出强大的能力。

高质量合成数据生成

Nemotron-4 340B构建了一个完整的生成高质量合成数据的流程，支持超过50种自然语言和40多种编程语言，采用高达9万亿个token训练，数据截止到2023年6月。指令模型在98%的合成数据上完成训练，结果显示在常识推理任务中表现出色，与Llama-3 70B、Mixtral 8x22B和Qwen-2 72B模型相媲美。在RewardBench上的测试中，Nemotron-4-340B-Reward的准确性甚至超过了GPT-4o-0513和Gemini 1.5 Pro-0514，说明其生成的合成训练数据质量非常高。

训练和推理性能

在训练方面，Nemotron-4-340B-Base使用了768个DGX H100节点，每个节点包含8个基于NVIDIA Hopper架构的H100 80GB SXM5 GPU。推理方面，在BF16精度下需要8块H200或者16块H100/A100 80GB GPU，在FP8精度下则只需要8块H100。

NeMo和TensorRT-LLM框架的结合

Nemotron-4 340B的许可对商业使用十分友好，可以与英伟达开源的NeMo和TensorRT-LLM框架结合使用，优化指令模型和奖励模型的效率，从而生成合成数据并对响应进行评分。所有Nemotron-4 340B模型都利用了张量并行，经过TensorRT-LLM优化，可以将单个权重矩阵分割到多个GPU和服务器上，实现大规模的高效推理。

数据生成与对齐

为了生成合成数据，英伟达使用了Mixtral-8x7B-Instruct-v0.1作为生成器，生成多样化的合成提示，包括写作、开放问答、封闭问答等任务，涉及STEM、人文、日常生活等主题。此外，Nemotron-4-340B-Reward用于评估对话质量，为每个样本分配一个分数，过滤掉低于预定阈值的样本，提供额外的质量控制层。

应用与影响

Nemotron-4 340B的发布对各行各业都有潜在的巨大影响。比如在医疗领域，可以生成高质量合成数据，促进药物发现、个性化医疗和医学影像方面的突破；在金融领域，基于合成数据训练的定制大语言模型，可以彻底改变欺诈检测、风险评估和客户服务；在制造业和零售业，特定领域的大模型可以实现预测性维护、供应链优化和个性化客户体验。

然而，Nemotron-4 340B的发布也提出了一些隐忧，比如数据隐私和安全问题，以及用合成数据训练AI模型可能引发的伦理问题。但无论如何，使用合成数据似乎是AI的未来。

AI领域突破

Nemotron-4 340B是英伟达在AI领域的又一重要突破。其在生成合成数据、提升模型性能和稳定性方面的卓越表现，为未来的AI发展提供了无限可能。最重要的是以后在训练数据的时候不在需要在购买或收集真实昂贵的数据了。

鲜花

握手

雷人

路过

鸡蛋

收藏邀请