小巧而强大：NVIDIA 加速微软 Phi-3 开源“小语言模型”

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理。

Phi-3 Mini 与 10 倍之于其大小的模型能力不相上下。不同于仅用于研究的 Phi-2，Phi-3 Mini 不仅可以用于研究，同时还可以用于多种商业用途。搭载 NVIDIA RTX GPU 的工作站或搭载 GeForce RTX GPU 的 PC 可以使用 Windows DirectML 或 TensorRT-LLM 在本地运行该模型。

该模型有 38 亿个参数，在 512 个 NVIDIA Tensor Core GPU 上使用 3.3 万亿个 token 训练而成，仅耗时七天时间。

Phi-3 Mini 有两个版本，一个版本支持 4K token，另一个版本支持 128K token，是同类模型中第一个支持超长上下文的模型。因此，开发者在向该模型提问时，可以使用 128,000 个 token（模型能够处理的最小语言单位），使模型能够做出更加符合现实的回答。

开发者可以在 ai.nvidia.com 上试用带有 128K 上下文窗口的 Phi-3 Mini。该模型被打包成 NVIDIA NIM，这是一项带有标准应用编程接口的微服务，可以部署在任何位置。

在边缘高效运行

自主机器人和嵌入式设备开发者可以通过社区教程（如 Jetson AI Lab）学习创建和部署生成式 AI，并在 NVIDIA Jetson 上部署 Phi-3。

Phi-3 Mini 模型只有 38 亿个参数，非常小巧紧凑，可以在边缘设备上高效运行。参数就像内存中的旋钮，可在模型训练过程中进行精确的调整，使模型能够对输入的提示做出高度准确的响应。

Phi-3 可以在成本和资源受限的用例中提供帮助，尤其是较简单的任务。该模型在关键语言基准测试中的表现优于一些较大的模型，同时在满足延迟要求的情况下给出结果。

TensorRT-LLM 将支持 Phi-3 Mini 的长上下文窗口，并使用 LongRoPE、FP8/飞行批处理等众多优化措施和内核来提高推理吞吐量，减少延迟。TensorRT-LLM 的应用很快将在 GitHub 上的示例文件夹中提供。

开发者可以转换为 TensorRT-LLM 检查点格式，该格式针对推理进行了优化，可以轻松地与 NVIDIA Triton 推理服务器一起部署。

开发开放式系统

NVIDIA 是开源生态系统的积极贡献者，已经发布了 500 多个带有开源许可证的项目。

NVIDIA 为 JAX、Kubernetes、OpenUSD、PyTorch 和 Linux 内核等众多外部项目做出了贡献，还为各种开源基金会和标准机构提供支持。

此次发布建立在 NVIDIA 与微软深厚的合作基础上，双方的合作为加速 DirectML、Azure 云、生成式 AI 研究以及医疗和生命科学等领域的创新铺平了道路。

进一步了解我们近期的合作：

https://blogs.nvidia.cn/blog/microsoft-nvidia-generative-ai-enterprises/

展开阅读全文

页面更新：2024-04-29

标签：微软检查点模型语言高效上下文开发者内核小巧强大参数版本

1 2 3 4 5

小巧而强大：NVIDIA 加速微软 Phi-3 开源“小语言模型”

雷士照明推出小雷易家智能照明产品

三星 Galaxy S24 FE 手机现身英国运营商数据库

看到邓家佳才知道什么是体面，与富二代前夫离婚不离店，各自安好

中年女人穿“乐福鞋”时，尽量少犯这四个错误，否则显矮又土气

网友澳门偶遇刘纯燕！穿搭童趣却难掩老态，一把年纪何必强装嫩？

北京这夜：主持人翻车陈凯歌回怼，陈数摔倒，杨子珊撞衫闫妮独美

艾德莱斯马面裙受热捧网友：有融合、有创新

孙颖莎的淳朴与奢侈：月入33万只穿百元国货，聚餐买单，捐款冲前

55岁邓文迪最新出席晚宴把人美到！花朵裙配波浪卷发，又嫩又霸气

被61岁自然老去的叶童惊艳！不染发不化浓妆，一身白色都能很优雅

女人上了年纪发福、变老，究竟哪些“裙子”该穿，哪些不该穿？

普通女孩有效化妆只需 5步- 精简化妆

你的这么小！

看淡一切大彻大悟的文案，得不到的回应，就适可而止

思想阵营之争、舆论刺刀见红-这场风暴如何冲击你的命运？

喜马实践：模型时代的音频剪辑方式-云剪辑按字剪辑

国产AI大模型加速“上车”

70岁赵雅芝发美照！自信优雅美丽气场依旧强大，状态很好很

大咖连线｜诺贝尔奖得主巴里·马歇尔：新药研发可以在中国

微软Edge浏览器124版本已修复自动安装8KB Copilot应用

华为Pura70 Pro+测评：我觉得它才是这次的“版本答案”

华为家庭存储测试微信备份功能，需搭配HarmonyOS 4.2及

山竹为什么被称为果中皇后？只因它这几个强大功效，值得你

你害怕中国成为世界上最强大的国家吗？看看老外是如何回

这是你没玩过的船新版本 - Steam《中国式网游》预告来