「更新」手把手教你通过OpenAI网页界面微调GPT-3.5 Turbo 大模型


背景介绍

大家好! 今天,我们要聊一下OpenAI 最新的更新内容——GPT-3.5 Turbo 的微调功能,而且现在微调变得更简单,无需代码、无需命令行,小白用户也可轻松上手!一起了解下吧。

GPT-3.5 Turbo 是什么?


GPT-3.5 Turbo 是 OpenAI 推出的一款先进的聊天机器人模型。它本身就很强大,但如果你想更具体地满足你的需求或场景,以前可能需要些技巧。


以前为什么不能轻松微调?


以前,GPT-3.5 Turbo 是一个“封闭”的模型,如同一个专业运动员。它固定在某种“风格”和“策略”下,难以轻易改变。


️ 以前在不能微调的情况下,如何实现个性化消息回复?

提示工程:通过设计的提示来指导模型。

后处理:对模型回复进行额外编辑或过滤。

多次尝试和筛选:生成多个答案,选择最佳。

用户反馈循环:不断优化回复。

组合策略:使用多个模型或服务进行组合。

现在为什么可以轻松微调?


OpenAI 更新了这款模型,现在通过Web界面就允许用户进行微调!这如同为“专业运动员”提供了新的“训练方法”,更加契合你的策略。


️ 微调带来了哪些益处?

个性化:按照你的品牌风格进行回复。

高效性:更精确地完成任务,节约时间。

灵活性:根据不同需求,进行有针对性的训练。


现在,谁都可以微调!


不论你是否懂得编程,OpenAI 都为你提供了简单的微调工具和方法,你只需要在网页界面上操作即可完成工作任务。

下面,我们将引导你一步步在界面完成微调,让你的 GPT-3.5 Turbo 更聪明、更懂你!


准备数据

目的

在微调的旅程中,第一步是准备数据。这就像是给你的机器人“上课”的教材,告诉它应该如何更好地回应。


所需工具

1、文本编辑器:如 Notepad、Sublime Text 或 Visual Studio Code。

2、JSON 格式校验工具:如 JSONLint,用于确保你的 JSON 文件格式正确。

3、如果只是简单测试windows自带文本工具记事本也可以。

操作步骤

1、收集对话样本:首先,你需要收集一些对话样本,这些样本应该反映出你希望机器人学习的内容和风格。


2、创建 JSON 文件:


.打开你选择的文本编辑器。

.创建一个新的文本文件,并保存为 .json 格式。

.在这个 JSON 文件中,你需要按照特定的格式输入你收集的对话样本。


3、编写 JSON 内容:


.你的 JSON 文件应该包含一个名为 messages 的数组。

.每个数组元素都是一个对象,包含 role 和 content 两个字段。

.role 可以是 system(系统角色,身份,背景信息等)、user(提问者问的问题) 或 assistant(需要模型回答的内容)。

.content 是该角色在对话中的具体内容。

我们需要编写至少10组


示例:



或者提示/完成对 (prompt/completion pairs),即QA问和答的形式



4、校验 JSONL 格式:


.将你编写的 JSONL 内容复制到 JSONL 格式校验工具中,确保没有语法错误。



5、保存并备份:


.保存你的 JSONL 文件,并确保备份一份,以防万一。



小贴士


.尽量让对话样本多样化,以覆盖更多的场景和用例。

.确保 system 角色的消息明确指出了助手的特性或限制,这有助于模型更准确地进行微调。


这就是准备数据的全过程!就像是为你的机器人准备了一份详细的“教材”,下一步就是送它去“学校”(也就是上传到 OpenAI 服务器)进行学习。


开始微调

目的

上传文件的过程就像是给你的机器人送去“学校”的第一天。你已经准备好了“教材”(也就是数据文件),现在是时候让它开始学习了。


所需工具

1、能够访问https://platform.openai.com/finetune 地址的电脑。

2、浏览器:Google 浏览器或者是Edge浏览器。


操作步骤


创建微调任务:


1、打开你的电脑上的浏览器。

2、访问 https://platform.openai.com/finetune:



3、创建一个微调任务


4、选择微调模型为gpt-35-turbo-0613 ,上传准备好的数据集test.jsonl





上传成功,点击创建



微调任务就好了



我们在successful 那里就可以看到微调成功后的模型,你可以直接在界面上看到微调过程中损失值的变化。



小贴士


.确保你的jason格式是正确的。

.这些都是很基础很简单的任务,遇到问题问ChatGPT即可。




测试微调后的模型

目的

这一步就像是你的机器人“毕业”后的首次“工作”体验。微调任务完成了,现在是时候让它展示所学的一切。



所需工具

1、能够访问https://platform.openai.com/playground 地址的电脑。

2、浏览器:Google 浏览器或者是Edge浏览器。



操作步骤

1、打开你浏览器导航到Playground:



2、进行测试:


.在user对话框输入你的问题进行测试。


输入问题



进行测试




小贴士


.确保你的 API 密钥和模型标识符都是正确的。

.你可以根据需要多次测试和使用你的微调后的模型。

恭喜,你已经成功完成了第四步!这就像是你的机器人成功地完成了它的“首次工作任务”,展示了它所学的一切。现在,你可以自由地使用你的个性化模型,让它更好地服务于你的特定需求和场景。



在第三方系统中使用微调后的模型

目的

这一步就像是你的机器人“出差”或者“兼职”。你不仅可以在 OpenAI 的平台上使用它,还可以将它嵌入到其他第三方系统中,比如网站、应用或其他服务。


所需工具

1、第三方系统:如网站后端(Node.js、Python 等)、移动应用或其他服务。

2、OpenAI API 密钥:这是你的“通行证”,用于在第三方系统中访问你的个性化模型。


操作步骤

1、选择第三方系统:


.确定你想在哪个第三方系统中使用你的微调后的模型。

2、安装必要的库或依赖:


.根据你选择的第三方系统,可能需要安装一些库或依赖来调用 OpenAI API。

例如,在 Python 中,你可能需要安装 openai 库:





3、编写 API 调用代码:

.在你选择的第三方系统中,编写代码来调用你的微调后的模型。

例如,在 Python 中,代码可能如下:





OPENAI_API_KEY 是你的 API 密钥。

ft:gpt-3.5-turbo:org_id 是你微调后的模型标识符

如我的是这样的:




4、测试模型调用:


.运行你编写的代码,确保能成功调用微调后的模型并获得预期的回复。



5、部署到第三方系统:


.一旦测试成功,你就可以将代码部署到你选择的第三方系统中。



小贴士


确保你的 API 密钥在第三方系统中是安全存储的。

根据第三方系统的需求,你可能需要进行额外的配置或优化。

太棒了,这就像是你的机器人开始了它的“全球巡演”,能够在各种不同的舞台上展示它的才华。现在,无论是在 OpenAI 平台还是任何第三方系统,你都可以充分利用你的个性化模型。


希望这个详细的步骤能帮助你更好地理解如何在第三方系统中使用微调后的模型!

展开阅读全文

页面更新:2024-05-18

标签:模型   目的   密钥   样本   机器人   界面   浏览器   代码   格式   网页   工具   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top