当ChatGPT遇到民航，我们会失业吗？

导读

时至今日，网上关于ChatGPT和GPT-4应用案例的总结已经非常多了，本文中我们将简洁直白地探讨它们的核心技术特征，并根据实际例子讨论它们在我们老本行——民航领域的潜在应用。不想看技术原理的小伙伴也可以直接跳到应用部分。

由于OpenAI并没有完全公开ChatGPT和GPT-4的具体实现技术和细节（只能感叹如今的OpenAI不再open），所以有些内容是主观猜想，肯定会有不对的地方，欢迎一起探讨！

到底什么是Chat GPT ？

2022年11月ChatGPT发布后，仅仅两个月时间用户数量就超过一亿。继ChatGPT高开“疯”走后，OpenAI在一周前又推出了升级版模型：GPT-4。越来越多的人都开始探索GPT-4的能力上限，大多数用过的用户都给出了好评。

微软旗下的新版必应也使用了GPT-4，在搜索引擎的加持下，这个模型似乎能用于更多真实任务场景，比如：

ChatGPT其实就是一个对话机器人，用过Siri、小度、小冰的人想必都知道，这并不是个新鲜玩意儿，为什么ChatGPT就能在一众对话机器人中爆火出圈呢？简单说就是依靠它的三板斧：

1.强大的自然语言理解能力；

2.能生成流畅自然的回答；

3.可以根据上下文进行多轮问答。

换句话说，ChatGPT不仅”听得懂“，还会”说人话“，上至学术大家、下到黄口小儿，都能和它侃上几段。

三分钟读懂ChatGPT技术

其实，ChatGPT并非这个人工智能模型的初代目，它是在GPT3.5的基础上训练而来的，而GPT3.5是GPT系列模型的3.5代。追根溯源，最早的GPT-1是在2018年6月提出的，来看看GPT家族的族谱：

GPT是什么意思呢？其实我们看名字就能简单理解。

特征一：生成式

ChatGPT是一种”生成式”人工智能。什么叫生成式呢？说人话就是“无中生有”。这意味着它可以接受一组输入，并根据这些输入生成充满惊喜的（也可能是惊吓）的内容。

说句题外话，其实OpenAI还开发了一款能生成图片的人工智能模型：DALL·E 2，它可以根据用户输入的文字描述生成图片，下面这个图片就是它根据用户要求生成的（捏造的）：

此外，还有谷歌推出的音乐生成模型：MusicLM。输入一段话，给你一首歌。如果你输入下面这段话，模型会给你生成这样一段曲子。来听两段练习时长一年半的AI写的曲子：

特征二：预训练

ChatGPT采用了一种经典的人工智能模型训练策略：”预训练+微调”。预训练就是使用海量数据预先训练一个生成式语言模型，微调就是将预训练过的模型作用到你自己的数据集，使模型性能更好地匹配你自己的任务。

这个过程怎么理解呢？打个比方，这就好比一位拥有1000小时飞行经验的B737机长，如果要转A320，那么这个机长只需要进行“机型改装“，而不必像“大改驾”学员一样从头学起。

因此，预训练的好处就是速度快。预训练模型是从大量数据中训练得来，比起在你自己的数据集上从头开始训练的方式肯定要快一些。

特征三：Transformer

Transformer是ChatGPT模型的基本结构，也可以说是它能够理解和处理人类语言的关键。抛开诸多技术细节，用人话来说，transformer本质上一种概率统计模型，依靠概率分布来预测输出序列中的下一个单词是什么。

很多常见的知识或事实，比如“C919是国产大飞机”，因为在训练数据中出现频率高，上下文之间的模式比较固定，预测的词语概率分布就比较尖锐，ChatGPT容易记住，从而可以输出正确的事实或知识。

巧妇难为无米之炊，如果单有Transformer模型，没有足够的训练数据也不能实现ChatGPT，这就引出了它的下一个特征：大模型。

特征四：大模型

ChatGPT是一个大规模语言模型（Large Language Model），什么叫大模型？简单说他的特点就是超级大。

咳咳，简单说，大模型的特点就是“三超”：超大的训练语料、超多的模型参数和超强的算力资源。

先说说超大的训练语料和超多的模型参数。

ChatGPT使用了来自互联网的大量文本数据进行训练，最终得到一个包含大量参数的语言模型，因此才能够生成令人满意的文本内容。到底有多大呢，我们拿GPT家族的几个模型对比下：

可以看到每一代GPT所用的数据量都在变大，这么多数据从哪儿来？OpenAI说数据来源是维基百科、书籍、期刊以及其他网络数据集。从这个角度来看，我们普通网民是不是也算是技术入股ChatGPT了呢？

再说说超强的算力资源。

刚刚说到GTP-3参数量1750亿，预训练数据量45TB。据估计，支撑模型训练的基础设施至少需要上万颗英伟达GPUA100芯片，一次模型训练费用460万美元，总训练成本达1200万美元。此外，也有人估算，现在OpenAI运行ChatGPT的算力费用为每天10万美元。

正是靠着这“三超”，ChatGPT展现出了大模型的特有优势。其背后的训练语料量级和覆盖领域完全超过了个人能够掌握的极限，它可以轻而易举地输出横跨多个领域和学科的观点并融会贯通。

总之，ChatGPT以及最新的GPT-4并没有那么神秘，它本质上就是将海量的数据结合表达能力很强的Transformer模型结合，从而对自然语言进行了一个非常深度的建模。对于一个输入的句子，ChatGPT能在这个模型参数的作用下生成一个回复。

理解这些技术特征，对我们讨论ChatGPT在民航圈儿的应用十分有帮助，接下来我们就来看几个例子。

“ChatGPT + 民航”能干什么

3月11日，在集成了ChatGPT的新版必应推出一个月后，微软正式宣布必应日活用户首次突破1亿人，大有挑战老大哥谷歌之势。

“ChatGPT + 搜索引擎”只是开始，未来，笔者认为很多软件的底层都会嵌套类似ChatGPT的模型，比如文案创作工具、作图工具、聊天工具、购物工具等等。那么，在民航领域会有哪些潜在应用场景呢？

应用一：智能客服

首先我们最容易想到的是面对旅客的智能客服，不同于目前航司使用的智能客服，ChatGPT似乎可以提供更加精准的旅行建议，以及行程规划、自动值机等等的服务。

比如，问它哪些东西可以带上飞机？可以看到，面对这个故意挖了个坑的问题，ChatGPT给出了大家想要的回答。

应用二：技能提升和训练

我们回到圈子内来看，ChatGPT的一个应用是与专业人员（飞行员、管制员、机务等等）面试和培训相关的工作。比如为待测试人员进行一场模拟面试：

又比如，为飞行员进行一场PEPEC模拟考试，可以看到ChatGPT作为一名模拟考官，与学员的互动交流很自然，而且还帮考生找出了需要完善的地方：

再比如，让ChatGPT解释一下ICAO文件中“shall”和“should”的区别，这个回答还是很符合真实情况的：

你还可以让它给你的孩子讲解民航知识，下一代的民航业务提升也不能落下：

应用三：文案写作

文案写作是我们每个人都绕不开的工作，在不久的将来，借助ChatGPT这类工具，文案写作可能会变得越来越高效（打工人的头发保住了！）。

前几天，微软已经公布了由AI驱动的Microsoft 365 Copilot，从介绍视频中可以看出，它打破了传统办公软件的方式，能自动生成文档、电子邮件、PPT。

想象这样一个场景，你要写一个B737的SOP的文档，于是你先让ChatGPT帮你列一个大纲，之后只需稍加完善便能交差，写作效率蹭蹭上涨！

篇幅所限这个回答没有提供完整图片

应用四：辅助运行

民航领域有眼花缭乱的各式报文，比如AFTN报、SITA报、ACARS报等等，以至于你我虽然同属于一个民航圈子，但是对于各自专业领域的报文却可能看不懂。

如果应用得当，ChatGPT这类技术可以提高不同部门之间的协同运行效率，例如，从网上找来一份气象报文让ChatGPT解读，测试一下它能不能看懂：

好像没什么大问题，再让ChatGPT生成一份航行通告报文，看看它写的标准不标准。可以看到，它听懂了我想表达的信息，基本上完成了任务：

不足之处

一、回复可靠性

如果有人问你民航运行最重要的是什么，大多数人第一回答肯定是安全。决定一项技术是否能运用到这一行的关键因素，也是安全。在实现本地部署确保数据安全的前提下，最大的问题就是，ChatGPT这类模型给出的回答是否真实可信。

答案缺乏可靠性是目前ChatGPT面临的最大挑战。特别是针对事实性和知识性相关的问答，ChatGPT有时候会一本正经地胡编乱造，生成虚假信息。即使让它给出来源和出处或者参考文献，ChatGPT通常也会生成一个不存在的网址或者从未发表过的文献。

我们前面说了，ChatGPT的输出本质上只是通过概率最大化不断生成数据而已，它并不是通过逻辑推理来生成回复。这是包括ChatGPT在内所有生成式模型的固有问题。如果仍然延续GPT系列架构，基础模型不做改变，从理论上讲是难以解决ChatGPT回复的可靠性问题。

但我们也看到，目前已经出现了ChatGPT和搜索引擎相结合的产品，这似乎是一种目前务实的方案，搜索引擎负责搜索可靠的事实信息来源，ChatGPT负责总结和归纳。但实际效果如何，仍需要积累一些数据后再做观察。

新版必应使用效果

此外，如果希望将ChatGPT等模型应用到民航知识库领域，提供高可靠性的回答内容，可能还需要进一步提升模型的拒识能力，也就是过滤掉模型确定无法回答的那些问题，同时还需要事实验证模块来验证回复的正确性。

第二点：实时学习能力

ChatGPT以及GPT-4目前并不具备动态信息持续更新功能，以ChatGPT为例，它目前的版本是基于2021年9月之前的数据训练的，因此“对2021年后世界事件的了解有限”。比如，ChatGPT 无法回答“2022世界杯冠军是谁”：

ChatGPT可以依据用户的意图修正回复，给人一种它具有实时学习能力的错觉。但是，ChatGPT只会在当前的对话中根据用户反馈进行修正，当我们重启一个对话，测试相同的问题时，ChatGPT还会犯相同或类似的错误。

为什么ChatGPT不将修改后的正确信息存储到模型中呢？可能有两方面考虑。首先，用户反馈的信息并不一定是正确的，有时候故意引导ChatGPT做出不合理的回答。其次，即使用户反馈的信息是正确的，但因为可能出现频率不高，基础大模型不能根据低频数据更新参数，否则大模型就会对某些长尾数据进行过拟合从而失去通用性，简单说就是输出结果不准。

所以，让ChatGPT实时进行学习非常困难，而这种实时学习能力是很多民航应用场景中需要的，例如，民航法规的更新、民航技术的迭代，都需要实时反馈到模型中。

要解决这个问题，一种简单粗暴的方案就是每经过一段时间就利用新的数据微调ChatGPT。或者采用触发机制，当多个用户提交相同或相似反馈时触发模型的参数更新，从而增强模型的动态学习能力。

总结

不管你是否愿意接受，人工智能正在与我们的生活和工作深入融合，而ChatGPT的出现似乎加速了这种融合的进程。

未来几年，人工智能是否可以代替你的工作呢？笔者认为确实还不至于抢走你的饭碗，但是熟练使用AI技术的人可能会。以后你能不能借助这些工具提升你的工作效率和质量，这可能是一个至关重要的技能。

这是最好的时代，因为AI技术总体上来说还一直处于探索阶段，更何况应用门槛如此高、安全标准如此严格的民航领域，所以现在开始学习仍旧不晚。活到老，学到老，大家一起加油吧！

希望本文对于想要了解ChatGPT的小伙伴能有所帮助。本人才疏学浅，有写错或者不懂的地方欢迎指正~

展开阅读全文

页面更新：2024-04-16

标签：民航报文人工智能模型特征领域能力数据用户技术

1 2 3 4 5

当ChatGPT遇到民航，我们会失业吗？

到底什么是Chat GPT ？

三分钟读懂ChatGPT技术

“ChatGPT + 民航”能干什么

不足之处

总结

华为管理层

“一码通行”再升级，微信小程序“乘车码”能乘地铁啦！

万元Pro苹果还要涨价！iPhone 15高配版要用钛合金：你要买吗？

东风刚降价特斯拉再次确认将推出10万级别电车，比亚迪危险了？

王传福，悄悄入股百度昆仑芯

ChatGPT-4都来抢饭碗了，我们还要培养“小镇做题家”吗？

西安发布新能源补贴新政策，个人补贴最高6000元

魅族20/Pro系列手机PANDAER妙磁抗菌壳上架：139元起

摩托也要玩AI！雅马哈宣布 10 年投资 1 亿美元研发 AI 与机器人

预售24小时后，订单量破万的smart精灵#1电动车，究竟有何魅力？

全国首创“人才贷、研发贷、成果贷” 助力科技型企业高质量发展

32.99万元买特斯拉，体验3.3s百公里加速，其用车成本如何？

偏远小城吸引来了京东与腾讯！摇身一变为“第二个上海”

时空种子元年大会启幕仪式在世界互联网大会乌镇隆重举行

清华女实习生险被性侵后未获留用，蔚来回应：没编制

腾讯T13 技术大佬被裁-一个技术屌丝的自我看法

多渠道入手提升盈利能力合富中国开启全国化扩张

断供“副作用”出现！任正非公布重要数据，外媒：美制裁了什

CXO龙头业绩劲升，新技术、新能力突破持续打开成长空间

苹果新专利：用户佩戴太阳镜也可看清iPhone屏幕内容

华为老用户换机的最佳选择，荣耀Magic5 至臻版入股不亏！

传任天堂下一任主机采用英伟达新Tegra芯片三星5纳米

47岁腾讯技术大佬突然被裁，干了16年也不行，这是什么原因

珍爱网相亲平台有效增强平台安全性，保障用户网络安全

中国地方鸡品种选育技术有了新突破专用芯片“神农1号