当ChatGPT遇到民航,我们会失业吗?

导读

时至今日,网上关于ChatGPT和GPT-4应用案例的总结已经非常多了,本文中我们将简洁直白地探讨它们的核心技术特征,并根据实际例子讨论它们在我们老本行——民航领域的潜在应用。不想看技术原理的小伙伴也可以直接跳到应用部分。


由于OpenAI并没有完全公开ChatGPT和GPT-4的具体实现技术和细节(只能感叹如今的OpenAI不再open),所以有些内容是主观猜想,肯定会有不对的地方,欢迎一起探讨!



到底什么是Chat GPT ?


2022年11月ChatGPT发布后,仅仅两个月时间用户数量就超过一亿。继ChatGPT高开“疯”走后,OpenAI在一周前又推出了升级版模型:GPT-4。越来越多的人都开始探索GPT-4的能力上限,大多数用过的用户都给出了好评。


微软旗下的新版必应也使用了GPT-4,在搜索引擎的加持下,这个模型似乎能用于更多真实任务场景,比如:



ChatGPT其实就是一个对话机器人,用过Siri、小度、小冰的人想必都知道,这并不是个新鲜玩意儿,为什么ChatGPT就能在一众对话机器人中爆火出圈呢?简单说就是依靠它的三板斧:


1.强大的自然语言理解能力;

2.能生成流畅自然的回答;

3.可以根据上下文进行多轮问答。


换句话说,ChatGPT不仅”听得懂“,还会”说人话“,上至学术大家、下到黄口小儿,都能和它侃上几段。


三分钟读懂ChatGPT技术


其实,ChatGPT并非这个人工智能模型的初代目,它是在GPT3.5的基础上训练而来的,而GPT3.5是GPT系列模型的3.5代。追根溯源,最早的GPT-1是在2018年6月提出的,来看看GPT家族的族谱:



GPT是什么意思呢?其实我们看名字就能简单理解。



特征一:生成式



ChatGPT是一种”生成式”人工智能。什么叫生成式呢?说人话就是“无中生有”。这意味着它可以接受一组输入,并根据这些输入生成充满惊喜的(也可能是惊吓)的内容。


说句题外话,其实OpenAI还开发了一款能生成图片的人工智能模型:DALL·E 2,它可以根据用户输入的文字描述生成图片,下面这个图片就是它根据用户要求生成的(捏造的):



此外,还有谷歌推出的音乐生成模型:MusicLM。输入一段话,给你一首歌。如果你输入下面这段话,模型会给你生成这样一段曲子。来听两段练习时长一年半的AI写的曲子:



特征二:预训练



ChatGPT采用了一种经典的人工智能模型训练策略:”预训练+微调”。预训练就是使用海量数据预先训练一个生成式语言模型,微调就是将预训练过的模型作用到你自己的数据集,使模型性能更好地匹配你自己的任务。


这个过程怎么理解呢?打个比方,这就好比一位拥有1000小时飞行经验的B737机长,如果要转A320,那么这个机长只需要进行“机型改装“,而不必像“大改驾”学员一样从头学起。



因此,预训练的好处就是速度快。预训练模型是从大量数据中训练得来,比起在你自己的数据集上从头开始训练的方式肯定要快一些。


特征三:Transformer



Transformer是ChatGPT模型的基本结构,也可以说是它能够理解和处理人类语言的关键。抛开诸多技术细节,用人话来说,transformer本质上一种概率统计模型,依靠概率分布来预测输出序列中的下一个单词是什么。


很多常见的知识或事实,比如“C919是国产大飞机”,因为在训练数据中出现频率高,上下文之间的模式比较固定,预测的词语概率分布就比较尖锐,ChatGPT容易记住,从而可以输出正确的事实或知识。



巧妇难为无米之炊,如果单有Transformer模型,没有足够的训练数据也不能实现ChatGPT,这就引出了它的下一个特征:大模型。


特征四:大模型


ChatGPT是一个大规模语言模型(Large Language Model),什么叫大模型?简单说他的特点就是超级大。



咳咳,简单说,大模型的特点就是“三超”:超大的训练语料、超多的模型参数和超强的算力资源。


先说说超大的训练语料和超多的模型参数。


ChatGPT使用了来自互联网的大量文本数据进行训练,最终得到一个包含大量参数的语言模型,因此才能够生成令人满意的文本内容。到底有多大呢,我们拿GPT家族的几个模型对比下:



可以看到每一代GPT所用的数据量都在变大,这么多数据从哪儿来?OpenAI说数据来源是维基百科、书籍、期刊以及其他网络数据集。从这个角度来看,我们普通网民是不是也算是技术入股ChatGPT了呢?


再说说超强的算力资源。


刚刚说到GTP-3参数量1750亿,预训练数据量45TB。据估计,支撑模型训练的基础设施至少需要上万颗英伟达GPUA100芯片,一次模型训练费用460万美元,总训练成本达1200万美元。此外,也有人估算,现在OpenAI运行ChatGPT的算力费用为每天10万美元。



正是靠着这“三超”,ChatGPT展现出了大模型的特有优势。其背后的训练语料量级和覆盖领域完全超过了个人能够掌握的极限,它可以轻而易举地输出横跨多个领域和学科的观点并融会贯通。


总之,ChatGPT以及最新的GPT-4并没有那么神秘,它本质上就是将海量的数据结合表达能力很强的Transformer模型结合,从而对自然语言进行了一个非常深度的建模。对于一个输入的句子,ChatGPT能在这个模型参数的作用下生成一个回复。


理解这些技术特征,对我们讨论ChatGPT在民航圈儿的应用十分有帮助,接下来我们就来看几个例子。


“ChatGPT + 民航”能干什么


3月11日,在集成了ChatGPT的新版必应推出一个月后,微软正式宣布必应日活用户首次突破1亿人,大有挑战老大哥谷歌之势。



“ChatGPT + 搜索引擎”只是开始,未来,笔者认为很多软件的底层都会嵌套类似ChatGPT的模型,比如文案创作工具、作图工具、聊天工具、购物工具等等。那么,在民航领域会有哪些潜在应用场景呢?


应用一:智能客服


首先我们最容易想到的是面对旅客的智能客服,不同于目前航司使用的智能客服,ChatGPT似乎可以提供更加精准的旅行建议,以及行程规划、自动值机等等的服务。


比如,问它哪些东西可以带上飞机?可以看到,面对这个故意挖了个坑的问题,ChatGPT给出了大家想要的回答。



应用二:技能提升和训练


我们回到圈子内来看,ChatGPT的一个应用是与专业人员(飞行员、管制员、机务等等)面试和培训相关的工作。比如为待测试人员进行一场模拟面试:



又比如,为飞行员进行一场PEPEC模拟考试,可以看到ChatGPT作为一名模拟考官,与学员的互动交流很自然,而且还帮考生找出了需要完善的地方:



再比如,让ChatGPT解释一下ICAO文件中“shall”和“should”的区别,这个回答还是很符合真实情况的:



你还可以让它给你的孩子讲解民航知识,下一代的民航业务提升也不能落下:



应用三:文案写作


文案写作是我们每个人都绕不开的工作,在不久的将来,借助ChatGPT这类工具,文案写作可能会变得越来越高效(打工人的头发保住了!)。


前几天,微软已经公布了由AI驱动的Microsoft 365 Copilot,从介绍视频中可以看出,它打破了传统办公软件的方式,能自动生成文档、电子邮件、PPT。



想象这样一个场景,你要写一个B737的SOP的文档,于是你先让ChatGPT帮你列一个大纲,之后只需稍加完善便能交差,写作效率蹭蹭上涨!



篇幅所限这个回答没有提供完整图片


应用四:辅助运行


民航领域有眼花缭乱的各式报文,比如AFTN报、SITA报、ACARS报等等,以至于你我虽然同属于一个民航圈子,但是对于各自专业领域的报文却可能看不懂。


如果应用得当,ChatGPT这类技术可以提高不同部门之间的协同运行效率,例如,从网上找来一份气象报文让ChatGPT解读,测试一下它能不能看懂:



好像没什么大问题,再让ChatGPT生成一份航行通告报文,看看它写的标准不标准。可以看到,它听懂了我想表达的信息,基本上完成了任务:



不足之处


一、回复可靠性


如果有人问你民航运行最重要的是什么,大多数人第一回答肯定是安全。决定一项技术是否能运用到这一行的关键因素,也是安全。在实现本地部署确保数据安全的前提下,最大的问题就是,ChatGPT这类模型给出的回答是否真实可信。


答案缺乏可靠性是目前ChatGPT面临的最大挑战。特别是针对事实性和知识性相关的问答,ChatGPT有时候会一本正经地胡编乱造,生成虚假信息。即使让它给出来源和出处或者参考文献,ChatGPT通常也会生成一个不存在的网址或者从未发表过的文献。



我们前面说了,ChatGPT的输出本质上只是通过概率最大化不断生成数据而已,它并不是通过逻辑推理来生成回复。这是包括ChatGPT在内所有生成式模型的固有问题。如果仍然延续GPT系列架构,基础模型不做改变,从理论上讲是难以解决ChatGPT回复的可靠性问题。


但我们也看到,目前已经出现了ChatGPT和搜索引擎相结合的产品,这似乎是一种目前务实的方案,搜索引擎负责搜索可靠的事实信息来源,ChatGPT负责总结和归纳。但实际效果如何,仍需要积累一些数据后再做观察。


新版必应使用效果


此外,如果希望将ChatGPT等模型应用到民航知识库领域,提供高可靠性的回答内容,可能还需要进一步提升模型的拒识能力,也就是过滤掉模型确定无法回答的那些问题,同时还需要事实验证模块来验证回复的正确性。


第二点:实时学习能力


ChatGPT以及GPT-4目前并不具备动态信息持续更新功能,以ChatGPT为例,它目前的版本是基于2021年9月之前的数据训练的,因此“对2021年后世界事件的了解有限”。比如,ChatGPT 无法回答“2022世界杯冠军是谁”:



ChatGPT可以依据用户的意图修正回复,给人一种它具有实时学习能力的错觉。但是,ChatGPT只会在当前的对话中根据用户反馈进行修正,当我们重启一个对话,测试相同的问题时,ChatGPT还会犯相同或类似的错误。


为什么ChatGPT不将修改后的正确信息存储到模型中呢?可能有两方面考虑。首先,用户反馈的信息并不一定是正确的,有时候故意引导ChatGPT做出不合理的回答。其次,即使用户反馈的信息是正确的,但因为可能出现频率不高,基础大模型不能根据低频数据更新参数,否则大模型就会对某些长尾数据进行过拟合从而失去通用性,简单说就是输出结果不准。


所以,让ChatGPT实时进行学习非常困难,而这种实时学习能力是很多民航应用场景中需要的,例如,民航法规的更新、民航技术的迭代,都需要实时反馈到模型中。


要解决这个问题,一种简单粗暴的方案就是每经过一段时间就利用新的数据微调ChatGPT。或者采用触发机制,当多个用户提交相同或相似反馈时触发模型的参数更新,从而增强模型的动态学习能力。


总结


不管你是否愿意接受,人工智能正在与我们的生活和工作深入融合,而ChatGPT的出现似乎加速了这种融合的进程。



未来几年,人工智能是否可以代替你的工作呢?笔者认为确实还不至于抢走你的饭碗,但是熟练使用AI技术的人可能会。以后你能不能借助这些工具提升你的工作效率和质量,这可能是一个至关重要的技能。


这是最好的时代,因为AI技术总体上来说还一直处于探索阶段,更何况应用门槛如此高、安全标准如此严格的民航领域,所以现在开始学习仍旧不晚。活到老,学到老,大家一起加油吧!


希望本文对于想要了解ChatGPT的小伙伴能有所帮助。本人才疏学浅,有写错或者不懂的地方欢迎指正~

展开阅读全文

页面更新:2024-04-16

标签:民航   报文   人工智能   模型   特征   领域   能力   数据   用户   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top