两个月的疯狂输入，对类ChatGPT大模型的几点理性认识

因为工作关系，在2023年的3到4月份，对各个大模型做了非常深入的学习。不得不说几点粗浅的认识：

接触过的大模型有百度文心一言、阿里通义千问、清华智谱ChatGLM，当然还有ChatGPT的3.5和4.0，以及一些周边服务的公司。
作为百度文心的首批的API合作伙伴，做了大量的API调用测试，也参加了技术闭门交流会。
清华智谱的6B模型已经开源，项目上的朋友做了环境搭建，在没有剪枝蒸馏的情况下做了100个左右的JSON格式的FAQ知识，租赁了A100训练仍然耗时（A100不能物权转移）

谈论交流的都是2B、2G的业务，2C的不涉及。金融机构、政府客户为主。均涉及到数据不能出域的问题。只能私有化部署。
私有化部署解决两个问题，数据安全（不允许出域的行业），以及专属知识的训练（其实更多知识是互联网搜索不到的专属知识）。
专属知识的持续训练和精调，可以通过Prompt（其实也不现实）和模型托管的方式来实现。
但数据安全问题就不是上面的模式能解决的了，只剩下私有化，仅仅一个模型的私有化就需要千万级别的预算，还不包括算力的投入，以及标注、精调、剪枝蒸馏等。
算力也是问题，受到信创的很多限制，据说华为和上海超算中心合作的项目，能提供相当于A100的算力。不要想着用3090 12G来预训练6B之类的模型，每次训练少则10几个小时不能关机，你家空调费你都搞不起了。用A100物权不能转移，只能租赁，而且实际应用中，还涉及到并发问题，需求量超级大。
连百度这样依靠搜索起家的公司，都极度缺乏高质量的数据。要知道，算法、算力、数据，是AIGC的重要基础（很多所有财经博主不懂乱说的不要信了），数据就是有用的行业知识、专属知识，都是决定应用能否落地的决定性因素。
下面这个图，来自于财联社，仅仅引用说明一下，数据的自动标注还不切实际。要不然OpenAI在南非搞那么多人做什么？而且越是专业的领域，数据标注对人员的要求越高。

大体总结一下，专业的2B、2G领域的应用，时机还差了很多成熟的条件，特别是国内的大模型要到2023年底才能相对成熟些并达到ChatGPT4.0的水平，算力和数据的不足，更加制约专业领域的发展。2C嘛，没太多思考，不做什么评价。

展开阅读全文

页面更新：2024-05-16

标签：南非模型华为理性认识成熟领域疯狂项目知识数据行业专业

中国在世界科技水平中的地位如何？

一篇让你了解我们祖国的强大。愿我们祖国繁荣富强！！！！请看正文，突破极限的实力展示。中国科学家发布了一个长达100多秒的视频，引起了全球科学界的轰动。这段视频展示了中国科学家在核聚变研究方面创造的一个世界纪录。视频

你的618快递收到了吗？

2023年6月4日，浙江嘉兴某快递运输站点，快递员整忙碌地分拣快递。随着“618”消费节活动第一波结束，网购快递的数量也经历一个高峰。

一场科技革命：太阳能可通过微波传输技术传回地球表面！

在一个非常惊人的实验中，加州理工学院的科学家表示，他们已经成功地将卫星收集的太阳能通过微波传输技术传输到地球表面以及太空中附近的接收器。这个被称为“MAPLE”的实验是加州理工学院太空太阳能电力项目的三重试验

黄仁勋：从天天扫厕所的少年到芯片大亨

他被称为硅谷最好斗的人，“AI教父”。他是莓国芯片公司英伟达的创始人、老板。2021年时拥有118亿美元财富。业内有“工作狂”之称，在他看来，“工作”这个叫法是不正确的，他认为自己每天都在玩。他认为，消费者并不关心

(06.04)这个赛道2022年的整个融资总额依然是高...

第四大技术革命。人工智能量子计算、生物技术，这些作为三大技术革命我觉得好像是非常的明确了，就是不太会有太大意外的感觉。但是第四个技术革命是脑机接口这个事，刚说的时候我是脑子里过了一下，想了一下未来的可能场景，因

「续航篇」2023年手机选购指南

首先我们来复习一下上一篇的内容。手机续航主要是看两方面，一个是电池容量，一个是处理器功耗。想要续航出色两个方面缺一不可。安卓：电池容量至少要4500毫安时。处理器挑选一些功耗低或者能耗比高的处理器。例如高通这边

五月已过，网约车平台降低抽佣了吗？交通部文件，又成一纸空文？

四月份，交通运输部等部门，发了文件，要求网约车平台对定价和抽成问题做出调整。根据原定的要求，5月底之前，网约车平台要基本完成，降低过高抽成比例上限的有关工作。交通部四月份的文件现在已经六月了，不出意料的，所有平台没有

英国开展“闪电外交”，伦敦拟成立AI全球监管中心

人工智能（AI）的进化速度远远超出了预期。人们越来越担心，一旦失控，这项技术可能会给人类带来灾难性风险。同时，各国也在争相摸索监管标准和尺度，希望在规范发展的同时不损害其创新。英国政府率先开展了一轮“闪电式外交”。

经典创建型设计模式：工厂方法模式

意图工厂方法是一种创建型设计模式，它为超类提供了一个创建对象的接口，但允许子类改变将被创建的对象的类型。问题想象一下，您正在创建一个物流管理应用程序。您的应用程序的第一个版本只能处理卡车运输，因此大部分代码位

三大运营商之一，中国联通一直垫底，原因是什么？

中国联通是我国三大运营商之一，拥有庞大的网络基础设施，包括全国最大的光缆网络、融合通信网络、移动通信网络和互联网数据中心等。它的经营管理水平也相当不错，但相对于其他两家运营商，中国联通一直处于垫底，无法发挥其潜

企示录｜马斯克会面曾毓群，双方都想吃“硬菜”

重回首富的马斯克，在中国留下巨大投资想象空间。5月30日至6月1日，特斯拉CEO埃隆·马斯克，这位全球商业明星一场访华之行贯穿了政、商两界。就在马斯克到中国的第一天，网络平台便流传出他与曾毓群的会面照片。宁德时代目前

浙江嵊州聚力打造“万亩千亿”新产业平台

本报讯陈荣记者沈贞海报道近年来，浙江省嵊州市加快布局新能源、新材料、生命健康、新一代信息技术四大新兴产业，其中以比亚迪新能源动力电池为龙头的新能源产业发展势头最为强劲。嵊州市因势利导，着手规划新能源装备

快播公司破产注销

据天眼查App显示，近日，深圳市快播科技有限公司发生工商变更，企业经营状态由吊销未注销变更为注销，注销原因为宣告破产。该公司成立于2007年12月，法定代表人为于璐，注册资本1000万人民币，现由张克东、于璐、刘燕三人共同持股

云南干旱，为何广东更着急？这些年全球的异常高温，究竟是为什么

一、引言随着气候变化的加剧，全球范围内的气候异常事件日益频繁，其中之一就是异常高温。云南干旱成为了一个现实问题，而广东则因此更加着急。本文将探讨全球异常高温现象的原因，以及为何云南干旱导致广东的担忧。二、全球

裁掉中国团队，却在越南建立研发中心，外媒：美芯巨头开始反抗了

声明：原创不易，禁止搬运，违者必究！在中国市场上，有不少的外企在国内市场深耕多年，并且也赚取丰厚的利润。随着我国科技不断发展，不断打破技术的壁垒，这让美国大为恼火，可以说是大打出手，美国不断升级对我国半导体行业的限制，这也

上滑加载更多 ↓

推荐阅读：

全频喇叭能做低音炮喇叭吗-专业喇叭厂家

总投资387.3亿元！秦皇岛市二季度143个重点项目集中开工

煤炭开采行业分析：至暗时刻已过，或将黎明破晓

疝气会影响生育吗？#健康科普知识

华为WATCH4 Pro蔚蓝地球是唯一选择？绿厂同级别手表体验

天涯社区暂停访问后，20多年的用户数据怎么办？

开篇：机械手设计挑战-仿人机器人设计领域上的高峰

不是五菱不够好，而是长安实在太强，击穿行业底线，E-star成

最新！昆明二手房6月数据出炉！你猜跌幅最大的小区是哪个？

苹果公布 iOS 16 安装数据多达 90% iPhone 已使用

友情链接：

更多：

本站资料均由网友自行发布提供，仅用于学习交流。如有版权问题，请与我联系，QQ：4156828

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top