国内7家大模型测评：生成内容标识较完备，信息披露仍不足

9月13日，阿里云宣布通义千问大模型已首批通过备案，并正式向公众开放。8月31日，11家大模型正式通过备案。目前已有包括百度文心一言、智谱AI智谱清言、科大讯飞星火大模型、商汤商量、百川大模型（53B）、MINIMAX、360智脑以及抖音豆包等多款大模型，开放用户服务。

为了评估这些产品的信息披露透明度，日前象信AI对上述除360智脑、通义千问的七家国内厂商公开披露的信息进行了详细分析，并与国外厂商OpenAI进行了比较。该评估覆盖了5个主要维度和12个具体测评项。这些维度和测评项包括：用户权益保护，数据处理，模型运作，部署方式以及算力。

根据测评结果，相比起OpenAI，国内大模型对安全、算力、能耗、数据的信息披露比较差，这表明大模型厂商还有待改进。

具体而言，此次信息披露透明度的测评方法内容主要来自各个大模型的用户协议，测评依据参考了《生成式人工智能服务管理暂行办法》，《中华人民共和国个人信息保护法》，欧盟《人工智能法案》草案，Stanford CRFM，《互联网信息服务深度合成管理规定》。

在测评中，重点考察了大模型是否披露将用户对话数据用于大模型训练；数据来源；发现违法内容时的处理措施和整改过程；是否对大模型生成的内容进行标识等问题。

象信AI横向对比了国内外多家大模型厂商。根据测评结果，在总体得分中，GPT-4的得分最高，总分48分取得了28分。文心一言、智博清言的得分次之，分别取得了15分。

此外，在具体的测评项目上，国内外大模型在用户数据、生成内容标识两方面均做得较好。国产大模型在生成内容标识方面的披露优于GPT-4。然而，国内大模型厂商在训练数据治理方面的披露严重落后于GPT-4，在信息披露方面还存在较多提升的空间——尤其在数据治理、模型来源、能力与局限性、风险防范、性能测评、安全测评等测评项中。这些测评项目里存在对用户隐私、数据质量、性能可信度以及安全等多方面的担心。因此，提供更全面、清晰和透明的信息披露将有助于用户更好地了解和信任大模型。

在本次评估过程中，观察到所有国内大型模型厂商均会利用用户对话数据进行模型训练。然而，这些厂商未提供任何机制，以允许用户拒绝其数据被用于训练目的。例如，某国内大模型厂商的用户协议中的披露：

你理解并同意，对于你通过本软件及相关服务输入、生成、发布、传播的信息内容之全部或部分（合称信息内容），你授予公司和/或关联方一项免费的、全球范围内的、永久的许可，允许公司和/或关联方可以使用你提供的信息内容来优化模型和服务。上述许可是可以转让的，也是可以进行分许可或再许可的。

但在OpenAI的隐私政策中，不但明确指出会使用用户对话数据用于训练模型，还提供用户拒绝其数据被用于训练目的的方式。

如上所述，我们可能会使用您提供给我们的内容来改进我们的服务，例如训练ChatGPT的模型。有关如何选择不使用您的内容来训练我们的模型的说明，请参阅此处。

最后，本次测评全部大模型厂商在版权数据、能耗方面总分是0。不提供版权数据的信息可能导致不合规的情况，特别是涉及知识产权的合规性。在数据中心的能耗持续攀升的背景下，认知和改善大模型的能源消耗变得至关重要，而缺乏能源消耗数据的信息披露，这可能导致模型的可持续性和环境影响问题。

采写：南都记者胡耕硕

展开阅读全文

页面更新：2024-02-18

标签：标识模型目的内容维度信息内容完备得分厂商国内数据用户

1 2 3 4 5

国内7家大模型测评：生成内容标识较完备，信息披露仍不足

新证据！网攻西工大的神秘黑客身份被锁定，“间谍软件”是关键！

第18届世界水资源大会发布《北京宣言》呼吁共享治水经验

阿里公益致信全体阿里人，坚守“人人公益3小时”誓约

2023江苏省“全国科普日”系列活动来了：首届江苏省青少年科创教育成果博览会即将举办

防尘网未固定飞到高铁接触网上，致6列动车组晚点1小时5分钟法院：赔偿铁路部门3.2万余元

中秋国庆假期前七日，贵阳三大火车站累计客发量创历年同期新高

山东多市出台公积金新政！枣庄执行…

关于延续实施中国邮政储蓄银行三农金融事业部涉农贷款增值税政策的公告

乐游津城新潮玩法新鲜体验

497家医疗企业一年销售费用为3248.91亿元，平均每家公司花费约6.54亿元

凌文院士为第二届全国博士后创新创业大赛打call

“村网共建”服务乡村“零距离”

快递价格战今年没停过？淡季同质竞争激烈，四季度或将量价齐升

150家重点景区接待142.2万人次

果然视频-家国梦：从煤炭村到旅游村，振兴小镇打造了乡村元宇宙

秦淮数据张炳华：拥抱AIGC时代数据中心需具备五大能力

中秋国庆假期国内旅游8.26亿人次旅游收入7534.3亿

《星空》Steam国区热销榜降至70名！国内热度爆降

V社庆祝Steam上线20周年，为首批注册用户颁发20周年勋章

北京市商业服务业技能大赛收官，中式烹调师项目增冷菜拼

华为5.5G可支撑XR、AI等业务需求、在B站发布AI生成

易事特：公司更多将自产钠离子电池应用于UPS、EPS、数据

苹果每年少赚数十亿美元！数据线MFi认证恐将不复存在

MAYA是顶尖的三维动画制作软件，内容全面功能强大，提高动

广电总局：年底80%有线电视用户可开机看电视直播频道