降低大模型幻觉百川发布Baichuan2-53B

北京日报客户端 | 记者孙奇茹

9月25日，王小川创立的百川智能发布Baichuan2-53B 闭源大模型，全面升级了此前发布的Baichuan1-53B的各项能力。技术人员称，Baichuan2-53B不仅数学和逻辑推理能力提升显著，还通过高质量数据体系和搜索增强极大降低了模型幻觉，是目前国内“幻觉”问题最低的大模型。

幻觉是大模型落地应用必须跨越的鸿沟。所谓“幻觉”问题，体现在大模型会编造事实，用看似流畅自然的表述方法给出不符合事实甚至错误的内容，“一本正经地胡说八道”，例如给出根本不存在的法庭辩护案例、为某个典故编造不符合实际的历史解释等。行业人士介绍，大模型只能基于模型训练中的阶段性的死板的知识储备进行表现，是导致其出现幻觉的重要因素。通常而言，解决这一问题有两种方式，一种是不断增加模型的数据规模、提升数据质量；另一种是通过调用搜索等外部工具让模型能够获取实时信息。

据悉，Baichuan2-53B在两个方面均做了大量优化。高质量数据构建方面，Baichuan2-53B独创了一套数据质量体系。以低质、优质为标准将数据进行分类，确保Baichuan-53B始终使用优质数据进行预训练。

信息获取方面，Baichuan2-53B对多个模块进行了升级，包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令，精确驱动查询词的搜索，最终结合大语言模型技术，优化模型结果生成的可靠性，实现更精确、更智能的模型回答结果，减少模型幻觉。

Baichuan2-53B与GPT-3.5在回答部分问题上的表现差异

据悉，百川智能于2023年8月8日发布Baichuan-53B搜索增强大模型。大模型的数学和逻辑推理能力一直是业内的关注焦点，也是评价一款大模型是否领先的重要指标。在Baichuan-53B的基础上，Baichuan2-53B不仅重点强化了以上两个维度的能力，并且对整体能力进行了全面升级。其中，逻辑推理能力提升100%，数学能力提升31%，语言理解能力提升29%，文本创作提升18%，知识问答提升9%。

作为首批通过《生成式》《生成式人工智能服务管理暂行办法》备案的大模型企业，百川智能此次还开放了Baichuan2-53B的API接口，正式进军企业级市场，开启商业化进程。

图片来源：百川智能

展开阅读全文

页面更新：2024-02-21

标签：幻觉模型逻辑推理指令事实体系能力数学智能数据

1 2 3 4 5

降低大模型幻觉百川发布Baichuan2-53B

（科技）中肯联合发布肯尼亚首部国家植物志

专精特新看中国丨“独门秘笈”怎样炼成？

创新赋能：湖南高速工程公司郴州养护钢渣-胶粉基极薄抗滑层试铺成功

河南郑州：“数智”赋能打造“智慧”生活

大兴经开区将添一处虚拟制作创新中心

中国电信“黑科技”亮相第六届中阿博览会数字经济展

当制造“智能”后，工人工位在哪儿？

为“上门经济”守好“门”

（社会）2023全球滨海论坛会议在江苏盐城举行

中国移动李慧镝：融合创新，点燃未来

从央视一哥到阶下囚，被亲女儿曝私生活混乱，方宏进的堕落之路

震撼眼球的28张照片，一张比一张精彩，既罕见又迷人

虞书欣分享米兰随拍秀小蛮腰耳环吸睛风格百变

恭喜！49岁张震岳办隆重婚礼，老婆美丽动人喝酒跳舞，儿子已5岁

博主就诽谤言论向杨颖道歉

当制造“智能”后，工人工位在哪儿？

华为首款黄金智能腕表国内正式发布

旅游消费趋势数据：超九成受访者出游意愿强烈

中国工程院院士谭久彬：要努力建设一流的仪器产业和一流

美国NIH坚持要求外国合作者共享原始数据

媒体人：乔帅这场终于放下了傲慢和固执事实证明还是球

麦穗丰：男篮无奈摆出三后卫阵容弥补前锋处理球能力不

申一方｜从亚像似符理论看人工智能艺术生成趋势

投资者说：“强应用+多模型”时代已经到来

有这么“清醒”的徒弟，事实证明，赵本山一片良苦用心没白

降低大模型幻觉 百川发布Baichuan2-53B

降低大模型幻觉百川发布Baichuan2-53B