千问Qwen发布PLaw Bench:为法律AI模型提供专业测评标准

2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。

据了解,PLaw Bench基于大模型面对的法律实务咨询场景的现实,模拟真实的咨询场景,并通过三大任务模块和特定的判分标准,来测评大模型的实际法律能力。同时,Plaw Bench的文书生成板块并未止步于格式规范,而是将重点放在案情归纳、策略选择、程序意识等核心诉讼实务能力的考察上。在数据集构建上,为了确保评测的公正与高效,我们邀请了39位法律专家对850道题目完成三轮交叉质检,并通过API调用了多款主流大模型进行作答。

此外,对法律从业者而言,在使用AI辅助办案时,不应盲目追求“最强”的通用模型,而应根据具体工作场景来选择在该项任务上表现最佳的“专家”模型。

展开阅读全文

更新时间:2026-02-09

标签:科技   模型   标准   法律   专业   场景   实务   团队   能力   专家   阿里巴巴   高效   案情

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top