云知声发布“山海”通用大模型,称目标年内通用能力比肩ChatGPT|钛快讯

云知声创始人、CEO黄伟(来源:受访者提供)

钛媒体App获悉,5月24日下午,国内 AI 语音独角兽云知声在北京发布GPT产品“山海”大模型(UniGPT)。

据介绍,“山海”大模型参数量达千亿级,支持语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力。云知声将以山海大模型为基础,打造MaaS(模型即服务)模式的AI 2.0解决方案,并在增强物联、医疗等场景领域提供 AI 技术产业化商业能力。

云知声创始人、CEO黄伟表示,“山海”大模型的发布是云知声AGI(通用人工智能)技术架构升级的重要里程碑。未来,云知声还将持续升级其大模型能力,目标是2023年内通用能力比肩基于GPT-3.5的ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT-4。

会后,黄伟对钛媒体App表示,相比上一轮 AI 技术强但难商业落地等问题,此次GPT大模型具备了一定的商业化能力。2月底第一版山海测试时,已经有很多医疗、物联网、汽车领域客户找到他们寻求大模型使用和对接。不过他也坦言,“山海”才刚刚发布,可以做到60分,尚未有大规模的模型商业化案例。

“今天我们的能力和5个月之前有天翻地覆的差别。我们把一个能力更强的产品放在系统平台上,至于销售和服务,从商业角度来说,今天才刚刚开始,从接触新技术到最终(采购)是需要时间的。”黄伟表示,随着大模型的出现,AI 技术从1.0到2.0发生了质变。

据悉,云知声成立于2012年,是国内为数不多的拥有智算平台、智能交互、行业知识图谱等全栈 AI 技术及芯片级优化能力的 AI 领域独角兽公司。公司基于 AI 技术产品能力与行业应用场景深度结合(U+X)战略,聚焦智慧物联与智慧医疗两大领域,提供以对话式 AI 技术为基础的产品服务与综合解决方案。2019年,云知声营收为2.19亿元。(详见钛媒体App前文:《云知声创始人黄伟:AI 公司未来能否解决亏损难题?》)

截至目前,云知声已拥有超过2万家行业客户与开发者,其中包括华为、美的、京东、北京协和医院等多家公司和机构。投融资方面,云知声已完成超过六轮融资,投资方包括京东、奇虎360、高通创投、中国互联网投资基金、中金公司、启明创投等机构,目前云知声公司估值接近100亿元。

2022年11月,ChatGPT横空出世,迅速风靡全球,发布仅5天注册用户就超100万。而黄伟团队也看到了新一轮 AI 浪潮与机遇,于去年底组建团队打造云知声“山海”大模型。黄伟在演讲中指出,云知声并非从零开始做大模型,而是过去十年积累了大量算法、数据、工程落地经验,今年2月底就研发出第一版“山海”大模型。

“去年12月第一次看到ChatGPT的时候,是我创业10年里面最灰暗、心情最沮丧的时刻,因为当时我们没法出差、身体又不适,而且合作伙伴也因身体不适没有给我们回款,所以2023年工作计划也没法做,这些是外部要素。但当我看到ChatGPT表现出几乎100%的理解能力,以及前所未有的涌现能力之时,瞬间觉得我们这些理工男在过去积累的所有技能技巧没有价值了。我经历了挫折、沮丧,并一星期研究ChatGPT技术之后,最终发现好像没什么,我认为云知声也可以做这件事。”黄伟表示。

如今,“山海”大模型完成多轮优化升级,拥有超过十项技术能力。黄伟在现场以语音输入、实时互动方式,演示大模型语言生成、语言理解、知识问答、逻辑推理、代码等技术能力。例如,回答“以黄伟身份写云知声大模型的感谢信”、“高考满分才750,怎么才能考985”等问题时,都能得到较为合理的内容反馈以及解决方法。

钛媒体App还发现,当被问及“234乘345加上456,然后开根号等于多少”这一数学问题时,云知声“山海”大模型输出的答案过程,比基于GPT-4的ChatGPT更加准确。

上面是山海大模型回答,下面插入的是ChatGPT输出的错误答案

黄伟表示,“山海”大模型在语言理解方面能够理解复杂的思想,能结合上下文、常识和知识,深度理解语句的真实意思及其中所蕴含的情感,而在逻辑推理、数学、代码三项能力中,实现了思维链能力。此外,“山海”大模型还拥有插件的联网功能,输出实时的天气、体育信息,以及安全合规能力等。

行业方面,云知声在发布会上展示医疗、销售、知识管理、教育和智慧物联五个场景的应用能力:

仅在医疗领域,黄伟称,基于MedQA评测,“山海”大模型的81.56%评分,超过了GPT-4的71.07%,以及GPT-3.5的40.31%,而在临床执业医师资格考试中也达到了511分,超过了平均值。

黄伟会后表示,过去 AI 技术强,只是强在鉴别能力,但坦率说那个并不是一个真正的认知智能,所以过去10年间行业处于一种 AI 1.0时代,能力相对有限,很难去创造价值。而今天的大模型具备一种前所未有的新能力,能更好满足客户需求,比如营销沟通管理、点菜订菜等场景的深度理解能力,他相信这个一定是能够创造更多的商业价值,也会产生更多商业机会,“我们客户可能就会更加为此去买单。”

对于大模型算力,黄伟公布了大模型底层拥有Atlas弹性算力工程,拥有近200P(1P=1024T)的算力,支持动态分配弹性扩容。黄伟告诉钛媒体App,目前算力限制是国内所有研发 AI 大模型企业面或多或少面临的问题,而云知声此前很重视算力建设,如今在算力储备方面相对来说是比较好的。

此外,发布会当天,云知声还与中建电子、京东科技、360公司达成战略合作,以及与更多公司展开深度合作,推动山海大模型在各领域的落地应用。

黄伟对钛媒体App表示,云知声会在今年下半年(年底之前),把基于“山海”大模型的车载、物联和医疗产品方案,尽快在已有的客户中进行快速升级。他提到,云知声和360公司的合作,更多是在某些网络安全领域里面做一些合作支持,并没有产品冲突,且现在还没有到大模型竞争阶段。

“大模型的出现不是偶然,是必然,云知声的过去十年,就是为山海而生!这只是刚刚开始,让我们共同期待云知声未来的无数个十年。”黄伟25日凌晨在朋友圈这样写道。(本文首发钛媒体App,作者|林志佳)

展开阅读全文

页面更新:2024-03-29

标签:模型   能力   快讯   年内   场景   目标   领域   客户   医疗   媒体   产品   技术   公司

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top