用7zip论高低抹黑龙芯 英特尔被殃及池鱼

一直以来,龙芯就在饱受争议中负重前行,十多年前就给汉芯背锅,直至今日依然有网友分不清龙芯和汉芯。之后,指责龙芯性能不行,生态不行的声音就从没消停过,友商甚至在试点单位游说龙芯性能不行,甚至还有友商宣称,凡是有龙芯电脑的地方都免费送X芯电脑。近年来,龙芯CPU的性能越来越好,生态建设也初具雏形,市场表现在国产CPU中非常出色。因而抹黑龙芯的手段也越来越有迷惑性。

用7zip论高低抹黑龙芯 英特尔被殃及池鱼

CPU性能要综合考虑

评价CPU性能必须考虑应用的多样性,比如科学运算重视双精浮点性能,但是如果数据供不上,运算能力再强也没用;再比如计算中心多任务环境关注的是吞吐率......因此单纯用某一个指标来衡量CPU性能是不科学的,必须综合考量。

业界也推出了很多基准测试程序,比如针对CPU的SPEC,针对嵌入式应用的EEMBC等。SPEC测试是比较权威的测试程序。和一些黑箱测试程序调整计分方式和计分权重后测试结果就发生变化不同,SPEC测试到底跑了什么程序,以及各项程序跑分和计分方式全部公开透明,而且覆盖范围广——SPEC2000有12个定点程序,14个浮点程序,而且有比较强的代表性,比如gzip、vpr、gcc、mef、eon等。而SPEC2006则把定点程序扩展到14个定点程序和16个浮点程序。

在计分方法上,SPEC在计分上采用归一化的几何平均方法来进行综合性能评估——将不同CPU的执行时间与参照对象相比较后得到一个相对值。SEPC2000的参照对象是Ultra SPARC 2工作站的主频为300Mhz的CPU。如果运行测试程序1的时间是参照对象的十分之一的话,测试就是1000分,测试程序2的耗时是参照对象的八分之一的话,则为800分.....最后再算几何平均——比如SEPC2000有12个定点测试,就将12个测试成绩相乘再开12次方。

不过SPEC也非尽善尽美,测试存在容易受编译器影响的问题。举例来说,SUN曾经通过编译器优化提升SPEC跑分50%,龙芯的某一代产品也曾用自主研发的LCC编译器,比使用GCC定点跑分提升了60%。另外,即便同样是GCC编译器,不同版本的GCC编译器下,测试成绩也会有很大差异。笔者认为,出现这种现象的根源并非SPEC测试的缺陷,反而用事实说明了,最后的用户体验是软件+硬件的结果,充分说明了软硬件磨合的重要性。

可能有的读者对不明白什么是编译器,在此说明一下,程序员在编程的时候写的是编程语言,但是计算机运行的时候是机器语言,编译器就是将程序员的编程语言翻译成机器语言的工具。编译器并不是什么非常高尖端的东西,龙芯和申威在十多年前就有自己的LCC和SWCC编译器,但从来没用这个玩营销。至于个别厂商把编译器宣称的如同玄学,用于营销和贴金,铁流只能呵呵了。

虽然SPEC测试并非尽善尽美,但地位有一点像高考,是目前普遍公认,也是比较权威的测试。

个别网友抹黑龙芯不遗余力

此前,个别网友在贴吧等平台抨击龙芯,先是伪造数据声称龙芯3A4000主频只有1.6G。之后又伪造SPEC06测试成绩声称龙芯3A4000只有12分。在此前深度大会上,同方的龙芯3A4000电脑没有接显示器,然后个别网友就声称龙芯3A4000存在重大问题见不得光。然而事实却是,同方龙芯电脑搭载的是中标麒麟系统,因而不好意思在深度大会上接显示器。最近,这些网友又拿7zip测试攻击龙芯性能不行。

事实上,只要对英特尔、AMD之争的历史稍微有一点了解的就会知道,拿7zip测试论高低是非常不靠谱。AMD的FX6300 7zip测试就与英特尔I5 3570K相当,但实际上,FX6300实际用起来还不如I3。

下图中,蓝色的为英特尔 3770K,红色的是FX8350,FX8350的7zip测试成绩已经超越了3770K,但稍微对CPU硬件有一点了解的网友,都不会认为FX8350在性能上超越了3770K。毕竟,当年还是英特尔独孤求败,I3秒杀AMD全家的时代。

用7zip论高低抹黑龙芯 英特尔被殃及池鱼


可以说, 7zip测试论高低是明显站不住脚的。CPU必须考察全面性能,而在当下最靠谱的测试就是SEPC。龙芯3A4000(2Ghz) Spec06 base接近20分,peak到21+分,而且这还没怎么优化,256位向量没有发挥出优势的成绩。这个成绩已经超越了国内这些16nm的ARM CPU。就CPU核来说,龙芯GS464V已经接近AMD第一代Zen,达到10/G的水平。

用7zip论高低抹黑龙芯 英特尔被殃及池鱼

龙芯依靠自己的设计能力,在制造工艺明显落后的情况下,在性能上反超,这足以说明龙芯在CPU设计上的深厚功力。

展望龙芯3A5000和3A6000

随着12/16nm工艺流片费用下降,以及龙芯这几年营收的增长,龙芯也有能力采用12/16nm工艺流片。参考龙芯3A2000到龙芯3A3000工艺升级的进度,龙芯3A5000的进度也会比较快。根据现场发布的PPT,龙芯3A5000将在2020年中流片,最迟年底前就会有成品。

必须说明的是,3A4000的工艺是28nm,潜力很大,换12/16nm工艺提升主频就能把单核性能提升到25分——龙芯3A5000对内核小改后,换12/16nm工艺,性能有望达到25至27分,龙芯PPT里30分的规划偏乐观。

据小道消息称,龙芯已经着手规划3A6000,其CPU核争取接近或赶上英特尔的skylake,主频目标是3Ghz。不过,由于龙芯走的是自主研发道路,加上人少钱少,自然会比那些技术引进的ARM CPU的研发进度慢,3A6000问世恐怕要2022年以后的事情,大家不必在当下对3A6000抱太大期待。

用7zip论高低抹黑龙芯 英特尔被殃及池鱼

从龙芯的发展历程看,可以很清晰的看出一条CPU迭代演进和IPC提升的轨迹。龙芯选择一代提升微结构,一代提升工艺,2012年以前的龙芯3A1000和龙芯3B1500,其IPC为3/G左右(定点),2015年的3A2000是微结构升级,IPC为6.5/G,2016—2017年3A3000是小改微结构后升级工艺,IPC为7+/G,2019年的3A4000是微结构升级,IPC则达到了10+/G。

这种一步一个脚印的发展轨迹,是国内那些宣称自主研发的ARM CPU所不具备的。那些技术引进的ARM CPU,第一款产品往往是横空出世,之后IPC多年提升有限,这种现象与其宣称是完全自主研发、自主可控是存在一定出入的。一些ARM CPU采用先进工艺后,在性能上反而被龙芯用老旧工艺反超,足以说明自主研发虽然道路更加坎坷,但发展后劲更足。

用7zip论高低抹黑龙芯 英特尔被殃及池鱼

展开阅读全文

页面更新:2024-02-26

标签:英特尔   同方   微结构   殃及池鱼   技术引进   浮点   编译器   主频   进度   自主   性能   成绩   工艺   测试   程序   网友   财经

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top