史上最强的图像生成器来了，这次不仅更逼真，甚至还会写字

那个和 Midjourney 打得难舍难分，引发了一波买显卡 “ 炼丹 ” “ 炼妹子 ” 风潮的 Stable Diffusion ，又推出船新版本了。

就在昨天晚上， Stability AI 在官网来了一波更新，预告了一波 Stable Diffusion 3 。

根据介绍，新版本在多主题提示、图片质量还有文字渲染能力上都进行了次大升级，模型参数量在 800M-8B 之间，并且延续了他们家一如既往开源的优秀传统。

更重要的是，它和 Sora 一样当起了维新派，摒弃了业内常用的 U-NET 架构，加入 Transformer 和 Diffusion 结合的大家族。

而具体的原理和进步啥的，看不懂没关系，咱们过会儿再聊。

直接先来一波全新的高清无码大图，让大伙们见识下 Stable Diffusion 3 的斤两。

其中文字渲染能力，是这次 Stable Diffusion 3 比较突出的一个亮点。

因为不咋识字儿、不怎么会写字儿，可以说是目前文生图、文生视频的通病了。

就拿世超用 DALL·E 3 生成的 “ Chaping 青花瓷 ” 为例，上面汉字不明所以。。。最重要的 " Chaping " 还拼写错了。。。

基本上可以说自 AI 画图不会画手之后，把文本渲染成图像里准确的文字，也是个难题。

而新版本的 Stable Diffusion ，文化水平就明显高了不少。

根据官网给出的案例，给它提示词是 “ 一辆跑车的夜间照片，侧面写着 ' SD3 ' ，汽车在赛道上高速行驶，巨大的路标上写着 'Faster' 的文字 ” 。

生成的图片不但符合描述，文字的位置也没毛病，字体也很清晰。

但当我们用同样的提示词在 DALL·E 3 生成的时候，文字渲染效果就有些一言难尽了。

Faster 倒是没错，但侧面的 SD3 没有一张图是准确的。

还有这张， Stable Diffusion 3 生成的是这样的。

而 DALL ·E 3 连 incredible 都没拼对。

只不过，现在目前的文字渲染暂时只支持英文，中文还得等上那么一段时间。

再来看这次 Stable Diffusion 3 的另一大更新——多主题提示，大伙儿可以把这个理解成， AI 在生成图片的过程中漏没漏提示词。

举个例子，这张图的提示词里，大致包括了宇航员、穿着芭蕾舞短裙撑着粉色雨伞的猪、戴着礼帽的知更鸟、还有角落里的 “Stable Diffusion” 几个关键。

咱先不提图片的质量如何，但该生成的东西起码 AI 都没落下。

不过有意思的是，在这条推文下有网友把同样的提示词，分别喂给了 Midjourney 、 DALLE-3 和 Bing 。

看下来， DALLE-3 、 Bing 和 Midjourney 要不就是知更鸟少了帽子，要不就是 “Stable Diffusion” 单词拼写错误，没一个能打的。

最后，是文生图模型最为关键的图像质量。

Stable Diffusion 3 也是人狠话不多， po 了一张这样的图片。

世超第一眼看到的反应：这难道不是照片？？？

手帕上的纹理还有老虎刺绣，未免有点过于逼真了吧。。。

还有这张苹果，也是能以假乱真的程度。

而之所以 Stable Diffusion 3 这次能有这么大改变，很大可能要归功于一个跟 Sora 同源的架构。

以前的 Stable Diffusion ，一般都是用 U-net 架构 + Diffusion 扩散模型。而 Transformer ，也多是用在像 GPT 类大语言模型上，两种技术各管各的。

而 OpenAI 则觉得 GPT 这把咱用Transformer 打赢了，就不改 banpick 了吧。。。于是就把Transformer 架构和 Diffusion 结合了起来，用在视频上，一顿魔改和大力出奇迹后，就整出了 Sora 。

Stability AI 团队也是英雄所见略同，把Diffusion Transformer （简称 Dit 架构）用在了 Stable Diffusion 3 上。

有意思的是，关于 DiT 架构的论文是 AI 大佬谢赛宁和 William Peebles 一起写的。

这个 William Peebles ，正好是 Sora 团队的负责人之一。

Stability AI 的老板 Emad 也在 X （推特）上表示，这次确实用到了和 sora 类似的技术。

另外，这次 Stable Diffusion 3 还用到了一个 Flow Matching （流匹配）技术。

因为技术原理过于复杂，咱们可以简单理解成，这是一种用来训练扩散模型的方法。

如果把扩散模型比作魔法画笔，那这个流匹配的作用就是升级画笔，让画笔可以更快、更准确地画出你想要的东西。

世超估计也正是因为这个技术， Stable Diffusion 3 的文化水平才暴增的。

总而言之，光从现有的官方效果图和技术公开来看，这次 Stable Diffusion 3 的出现，又把文生图卷到了一个新高度，也证明了 Dit 架构在文生图、文生视频领域确实是个可行的新方向。

反正这么下去，保不齐下一波谁家又会拿出重磅更新。

不过大伙儿也别太焦虑，该吃吃该喝喝，要是有时间学学怎么用 AI 也行。

最后提个醒， Stable Diffusion 3 现在还没正式公测，千万别又让卖课的给骗了。

展开阅读全文

页面更新：2024-03-02

标签：知更鸟生成器画笔逼真侧面架构最强模型图像提示文字质量图片技术

1 2 3 4 5

短视频：是消遣还是毁灭？

短视频：是消遣还是毁灭？嘿，各位小伙伴，你们有没有觉得生活里好像少了点什么？好像那种“刷刷刷”的短视频占据了我们越来越多的时间，甚至让我们忘记了什么是真正的“生活”。就在不久前，有位网友提出了一个让人惊醒的观点：“

爷青回，魅三剑客回归？21 Pro开启预热丨马斯克吐槽win11

今天魅族科技宣布，29日的魅族特别活动，杨颜将会担任特邀演讲嘉宾出场，这也让不少老魅友直呼爷青回。曾经魅族三剑客，白永祥负责产品，李楠负责营销，杨颜负责Flyme，在魅族历史上可以说留下了浓墨重彩的一笔。不过当年黄章曾经

中国脑机接口团队紧密对标马斯克公司，自研核心技术成趋势

在Neuralink公司创始人马斯克公布了脑机接口的最新进展后，中国团队也火速跟进，宣布了在脑机接口领域的最新突破。2月26日A股开盘后，脑机接口概念股应声上涨，截至中午收盘，汉威科技（300007.SZ）股价上涨近2%，三博脑科（301293.SZ）

使用什么显卡的玩家最多？

虽然网络上面人均4090事实真是如此吗？在steam显卡使用率排行榜中排名第一是rtx3060，目前来看这张显卡性能依旧充足，1k画面下没有任何压力，当时这张显卡价格在5000左右，现在只需要1600-2000就能拿下第二名则是gtx1650，性能

大消息传来！事关华为、中兴通讯

刚刚，一则好消息传来！在欧洲市场，华为、中兴迎来一则好消息。据参考消息报道，西班牙有关方面日前明确表示，不会把华为、中兴列入“黑名单”。西班牙数字化转型大臣埃斯克里瓦称：“西班牙无意制定高风险供应商名单，欧洲也没有

董宇辉称非常多电子、家居、化妆品厂家愿提供低价：之前没有过多提及，是不想倡导大家过度消费

2月25日，与辉同行直播间调整产品线，首次开启小家电专场。据飞瓜数据显示，25日其直播间销售额近5000万元，仅洗地机一款单品销售额接近2500万，卖空了厂家所有现货。董宇辉在直播中还透露，目前有非常多的电子、家居、化妆品等

阿里重返中国顶级电商轨道：引领电商新潮流，还是重蹈覆辙？

阿里巴巴，这个曾经在中国电商市场掀起巨浪的巨头，如今再度引发社会热议。近日，阿里巴巴主席蔡崇信在接受CNBC专访时宣称：“阿里已重返中国顶级电商企业轨道。”此言一出，立即引起了广泛关注和讨论：这是否意味着阿里巴巴将再

退休后，拉开人与人距离的不是养老金，有远见的人都做好了五件事

时光荏苒，一晃我们都到了退休的年龄，退休后的生活安逸，祥和。因为每个月都有不菲的养老金，我们也被戏称为最幸福的人群。但是有的人还在为养老金的多少而焦虑，这是不智慧的行为，真正拉开人与人距离的是这五件事。大家品鉴。

讨嫌！男子在丽江租老房改造成私人小院，走红后遭人破门闯入拍摄...

近日，云南丽江，有博主发布视频称，过年期间，多人来到自家的小院拍摄“日照金山”美景。但有游客闯入后，对小院造成了破坏。25日，记者联系上该博主。他介绍，自己是湖南人，去年3月，他和朋友们在玉龙雪山下租了一个老房子打造成了

吴晓求：点透不可说透，纪鹏讲话总是不给体会的机会

在中国资本市场30年理论与实际研讨会上吴晓求、刘纪鹏、贺强、王国刚、胡逾越、林益相、王兴等七位专家参与了现场讨论会，现场气氛极其活跃。发言更是极其直接。贺强认为股票市场是人民的市场，应该具有人民性。大家应该

2024年或许比去年更难熬，新时代，没有稳定工作的人要做两手准备

2023年我国经济形势并没有预测中快速回温，2024年预计更加难熬。科技的发展让我们迎来了新的时代，也让就业形势变的更加严峻。现在还没有稳定收入的人群一定要注意做好准备，不然未来的道路会十分坎坷。面对现在的局势我们

冤枉了！南京大火后续：预警人曾7次投诉均获回应，物业剪线除患

#我来唠家常#近日，南京雨花区明尚西苑大火事件一次又一次的登上热搜榜单，因为这次火灾事故造成了极其严重的后果：15死44伤！这个消息被曝光在网上后，一时间引发了广大网友的关注和热议。然而在得知起火原因后，全网的人都为此

宁德时代进行“人员优化”！

2月23日，宁德时代传出人员优化消息，行业内的汽车博主爆料称，蜂巢和中航等公司也有类似举措，这似乎成为了当前电池行业的普遍趋势。这种寒冬似乎突然袭来，令人不禁思考背后的原因。对此，一些网友提出观点称，新能源汽车的渗透

#海银财富#良退？

海银暴雷初期号称他们要良退，那什么是良退呢？良退有没有标准呢？客户认为的良退是100%拿到自己钱，而据经侦专班透露没有良退标准，他们不知道，随着时间的推移，大家终于发现海银的良退是只要他们逃脱罪责就是良退，用高于市场价2

迪王，周末大消息！

周末不停歇！在刚刚过去的25日，比亚迪连发多则大消息。 2月25日，比亚迪宣布，公司实际控制人、董事长兼总裁王传福提议，将公司回购股份金额由2亿元增加至4亿元。 2月25日，比亚迪旗下的弗迪电池发文表示，弗迪电池将把乘用车的

上滑加载更多 ↓

史上最强的图像生成器来了，这次不仅更逼真，甚至还会写字

短视频：是消遣还是毁灭？

爷青回，魅三剑客回归？21 Pro开启预热丨马斯克吐槽win11

中国脑机接口团队紧密对标马斯克公司，自研核心技术成趋势

使用什么显卡的玩家最多？

大消息传来！事关华为、中兴通讯

董宇辉称非常多电子、家居、化妆品厂家愿提供低价：之前没有过多提及，是不想倡导大家过度消费

阿里重返中国顶级电商轨道：引领电商新潮流，还是重蹈覆辙？

退休后，拉开人与人距离的不是养老金，有远见的人都做好了五件事

讨嫌！男子在丽江租老房改造成私人小院，走红后遭人破门闯入拍摄...

吴晓求：点透不可说透，纪鹏讲话总是不给体会的机会

2024年或许比去年更难熬，新时代，没有稳定工作的人要做两手准备

冤枉了！南京大火后续：预警人曾7次投诉均获回应，物业剪线除患

宁德时代进行“人员优化”！

#海银财富#良退？

迪王，周末大消息！

中国脑机接口团队紧密对标马斯克公司，自研核心技术成趋

名校博士“热卖AI课”被下架光明日报：技术面仍需冷思

突围能力最强的十位三国猛将，赵云排第三，吕布屈居第二

勇士不敌掘金，库里20分暨职业生涯常规赛技术统计数据排

看了孙颖莎陈梦流泪+马琳眼圈红了，才发现16岁张本已是

这次日本队派出了最强阵容就是想在主场完成复仇中国

看了孙颖莎陈梦流泪+马琳眼圈红了，才发现16岁张本已是

看了孙颖莎陈梦流泪+马琳眼圈红了，才发现16岁张本已是

20多家券商，紧急提示！

乌市疾控中心发布最新提示！