九游娱乐(中国)有限公司-官方网站-j9九游会真人Round 3:商品宣传图临了-九游娱乐(中国)有限公司-官方网站

j9九游会真人Round 3:商品宣传图临了-九游娱乐(中国)有限公司-官方网站

发布日期:2025-08-07 07:28  点击次数:153

j9九游会真人Round 3:商品宣传图临了-九游娱乐(中国)有限公司-官方网站

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

刻下,图像中的笔墨生成齐进化到这种进度了,仍是开源的。

通义模子眷属,刚刚又双叒开源了,此次是Qwen-Image——一个200亿参数、汲取MMDiT架构的图像生成模子。

这亦然通义千问系列中首个图像生成基础模子。

看Qwen-Image生成的画面就知说念,它主打的智商之一即是复短文本渲染。

像这张书店畅销书架的图片,包含复杂的图文夹杂布局,笔墨的准确度、契合度,致使于随竹素摆放角度变成的变化,齐挑不出来什么错。

生成海报,亦然不在话下。

照例,通义千问团队把模子、详备工夫叙述连气儿齐放了出来,Qwen-Image的智商也第一时刻上线QwenChat,刻下就能在官网上手体验。

实测Qwen-Image

Demo很优秀,实测成果又会若何?

Round 1:情境插画

测试教导词是:

李白站在窗前写“床前明蟾光”,窗外明月当空,在屋内投下轻柔的光芒,书桌上有酒和竹素,整身形度古典

好家伙,嗅觉可以径直给语文讲义用了。

“床前明蟾光”这几个字不是直愣愣P上去的,跟画面和会得相配可以。画面细节方面,也很有氛围感。

硬要挑刺,即是AI有点分不清屋内屋外了(doge)。

Round 2:生成PPT、海报

官方Demo中有径直生成PPT的示例,咱们也来测试一下,教导词是:

一张企业级高质料PPT页面图像,全体汲取简易当代的立场,主题感情是蓝绿色,配景用线条和粒子营造科技感,页面顶部左侧显著展示QbitAI的记号。主标题位于画面中央偏上,笔墨本色为“量子位AI Coding线下沙龙”,字体规整简介,凸起工夫感。主标题下方放两张图,一张是线下沙龙现场像片,另一张体现AI编程

生成适度是这样的:

严格来看,右上角有小小的缺陷,左下角图中图的笔墨也不是那么准确,但全体成果如实很顶,主体笔墨、图中图齐能适合教导词的条款。

那么若是教导词更腌臜更粗浅,Qwen-Image是否还能给出高质料适度?

测试教导词:

制作一张海报,主题是:通义千问开源Qwen-Image

笔墨准确,也体现了AI画画的元素,没缺陷。

Round 3:商品宣传图

临了,再来测测Qwen-Image的“卖货”手段。

教导词:

面包店的商品宣传图,画面主体是面包和奶油蛋糕。图中笔墨展现“好吃”、“动物奶油”、“开启好意思好一天”,字体汲取花体字,整身形度搪塞安适。全体汲取暖色彩

有点惊喜的是,Qwen-Image把“动物奶油”这几个字准确对应到了奶油蛋糕上。

需要诠释的是,以上实测,均为一次出图。

可以看到,Qwen-Image对教导词的判辨齐很到位,教导词给得越精确,扩充的成果细节越丰富,其中笔墨渲染智商,确如官方所说,能作念到高保真输出。

你给这个成果打几分?

性能SOTA

文本渲染智商除外,Qwen-Image还具备一致性图像剪辑智商,解救立场移动、增点窜、细节增强、笔墨剪辑、东说念主物姿态调节等多种操作。

回来起来,其主要特质包括:

复短文本渲染智商: Qwen-Image在复短文本渲染方面发达出色,解救多行布局、段落级文本生成以及细粒度细节呈现。无论是英语仍是华文,均能达成高保真输出。一致性的图像剪辑智商:通过增强的多任务查抄范式,Qwen-Image在剪辑经过中能出色地保抓剪辑的一致性。性能SOTA:在多个公开基准测试中的评估标明,Qwen-Image在种种生成与剪辑任务中均获取SOTA。

性能发达方面,通义千问团队在多个公开基准上对Qwen-Image进行了评估,包括用于通用图像生成的GenEval、DPG和OneIG-Bench,以及用于图像剪辑的GEdit、ImgEdit和GSO。

在悉数基准测试中,Qwen-Image齐达成了SOTA。

在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的适度标明,Qwen-Image在文本渲染方面发达尤为出色。

超过是在华文文本渲染上,大幅跳跃现存的起原进模子。

从工夫叙述浮现的细节来看,为了经管复短文字渲染勤恳,通义千问团队在数据处理、查抄计谋方面齐作念出了校阅。

查抄方面,Qwen-Image汲取渐进式查抄计谋,从非笔墨到笔墨渲染,节约单到复短文本输入,缓缓过渡到段落级描摹,这种课程学习门径大大增强了模子的原生笔墨渲染智商。

更多细节,可戳文末商酌,稽察官方工夫叙述。

One More Thing

官方放出的示例中,还有这样一张有好奇赞佩的PPT。

教导词中的要津字是“通义千问视觉基础模子”。

莫非是新的剧透?

这个8月的确有好奇赞佩了~

ModelScope:https://modelscope.cn/models/Qwen/Qwen-ImageHugging Face:https://huggingface.co/Qwen/Qwen-ImageGitHub:https://github.com/QwenLM/Qwen-Image工夫叙述:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf实测地址:chat.qwen.aij9九游会真人



相关资讯
热点资讯
  • 友情链接:

Powered by 九游娱乐(中国)有限公司-官方网站 @2013-2022 RSS地图 HTML地图