AI 圈海安幼儿园 白丝,再次开卷图像生成。
一连串进展扎堆:8 月 21 日,Ideogram 选藏推出 2.0 版块,宣称文本渲染智商更强。
没错,等于阿谁开荒于客岁 8 月,由谷歌 AI 绘画 4 大牛集体下野创业的技俩,曾得到过一众 AI 大佬投资。
此番 Ideogram 还公开叫板 Flux,官方自信默示其东说念主类评估彰着优于 Flux Pro。
要知说念,Flux 由 Stable Diffusion 原班东说念主马打造,最近正在因生成以伪乱的确 TED 演讲“相片”而走红各大网络。
除此以外,一周前,谷歌选藏放出了 Imagen 3,在官方评估中,堪称知道优于 DALL-E 3、Midjourney v6、Stable Diffusion 3 等一众绘制模子。
概况是受刺激了(doge),Midjourney 居然也转型了,在 8 月 22 日径直向所灵验户推出了免费网页版。
这下有好戏看了!既然内行王人宣称我方很强,那我们不妨把内行拉到一桌,来搞个濒临面 PK。
谁是最强绘制 AI?先请出我们的 4 位参赛选手(全部使用网页版):
1 号选手:Ideogram 2.0。每天免费有 10 积分,1 积分可以生成 4 张图,每天最多生成 40 张图;
2 号选手:Flux.1。黑丛林官方在 Hugging Chat 提供了免费 demo(选 FLUX.1 Schnell 版块);
3 号选手:Imagen 3。在 Image FX 上可以免费无穷次使用;
4 号选手:Midjourney。免费试用期一共唯有生成 25 张图的契机;
底下选藏干与比赛程序。
黑山公全翻车了
一上来,为了磨砺这些海外 AI 是否结合汉文指示词,我们也来蹭一波现在顶流黑山公的热度。
prompt:游戏变装,一只山公,身披盔甲,头戴凤羽王冠,手上拿着一根金箍棒,站在一座陡壁之上。
不出无意,无意发生了……
确信内行一眼王人被 3 号的大红叉给诱导了。没错,团结指示词下,唯有 3 号 Imagen 3 拒却了生成肯求。
看到这儿,第一响应是我们的指示词是不是触发了版权保护。于是先删掉了指示词中的“游戏变装”,轨则也曾提醒无法生成。
难说念是谷歌 Imagen 3 不撑持汉文?于是又只怕换了一个更浮浅的指示词,这下倒是有图了。
只不外轨则一通盘大诞妄,况兼换了多个汉文指示词,最终王人是一些绝不计议的纹路图。看来谷歌 Imagen 3 照实对汉文指示词不 ok。
3 号落榜之后,再看其他几位,也唯有 1 号 Ideogram 2.0 知道最好。2 号倒还能看放洋漫的影子,4 号 Midjourney 则所有放飞自我了~(主打一个绝不联系)终末也曾要表扬下 Ideogram 2.0,精确射中了所关联键元素。
天然不是本东说念主心中思要的东西(思要黑传奇),但指示词收复度照实没破绽。
是真东说念主也曾 AI?傻傻分不了了
接下来干与列位选手的惬意区 —— 东说念主像生成。
遥思当年,Midjourney 以一张天台情侣合照火爆网络;脚下,Flux 更是以一组 TED 演讲图风靡全网……
究竟谁更胜一筹?谜底马上揭晓。
prompt:A young man with auburn hair, wearing a checkered shirt in teal and cream, captured with a 50mm lens for a vintage look. Rich colors海安幼儿园 白丝, sharp focus, and a touch of retro charm.
一位红褐色头发的年青男性,身着蓝绿色奶油色方格衬衫,用 50mm 镜头捕捉因循立场。颜色丰富,焦点清亮,带有一点因循魔力。
先单看 2 号和 4 号,很彰着,Midjourney 赢了!
从细节上看,2 号 Flux.1 稍有偏差,衣着神采多了两种,这在一水的蓝绿格子衬衫中尤为卓越。
另外,一上来我们还发现了 Imagen 3 独到的一个小亮点:在生成运行前圈出缺点词。
借着它完成的责任,我们刚巧可以磨砺几位选手对缺点元素(蓝绿色方格衬衫、50mm 镜头等)的收复进度。
可以看到,举座上几位选腕知道王人可以(除了 2 号),收复度较高且王人看向了镜头。况兼,要不是这些王人是本东说念主亲私用 AI 生成的,还真无法一下子鉴别与真东说念主的折柳。(汗颜)
终末悄咪咪说一句,4 号选手 Midjourney 颜值最高。
老浩劫:图片披露笔墨
见效骗过了通盘东说念主之后,是时候让 AI 吃点苦头了 —— 给图片加笔墨。
这事儿一直王人是个老浩劫,也成了磨砺 AI 生图水平的程序之一。话未几说,径直让几位选手制作一块良好的告白牌。请列位看官老爷自行带入甲方爸爸变装。
prompt:A horizontal brass sign reading ‘Festive Season’ in a stylish script, encircled by pine and holly on a dark wood backdrop, with a close-up focus on the golden lettering.
一块水平黄铜标牌,上头曩昔卫手写体写着’Festive Season’,周围环绕着松枝和冬青,配景是深色木料,特写镜头聚焦于金色字体。
一眼扫过,是不是王人还可以,好像王人高度收复了指示词?关联词,一朝拿出甲方爸爸的利害目光,这 2 号可就藏不住了。瞩目看,2 号 Flux.1 偷工减料了,单词“Season”少了一个字母“S”。不外除了 2 号,其他几位也曾可以滴,看来各家 AI 在笔墨渲染功能上王人下功夫了。
是以接下来等于,萝卜青菜各有所好,内行凭个东说念主喜好作念接收。(私心投给了 Midjourney)对了,1 号 Ideogram 此次型号升级还有利拿“笔墨渲染”功能作念宣传了,内行不妨多试试。
参考麦当劳,整点 AI 告白
最近,麦当劳请了 11 个 AI 好意思女为薯条荒诞打 call,狠狠火了一把~ 其实旨趣也比拟浮浅,无非是用 AI 生成不同变装宣传薯条的图片,再拼接成一个视频。没思到恶果惊东说念主,仅在推特一个平台,计议视频就得到了近千万浏览量。
掌抓钞票密码后,我们选藏开干,身为中国东说念主,AI 助农高下得走起~
prompt:Against the backdrop of a cyberpunk-style metropolis, a girl is promoting organic agricultural products in her hands.
在赛博一又克立场的王人市配景下,一位女孩正宣传入辖下手中的有机农居品。
很好,3 号选手再次“摆烂了”。不外这波真实令东说念主蒙胧,指示词既不是汉文,也莫得彰着犯禁的所在……
淘汰 3 号后,1 号选手 Ideogram 2.0 带货种类最为丰富,大白菜、西红柿、紫甘蓝等应有尽有。况兼它是惟逐个个打出笔墨牌号来宣传有机食物的,看得出来尽头卖力了~ 另外,细看还能发现唯有 1 号在贫困效法真东说念主,而 2 号和 4 号则所有走上了二刺猿。
u1s1,要是参考麦麦的告白立场,这一次的良晌生成照实莫得达到理思恶果。(但愿更逼近信得过少量)关联词,好在这几个 AI 器用咫尺王人可以免用度,多来几次也不是不可,重心也曾顺媒介。[doge]
别急着走,其实还有一个更靠谱的搞钱次序 —— 用 AI 唐突拿捏棚拍买卖宣传海报,省下请照相师、局势和后期的钱不香嘛。
A sleek lipstick tube gleams against a backdrop of sophistication, highlighting the rich pigment and smooth glide. Evoke luxury with sharp focus and a hint of shimmer.
一支光滑的口红管在良好的配景前精通,凸显出浓郁的光线情切滑的涂抹感。以利害的焦点和一抹微光唤起蹧跶感。
考考内行,假如你要给身边某位女性挑一只口红,你会选哪只?(示寂熟识来了)嘿嘿,是以有东说念主选 4 号了吗?天然 4 号 Midjourney 看起来灰常高等,但这个玄色可能有点小众了。(慎选)
除了它,接下来知道最好的是 3 号 Imagen 3,底下丝绒布料烘托出蹧跶感,且最强大的是,口红质量很信得过。对比之下,1 号和 2 号王人显得有点假,“塑料感”扑面而来。
因此这一局,举座来说 3 号选手到手。小结一下,举座而言 4 位选腕知道王人相配可以。汉文指示词下,黑马选手 Ideogram 2.0 知道最好。
谁是 Ideogram?本年 2 月,Ideogram 推出了 1.0 版块,短短半年时辰,它再次进化上线了 2.0 版块。事实上,Ideogram 与谷歌可谓“沾亲带故”。开荒于客岁 8 月,独创团队中前 4 东说念主王人是谷歌文生图筹商 Imagen 论文作家。
柚木提娜作品CEO Mohammad Norouzi,论文共团结作,他在多伦多大学蓄意机科学博士就读时代拿到了谷歌 ML 博士奖学金。
毕业后他加入谷歌大脑责任了 7 年,职位也沿途升至高等筹商科学家,主要筹商的等于生成模子。此外,他亦然谷歌神经机器翻译团队的原始成员,Hinton 团队自监督对比学习框架 SimCLR 的合著者。
CTO William Chan(陳俊樂),论文共团结作,他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。他 2012 年加入谷歌时先作念的机器学习告白工程,后转到谷歌大脑作 NLP 筹商。
斡旋独创东说念主 Jonathan Ho,博士毕业于 UC 伯克利,曾在 OpenAI 责任一年,后加入谷歌。他除了是 Imagen 论文的中枢孝敬者,也曾去噪扩散模子奠基之作《Denoising Diffusion Probabilistic Models》的一作,这篇论文合著者中的 Pieter Abbeel 亦然 Ideogram AI 的投资东说念主。
斡旋独创东说念主 Chitwan Saharia,论文共团结作,本科毕业于孟买理工学院,2019 年加入谷歌,在谷歌主要负责领导 image-to-image 扩散模子的责任。
独创团队中的另外三东说念主,Shayaan Abdullah 曾是 Twitter 的机器学习工程师,于客岁 4 月下野,后加入 Ideogram AI。
Jacob Lu 为软件工程师,加入 Ideogram 之前曾在亚马逊等公司任职;Jenny Lei 是软件工程实习生,加入 Ideogram AI 之前曾在谷歌实习。
可以看出,Ideogram 由顶级扩散模子筹商团队构成,自开荒之初便得到了老本深嗜。
Ideogram 种子轮融资由 a16z 和 Index Ventures 领投,金额 1650 万好意思元(那时约 1.2 亿东说念主民币)。个东说念主投资者中也不乏 Andrej Karpathy、强化学习大牛 Pieter Abbeel,GitHub 斡旋独创东说念主 Tom Preston-Werner 等。
另外,本年 2 月,多方音书传出 Ideogram 进行了新一轮融资。据称见效筹集了 8000 万好意思元(约 57 亿东说念主民币)A 轮融资,领投方为 Andreessen Horowitz,其他参与投资者包括 Index Ventures、Redpoint Ventures、Pear VC 和 SV Angel。
看来有钱、有技巧的 Ideogram 无疑又是 AI 生图限制的一匹黑马。
卷,陆续卷。
Ideogram 2.0 相接:
https://ideogram.ai/t/explore
Midjourney 相接:
https://www.midjourney.com/home
Flux 相接:
https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
Imagen3 相接:
https://aitestkitchen.withgoogle.com/tools/image-fx
参考相接:
[1]https://x.com/ideogram_ai/status/1826277550798278804
[2]https://ideogram.ai/launch
[3]https://x.com/AIandDesign/status/1826277963681370213
本文来自微信公众号:量子位(ID:QbitAI),作家:一水
告白声明:文内含有的对外跳转相接(包括不限于超相接、二维码、口令等面孔),用于传递更多信息,圣洁甄选时辰海安幼儿园 白丝,轨则仅供参考,IT之家通盘著述均包含本声明。