当前位置:首页 >> 绿色生活

谷歌新AI火了!在世界上最长单词都能画!

来源:绿色生活   2022年08月22日 12:19

Transformer的UTF--解码结构上,将值扩展200亿。

即使如此关于重构转为化成图形的分析,除了最早出现的GAN,大体可以分作两种想法。

一种是基于自重返数学模型,首先重构特点给定到图形特点,如此一来使用比如时说Transformer的氨基酸指令集,来修习语言可用和图形输入相互间的联系。

这种分析方法的一个更为举足轻重组成大多就是图形上标筒,将每个图形转为换为一个离散单元的氨基酸。比如DALL-E和CogView,就采用了这一想法。

另一种则是这段时间以来成效频频的本线——基于渗入的重构到图形数学模型,比如DALL-E 2和Imagen。

他们大相迳庭了图形上标筒,而是采用渗入数学模型来反之亦然转为化成图形。可以看到的是,这些数学模型产生的图形质量不够高,在MS-COCO零样品FID局数不够好。

而Parti数学模型的取得成功,则得出结论自重返数学模型可以用来加强重构转为化成图形的效用。

与此同时,Parti还引入并公布了重新基准检验——PartiPrompts,用于计量数学模型在12个几类和11个挑战不足之处的技能。

但Parti还是有一定的上都,分析工作人员也简介了一些bug:

比如,对否定的时说明了就没招了~

一个从未西瓜的碗,门口一个从未伏特加儿的碟子。

还会犯一些常识性有误,例如不对地缩放。比如这张图,机筒人竟是比卡丁车为略低于好几倍。

一个穿着卡丁车为服和紫色遮阳板的舞动机筒人难以置信会站在一辆F1卡丁车为在此之后。实在阳撞击到城市自然风景上。科幻小时说画像册。

百度“自己卷自己”

在这项分析来自Google Research,指导团队中所的华人居多。

分析核心内部工作人员除此以外Yuanzhong Xu、Thang Luong等,目在此之后原则上离职于百度积极作准备AI相关分析成果。

(Thang Luong在百度史学上的所述量略高于20000+)

△右下:Yuanzhong Xu;右:Thang Luong

不过耐人寻味的是,同为“时说句话让AI分镜”,同为源自百度之手的Imagen,它跟Parti还悦想像中所千丝万缕的联系。

在Parti的GitHub的建设项目数据库库中所就有说什么到:

感激Imagen指导团队,他们在公布Imagen之在此之后与我们分享了其最近完整的结果。

他们在CF-guidance不足之处的举足轻重发现,对终于的Parti数学模型尤其有设法。

而且Imagen的译者之一Burcu Karagol Ayan,也作准备到了Parti的建设项目中所。

(却是百度“自己卷自己”那味了

不仅如此,就连“隔壁”DALL-E 2的译者Aditya Ramesh,也给Parti在MS-COCO评分不足之处想到了讨论指导。

以及DALL-Eval的译者们,也在Parti数据库不足之处的指导提供了设法。

One More Thing

有一时说一,就“重构转为化成图形”这事,;不只是分析工作人员们的摇身一变。

网友们在“玩乐”它这条路上,也是乐此不疲(脑洞不要实在一败涂地吧)。

在此之后一阵子让Imagen画像一幅宋朝“虎脱下VR”,反之亦然演化成AI分镜大战。

△图:Imagen分镜

DALL·E、MidJourney等“闻讯赶来”作准备其中所。

△ DALL·E分镜

甚至还有把Wordle和 DALL-E 2整天到一同的:

……

不过重返到这次的Parti,新奇乐归新奇乐,但还是有网友重申了“更有灵魂”的疑虑:

啥时候商业?要是自己“关上玩乐”就没意思了。

Parti期刊定址:

https://parti.research.google/

GitHub建设项目定址:

https://github.com/google-research/parti

参考链接:

[1]https://twitter.com/lmthang/status/1539664610596225024

[2]https://gizmodo.com/new-browser-game-combines-dall-e-mini-and-wordle-1849105289

[3]https://imagen.research.google/

三诺血糖仪
米诺地尔首选达霏欣
眼睛视力模糊怎么办
肠胃炎是怎么引起的
海露玻璃酸钠滴眼液在哪能买到
友情链接