科创001|“一根香蕉”引爆AI圈!与Photoshop“牵手”,Nano Banana掀起AI生图浪潮

深圳商报·读创客户端首席记者 陈小慧
09-15 20:20

深圳商报・读创客户端

中国商事主体第一端

摘要

“P图神器”具备超强一致性网友给出多种“邪修”玩法据了解,在 AI 图像生成领域,对比GPT-image-1、字节 Seedream等文生图大模型“优等生”,Nano Banana呈现出了更强的一致性,并且复杂任务推理能力也更进一步

只需一个提示,就能把照片生成为专属手办;一键生成与明星合影……最近,一款被称为“纳米香蕉”的AI生图应用被网友们“玩坏了”。

网络截图

当地时间8月26日,谷歌发布了其最新的图像生成和编辑模型Gemini 2.5 Flash Image,也被称为“Nano Banana”(纳米香蕉),以高度一致性的“修图魔法”能力在大模型评测平台LMArena 登顶并火出圈。Nano Banan破圈后,谷歌Gemini也一度超越了霸榜苹果应用榜的ChatGPT。

网络截图

近日,Adobe首席设计推广大使Howard Pinsky还宣布,谷歌NanoBanana模型将于9月内正式集成至Photoshop。

网络截图

业内人士表示,Nano Banana的问世,正深刻影响着众多行业,其带来的革命性突破,预示着全新创作时代的到来。

“P图神器”具备超强一致性

网友给出多种“邪修”玩法

据了解,在 AI 图像生成领域,对比GPT-image-1、字节 Seedream等文生图大模型“优等生”,Nano Banana呈现出了更强的一致性,并且复杂任务推理能力也更进一步。其令人赞叹的图像一致性,也是Nano Banana火出圈的重要原因之一。

比如,同样是给出“帮模特换装”的指令,Nano Banana在人物五官的精准复刻、光影细节的还原方面,表现尤为突出。有创作者表示,Nano Banana最大的亮点是解决了 “角色一致性” 问题,它能够确保角色面貌与特征在不同场景和动作下保持高度一致,这对于品牌角色创作、情景剧本生成以及动画短片制作等领域来说,无疑是一项重大突破。面对复杂任务,Nano Banana 展现出卓越的推理能力,支持多图融合的玩法,还可以根据地图位置点还原真实景色。

此外,Nano Banana还能根据图片一键生成自己的专属手办,以及将图片中的物体改造成想要的样子。比如把自己的宠物图改造为兽医、戏剧演员。

网络截图

有网友表示,“好用到感觉像是在变魔法。”还有网友脑洞大开,给出多种“邪修”玩法,并总结了多种提示词。数据显示,短短不到一个月,Gemini应用程序在此期间新增用户2300万,Nano Banana也被用于编辑超过5亿张图片。

从“开盲盒”到“修图魔法”

AI生图技术更“聪明”

当下,全球人工智能应用呈现规模扩张、领域拓展和应用深化的发展态势。2024年全球人工智能市场规模超2792亿美元,预计到2030年年复合增长率为35.9%。而AI生图是关键的领域。

此前,由于AI生图技术还不够成熟,网友称“每次生成都像开盲盒”一样,不知道会生成出什么样的图片。

此次Nano Banana的推出,很好地解决了角色连贯性的问题。“Nano Banana最出彩的,还是一致性。这种一致性在早期Sora上也曾经展示过,其一致性的主要作用,其实是将多个元素通过一定逻辑组合起来,避免突兀的拼接,让其更加合理。可以说,Nano Banana在AI图片后期处理上走出了一大步。”经济学者、工信部信息通信经济专家委员会委员盘和林在接受记者采访时表示。

近年来,AI 生图应用不断涌现。比如GPT-image-1、字节 Seedream、腾讯混元最新的生图模型“混元图像2.1”等等。

一方面,这些应用的模型的语义理解能力不断提升,能够更好地解读用户复杂的创意需求,生成更加贴合用户想象的图像。另一方面,多模态融合已成为 AI 生图领域的重要发展趋势,打破了传统单一文本输入的局限,为用户提供了更加多元、便捷的创作交互方式。

比如,日前发布的“混元图像2.1”支持最长达1000个tokens的提示词,支持原生2K生图。腾讯混元方面透露,“混元原生多模态图像生成模型,也在路上了。”

字节跳动Seedream也有新进展。日前,国际知名评测机构Artificial Analysis发布消息称,字节跳动Seedream 4.0已登顶文生图及图像编辑排行榜榜首,在两个领域都超越了谷歌的 Gemini 2.5 Flash(Nano-Banana)。据了解,Seedream 4.0集成了文生图、图像编辑、多图融合、组图生成等多种能力,最高支持4K分辨率图像生成,已在豆包App、即梦AI、扣子等产品上线。

专家表示,从整个AI生图应用市场的发展趋势来看,技术的不断创新正推动着应用向更加智能化、个性化和实用化的方向发展。Nano Banana的出现,预示着 AI 生图进入平民化时代。普通用户创作门槛急剧降低,以往需专业技能的图像编辑,现在通过自然语言指令即可实现,这也为图像编辑领域乃至更多行业带来了无限的发展可能与全新机遇 。

(作者:深圳商报·读创客户端首席记者 陈小慧)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读

读特热榜

IN视频

鹏友圈

首页