AI看片，Nano Banana最令人欣慰的能力，远不止于P图那么简单-唐霜

大概两周前，坊间爆料Nano Banan【本文受版权保护】【本文受版权保护】a是google的新一代图像模型，在等待【本文受版权保护】未经授权，禁止复制转载。了大概两周后，google终于官宣，并上【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.net线了新的gemini flash版本，但【关注微信公众号：wwwtangshuangnet】【作者：唐霜】可能Nano Banana这个名称实在太未经授权，禁止复制转载。著作权归作者所有，禁止商业用途转载。有意思了，google首次在正式产品中使【作者：唐霜】【未经授权禁止转载】用预览版的别称作为最终产品名，现在，在A原创内容，盗版必究。【版权所有，侵权必究】I Studio中它以自己的原始名字作为本文版权归作者所有，未经授权不得转载。【原创内容，转载请注明出处】模型选项。

这几天，在Nano Banana已经成为【本文受版权保护】【关注微信公众号：wwwtangshuangnet】公众号的热点词，我已经在公众号看到好多篇【未经授权禁止转载】【访问 www.tangshuang.net 获取更多精彩内容】关于用Nano Banana来P图的玩法【版权所有，侵权必究】【未经授权禁止转载】的文章了。但是，我今早突然意识到一个问题转载请注明出处：www.tangshuang.net【版权所有】唐霜 www.tangshuang.net，为什么google发布的是gemini著作权归作者所有，禁止商业用途转载。【转载请注明来源】而非imagen的版本呢？是否意味着，这【版权所有】唐霜 www.tangshuang.net【原创内容，转载请注明出处】其实是一个多模态模型，而非一个生图模型？著作权归作者所有，禁止商业用途转载。原创内容，盗版必究。在有了这样的疑惑之后，我开始进行验证，用【转载请注明来源】本文作者：唐霜，转载请注明出处。大模型的方式“你是一个xxx，你会基于用转载请注明出处：www.tangshuang.net【作者：唐霜】户的xxx，然后xxx”的公式，命令大模本文作者：唐霜，转载请注明出处。【本文受版权保护】型进行推理，结果令人震撼。

接下来，我就将总结Nano Banana本文作者：唐霜，转载请注明出处。著作权归作者所有，禁止商业用途转载。的一些常见玩法，以及非常见的令人不可思议【本文首发于唐霜的博客】原创内容，盗版必究。的使用场景。以及，我将提供一个我自己开发转载请注明出处：www.tangshuang.net【作者：唐霜】的可免费使用nano的产品。

一、常见的图片处理场景

P照片

例如去除路人、瘦脸、白平衡处理、色调处理【转载请注明来源】原创内容，盗版必究。等等以前在手机上需要一个App才能完成的【转载请注明来源】本文作者：唐霜，转载请注明出处。复杂照片处理，现在只需要用一个模型就可以著作权归作者所有，禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】解决。

图片风格转化

图片转手办照

多图融合

多图融合可以让AI帮你把多张图片融合在一【关注微信公众号：wwwtangshuangnet】【关注微信公众号：wwwtangshuangnet】起，这是很多其他功能的基础，比如试穿、室原创内容，盗版必究。【本文受版权保护】内装修等，都是提供一张主图和多张副图，让【本文受版权保护】【本文首发于唐霜的博客】nano把它们融合在一起。而nano不负【原创内容，转载请注明出处】【本文首发于唐霜的博客】众望，几乎可以完美地完成这一任务。

照片修复

不用过多介绍了，在有一段时间火的一塌糊涂【作者：唐霜】本文作者：唐霜，转载请注明出处。的照片修复，现在只需要一个模型解决。

上色或变色

为线稿上色。这个我深有体会，孩子在给线稿【本文首发于唐霜的博客】本文版权归作者所有，未经授权不得转载。涂色的时候没有思路，我就拍了一张照给AI【未经授权禁止转载】【未经授权禁止转载】上色，让孩子看一下。

动作引导

电商图：试穿与解穿

电商场景下，试穿变得更加轻松。同时，还可转载请注明出处：www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】以把衣服从模特身上脱下来展示。

室内装修

产品结构分析图

剧情演变或补间分镜生成

更猛的是，nano还可以基于你提供的图和【访问 www.tangshuang.net 获取更多精彩内容】原创内容，盗版必究。描述，衍生出剧情。

好了，以上就是我们常见的一些nano的应转载请注明出处：www.tangshuang.net【未经授权禁止转载】用场景。当然，由于网友们的脑洞无限大，还【未经授权禁止转载】【原创内容，转载请注明出处】有很多其他的场景在开发。

但是，现在还并没有结束。接下来，我才会带转载请注明出处：www.tangshuang.net本文版权归作者所有，未经授权不得转载。来更为令人震惊的nano banana的未经授权，禁止复制转载。本文作者：唐霜，转载请注明出处。一些场景。

二、深度学习和研究的工具

正如我文章开头说的，gemini是一个推本文作者：唐霜，转载请注明出处。【原创不易，请尊重版权】理模型，nano banana作为gem著作权归作者所有，禁止商业用途转载。【原创内容，转载请注明出处】ini的小版本，它的本质还是推理，只不过原创内容，盗版必究。【未经授权禁止转载】在推理的基础上，进一步优化了生图的能力，【关注微信公众号：wwwtangshuangnet】【本文首发于唐霜的博客】以前gemini生图类似于agent调用【原创内容，转载请注明出处】未经授权，禁止复制转载。工具一样调用imagen来生图，而现在它原创内容，盗版必究。未经授权，禁止复制转载。已经隐藏了工具调用的特征，看上去就是ge本文作者：唐霜，转载请注明出处。转载请注明出处：www.tangshuang.netmini自己在生图。这也就意味着，gem【本文首发于唐霜的博客】转载请注明出处：www.tangshuang.netini不仅可以理解图，还能用图给你讲解。

例如我们对植物感兴趣，在网上看到一朵很奇未经授权，禁止复制转载。【转载请注明来源】怪的花，不知道它的名字，那么你可以拍下来著作权归作者所有，禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】，让gemini辅助你学习。

上面是我的一个例子，当我看到这个花的时候【未经授权禁止转载】转载请注明出处：www.tangshuang.net，觉得很奇怪，便让gemini为我解释。【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有，未经授权不得转载。如果不是gemini生成的图片，我绝对理未经授权，禁止复制转载。未经授权，禁止复制转载。解不了“兜”的含义，因为原图的视角没有拍【版权所有】唐霜 www.tangshuang.net著作权归作者所有，禁止商业用途转载。出兜来。

通过合理的提示词引导，让gemini理解转载请注明出处：www.tangshuang.net原创内容，盗版必究。x光片，并在原片基础上标注出病变的位置。【版权所有，侵权必究】转载请注明出处：www.tangshuang.net这让我想到曾经有一位中国的极客创办了一个本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。在线看片网站，受到世界卫生组织的关注，但转载请注明出处：www.tangshuang.net【作者：唐霜】仍然谢绝资助的感人故事。

https://github.com/P未经授权，禁止复制转载。著作权归作者所有，禁止商业用途转载。icoTrex/Awesome-Nano【转载请注明来源】【关注微信公众号：wwwtangshuangnet】-Banana-images

三、创业感悟和产品推荐

在过去一年里，我做了几个产品，和图像有关转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net。包括我在内的很多做应用创业的朋友，都面【未经授权禁止转载】本文作者：唐霜，转载请注明出处。临着巨大的痛苦。当我们有了一个不错的点子【原创不易，请尊重版权】【版权所有】唐霜 www.tangshuang.net，吭呲吭呲做了小半年，产品上线了，也获得【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】了一些关注，结果最后大厂的一次模型升级，本文版权归作者所有，未经授权不得转载。【版权所有，侵权必究】就把我们的功能覆盖了。

这次nano banana出来之后，我在【本文首发于唐霜的博客】著作权归作者所有，禁止商业用途转载。网上也听到了一些哀嚎，很多人投身在com未经授权，禁止复制转载。【作者：唐霜】fyUI的道路上，但是随着大模型的升级，【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net一起要用复杂流水线才能完成的，现在只需要【转载请注明来源】【版权所有】唐霜 www.tangshuang.net一段提示词就可以了。这对原本做comfy【未经授权禁止转载】原创内容，盗版必究。的人而言，真的是一次打击。

我也在不断反思，到底做什么样的产品，才不【作者：唐霜】原创内容，盗版必究。至于由于大厂模型的一次升级，就不再需要我【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】们这样的产品了呢？现在很多做agent产【作者：唐霜】【未经授权禁止转载】品的创业团队，其实也是一样的。像open【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处：www.tangshuang.netAI、google、微软这样的公司，直接【转载请注明来源】【本文受版权保护】在大模型层面就可以实现agent的能力，未经授权，禁止复制转载。著作权归作者所有，禁止商业用途转载。把工具封装起来，你都不知道它是在调用ag【访问 www.tangshuang.net 获取更多精彩内容】原创内容，盗版必究。ent，例如写代码、做设计稿这些。

最后，我终于明白了一个道理。就像我们行业原创内容，盗版必究。原创内容，盗版必究。流行的一句话，“能用javascript【转载请注明来源】本文版权归作者所有，未经授权不得转载。实现的，一定会被javascript实现【未经授权禁止转载】【未经授权禁止转载】”，这个背后的墨菲定律告诉我们一个道理，【关注微信公众号：wwwtangshuangnet】转载请注明出处：www.tangshuang.net只要我们现在能想到的，无论看上去多么离谱著作权归作者所有，禁止商业用途转载。【本文受版权保护】，它都有可能实现。所以，“能用AI完成的转载请注明出处：www.tangshuang.net著作权归作者所有，禁止商业用途转载。，一定会被AI完成”不是一句玩笑。既然A著作权归作者所有，禁止商业用途转载。【未经授权禁止转载】I都能做我们能做的事情了，我们还有什么意【版权所有】唐霜 www.tangshuang.net【版权所有，侵权必究】义呢？

我觉得，我们的意义就在于“做自己感兴趣的原创内容，盗版必究。转载请注明出处：www.tangshuang.net事”。就像这个世界上，有亿万富豪在忙着造【关注微信公众号：wwwtangshuangnet】【转载请注明来源】火箭，也不妨碍我们在感兴趣的捏泥巴这件事【访问 www.tangshuang.net 获取更多精彩内容】【原创内容，转载请注明出处】上继续捏泥巴，然后把捏泥巴的过程做成短视【原创不易，请尊重版权】【本文受版权保护】频发到网上逗大家开心。我们做自己感兴趣的本文版权归作者所有，未经授权不得转载。【版权所有】唐霜 www.tangshuang.net事，并不是要获得来自谁的认可，而是我们自【访问 www.tangshuang.net 获取更多精彩内容】【未经授权禁止转载】己感兴趣，即便这个事情已经在别人来看不屑【转载请注明来源】【本文首发于唐霜的博客】一顾的境地。

我最近更新了很久以前发布的Visor（https://visor.fuuai.未经授权，禁止复制转载。【版权所有】唐霜 www.tangshuang.netcom），这是一个AI作画的画布工具，你现在（直到无法使用）可以在它上面免费使用Nano Banan【原创内容，转载请注明出处】【未经授权禁止转载】a。之所以推荐用它来使用nano ban转载请注明出处：www.tangshuang.net【原创内容，转载请注明出处】ana，是因为在某些场景下，AI并不能直【本文受版权保护】【作者：唐霜】接理解图片中物品的尺寸大小，从而在生图时转载请注明出处：www.tangshuang.net【版权所有，侵权必究】让物品呈现出错误的尺寸。而画布，则可以让本文版权归作者所有，未经授权不得转载。本文版权归作者所有，未经授权不得转载。你在一个界面内，按照实物比例和角度来合成【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有，禁止商业用途转载。草稿图像。一图胜千言：

另外，还有一种场景：

这样，用户就可以更加自由地进行创作，而无【访问 www.tangshuang.net 获取更多精彩内容】未经授权，禁止复制转载。需使用专业的工具。

【作者：唐霜】本文版权归作者所有，未经授权不得转载。【本文受版权保护】【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】原创内容，盗版必究。本文版权归作者所有，未经授权不得转载。【原创内容，转载请注明出处】转载请注明出处：www.tangshuang.net【关注微信公众号：wwwtangshuangnet】未经授权，禁止复制转载。著作权归作者所有，禁止商业用途转载。著作权归作者所有，禁止商业用途转载。本文版权归作者所有，未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】原创内容，盗版必究。【关注微信公众号：wwwtangshuangnet】未经授权，禁止复制转载。【原创不易，请尊重版权】【版权所有】唐霜 www.tangshuang.net未经授权，禁止复制转载。著作权归作者所有，禁止商业用途转载。【未经授权禁止转载】【作者：唐霜】转载请注明出处：www.tangshuang.net【版权所有】唐霜 www.tangshuang.net【版权所有，侵权必究】著作权归作者所有，禁止商业用途转载。著作权归作者所有，禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net未经授权，禁止复制转载。

唐霜

AI看片，Nano Banana最令人欣慰的能力，远不止于P图那么简单

声明

关于

生态