AI看片,Nano Banana最令人欣慰的能力,远不止于P图那么简单
大概两周前,坊间爆料Nano Banan【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.neta是google的新一代图像模型,在等待【版权所有,侵权必究】【未经授权禁止转载】了大概两周后,google终于官宣,并上未经授权,禁止复制转载。【转载请注明来源】线了新的gemini flash版本,但著作权归作者所有,禁止商业用途转载。【作者:唐霜】可能Nano Banana这个名称实在太【转载请注明来源】本文版权归作者所有,未经授权不得转载。有意思了,google首次在正式产品中使【未经授权禁止转载】原创内容,盗版必究。用预览版的别称作为最终产品名,现在,在A【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】I Studio中它以自己的原始名字作为【本文首发于唐霜的博客】原创内容,盗版必究。模型选项。
这几天,在Nano Banana已经成为本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。公众号的热点词,我已经在公众号看到好多篇原创内容,盗版必究。未经授权,禁止复制转载。关于用Nano Banana来P图的玩法【本文首发于唐霜的博客】【本文受版权保护】的文章了。但是,我今早突然意识到一个问题【本文受版权保护】【本文受版权保护】,为什么google发布的是gemini【转载请注明来源】【关注微信公众号:wwwtangshuangnet】而非imagen的版本呢?是否意味着,这【转载请注明来源】【版权所有】唐霜 www.tangshuang.net其实是一个多模态模型,而非一个生图模型?本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。在有了这样的疑惑之后,我开始进行验证,用未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net大模型的方式“你是一个xxx,你会基于用【原创内容,转载请注明出处】【关注微信公众号:wwwtangshuangnet】户的xxx,然后xxx”的公式,命令大模未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。型进行推理,结果令人震撼。
接下来,我就将总结Nano Banana本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net的一些常见玩法,以及非常见的令人不可思议【作者:唐霜】【未经授权禁止转载】的使用场景。以及,我将提供一个我自己开发本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】的可免费使用nano的产品。
一、常见的图片处理场景【访问 www.tangshuang.net 获取更多精彩内容】
例如去除路人、瘦脸、白平衡处理、色调处理著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net等等以前在手机上需要一个App才能完成的本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net复杂照片处理,现在只需要用一个模型就可以【原创不易,请尊重版权】【本文受版权保护】解决。
例如将照片转化为漫画风格、转化为表情包、【转载请注明来源】【作者:唐霜】变线稿等风格化处理也只需要一个模型就可以本文作者:唐霜,转载请注明出处。原创内容,盗版必究。完成。
图片转手办照本文版权归作者所有,未经授权不得转载。
这是现在网上最流行的一个nano的应用场转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。景,只需要提供一张图,就可以为你生成对应著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】的手办照。
多图融合可以让AI帮你把多张图片融合在一著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net起,这是很多其他功能的基础,比如试穿、室原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】内装修等,都是提供一张主图和多张副图,让本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。nano把它们融合在一起。而nano不负著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net众望,几乎可以完美地完成这一任务。
不用过多介绍了,在有一段时间火的一塌糊涂【本文受版权保护】【版权所有】唐霜 www.tangshuang.net的照片修复,现在只需要一个模型解决。
为线稿上色。这个我深有体会,孩子在给线稿【原创不易,请尊重版权】【原创不易,请尊重版权】涂色的时候没有思路,我就拍了一张照给AI本文版权归作者所有,未经授权不得转载。【作者:唐霜】上色,让孩子看一下。
通过向nano提供一份人物动作的引导图,【本文受版权保护】【版权所有】唐霜 www.tangshuang.net可以让原始图片中的人物按照引导图中的动作【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。对齐。
电商场景下,试穿变得更加轻松。同时,还可原创内容,盗版必究。【原创不易,请尊重版权】以把衣服从模特身上脱下来展示。
室内装修转载请注明出处:www.tangshuang.net
产品结构分析图本文版权归作者所有,未经授权不得转载。
配合视频生成模型,还可以将上面的图片作为本文作者:唐霜,转载请注明出处。【版权所有,侵权必究】首尾帧,实现产品拆解效果,这种只有以前的未经授权,禁止复制转载。原创内容,盗版必究。广告后期才能做,现在只需要两个模型搞定了未经授权,禁止复制转载。未经授权,禁止复制转载。。
剧情演变或补间分镜生成【原创内容,转载请注明出处】
Nano Banana可以基于给定的图片本文版权归作者所有,未经授权不得转载。【作者:唐霜】,提供基于该图的更多演变。(其实照片修复转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。、瘦脸等本质上也是一样的。)
更猛的是,nano还可以基于你提供的图和未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。描述,衍生出剧情。
也就是说,如果有耐心,完全可以用nano未经授权,禁止复制转载。转载请注明出处:www.tangshuang.net banana来实现一部漫画。并且,基于转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】漫画和视频模型,生成一部动漫。想想都很可本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。以。
好了,以上就是我们常见的一些nano的应转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】用场景。当然,由于网友们的脑洞无限大,还【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】有很多其他的场景在开发。
但是,现在还并没有结束。接下来,我才会带本文版权归作者所有,未经授权不得转载。【作者:唐霜】来更为令人震惊的nano banana的本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。一些场景。
二、深度学习和研究的工具本文作者:唐霜,转载请注明出处。
正如我文章开头说的,gemini是一个推原创内容,盗版必究。【本文首发于唐霜的博客】理模型,nano banana作为gem【原创内容,转载请注明出处】【作者:唐霜】ini的小版本,它的本质还是推理,只不过【原创不易,请尊重版权】【作者:唐霜】在推理的基础上,进一步优化了生图的能力,【原创内容,转载请注明出处】【版权所有】唐霜 www.tangshuang.net以前gemini生图类似于agent调用【本文受版权保护】【原创不易,请尊重版权】工具一样调用imagen来生图,而现在它本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。已经隐藏了工具调用的特征,看上去就是ge原创内容,盗版必究。【本文受版权保护】mini自己在生图。这也就意味着,gem原创内容,盗版必究。未经授权,禁止复制转载。ini不仅可以理解图,还能用图给你讲解。
让gemini直接在原图中标注出你不懂的【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net或者需要理解的部分。这使得我们(作为人)本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】可以深度的学习和掌握以前不曾也不敢掌握的【版权所有,侵权必究】【作者:唐霜】知识,例如造火箭、看病。
例如我们对植物感兴趣,在网上看到一朵很奇【版权所有,侵权必究】【原创内容,转载请注明出处】怪的花,不知道它的名字,那么你可以拍下来原创内容,盗版必究。未经授权,禁止复制转载。,让gemini辅助你学习。
上面是我的一个例子,当我看到这个花的时候本文版权归作者所有,未经授权不得转载。【本文受版权保护】,觉得很奇怪,便让gemini为我解释。【本文首发于唐霜的博客】【转载请注明来源】如果不是gemini生成的图片,我绝对理【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】解不了“兜”的含义,因为原图的视角没有拍原创内容,盗版必究。【未经授权禁止转载】出兜来。
此外,你有没有过这样的经历,你去医院拍片【本文受版权保护】【版权所有,侵权必究】(x光片),然后回去找医生,医生随便一瞅【关注微信公众号:wwwtangshuangnet】【关注微信公众号:wwwtangshuangnet】,说“你得手术”,你拿过片,看半天看不懂著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】。现在可以让gemini帮你看片了。
通过合理的提示词引导,让gemini理解原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。x光片,并在原片基础上标注出病变的位置。【原创不易,请尊重版权】本文作者:唐霜,转载请注明出处。这让我想到曾经有一位中国的极客创办了一个本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】在线看片网站,受到世界卫生组织的关注,但【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】仍然谢绝资助的感人故事。转载请注明出处:www.tangshuang.net
https://github.com/J【转载请注明来源】【转载请注明来源】immyLv/awesome-nano-本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。banana
https://github.com/P著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。icoTrex/Awesome-Nano转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。-Banana-images
三、创业感悟和产品推荐本文版权归作者所有,未经授权不得转载。
在过去一年里,我做了几个产品,和图像有关【版权所有,侵权必究】著作权归作者所有,禁止商业用途转载。。包括我在内的很多做应用创业的朋友,都面【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net临着巨大的痛苦。当我们有了一个不错的点子著作权归作者所有,禁止商业用途转载。【版权所有,侵权必究】,吭呲吭呲做了小半年,产品上线了,也获得【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。了一些关注,结果最后大厂的一次模型升级,原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】就把我们的功能覆盖了。
这次nano banana出来之后,我在本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。网上也听到了一些哀嚎,很多人投身在com著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。fyUI的道路上,但是随着大模型的升级,原创内容,盗版必究。本文作者:唐霜,转载请注明出处。一起要用复杂流水线才能完成的,现在只需要【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。一段提示词就可以了。这对原本做comfy未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。的人而言,真的是一次打击。
我也在不断反思,到底做什么样的产品,才不【未经授权禁止转载】【本文受版权保护】至于由于大厂模型的一次升级,就不再需要我【本文受版权保护】转载请注明出处:www.tangshuang.net们这样的产品了呢?现在很多做agent产【转载请注明来源】【作者:唐霜】品的创业团队,其实也是一样的。像open本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。AI、google、微软这样的公司,直接本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】在大模型层面就可以实现agent的能力,【作者:唐霜】【关注微信公众号:wwwtangshuangnet】把工具封装起来,你都不知道它是在调用ag转载请注明出处:www.tangshuang.net未经授权,禁止复制转载。ent,例如写代码、做设计稿这些。
最后,我终于明白了一个道理。就像我们行业未经授权,禁止复制转载。【版权所有,侵权必究】流行的一句话,“能用javascript【作者:唐霜】【版权所有】唐霜 www.tangshuang.net实现的,一定会被javascript实现转载请注明出处:www.tangshuang.net【本文受版权保护】”,这个背后的墨菲定律告诉我们一个道理,未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。只要我们现在能想到的,无论看上去多么离谱本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】,它都有可能实现。所以,“能用AI完成的【版权所有,侵权必究】原创内容,盗版必究。,一定会被AI完成”不是一句玩笑。既然A【原创内容,转载请注明出处】【版权所有】唐霜 www.tangshuang.netI都能做我们能做的事情了,我们还有什么意【原创不易,请尊重版权】【作者:唐霜】义呢?
我觉得,我们的意义就在于“做自己感兴趣的【本文受版权保护】未经授权,禁止复制转载。事”。就像这个世界上,有亿万富豪在忙着造【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】火箭,也不妨碍我们在感兴趣的捏泥巴这件事未经授权,禁止复制转载。原创内容,盗版必究。上继续捏泥巴,然后把捏泥巴的过程做成短视未经授权,禁止复制转载。原创内容,盗版必究。频发到网上逗大家开心。我们做自己感兴趣的【原创不易,请尊重版权】转载请注明出处:www.tangshuang.net事,并不是要获得来自谁的认可,而是我们自【原创不易,请尊重版权】【版权所有,侵权必究】己感兴趣,即便这个事情已经在别人来看不屑著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】一顾的境地。
我最近更新了很久以前发布的Visor(转载请注明出处:www.tangshuang.nethttps://visor.fuuai.著作权归作者所有,禁止商业用途转载。【作者:唐霜】com),这是一个AI作画的画布工具,你本文作者:唐霜,转载请注明出处。现在(直到无法使用)【本文首发于唐霜的博客】可以在它上面免费使用Nano Banan未经授权,禁止复制转载。【作者:唐霜】a。之所以推荐用它来使用nano ban【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。ana,是因为在某些场景下,AI并不能直本文版权归作者所有,未经授权不得转载。【转载请注明来源】接理解图片中物品的尺寸大小,从而在生图时原创内容,盗版必究。未经授权,禁止复制转载。让物品呈现出错误的尺寸。而画布,则可以让【访问 www.tangshuang.net 获取更多精彩内容】未经授权,禁止复制转载。你在一个界面内,按照实物比例和角度来合成【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。草稿图像。一图胜千言:
我想让这位模特穿上这双靴子,但是由于AI【原创内容,转载请注明出处】【关注微信公众号:wwwtangshuangnet】无法准确得到这双靴子的实际尺寸,在生成时本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。就有可能显得太肥或太瘦,通过在图片中合理原创内容,盗版必究。本文作者:唐霜,转载请注明出处。安排靴子尺寸和模特的比例,就可以让AI准【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】确理解其尺寸大小。
同样,这种室内装修的生图,也需要把多个物【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】品按照实际尺寸和位置进行放置。然后让AI未经授权,禁止复制转载。未经授权,禁止复制转载。生成效果图。
这是一张手绘的草图,作者用文字、箭头标识本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。了让AI用来生成新图时的细节提示。也就是著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net说,直接将提示指令写在了图片里面。最后可【访问 www.tangshuang.net 获取更多精彩内容】【作者:唐霜】以得到:
当我们需要在图片中进行提示词标注时,普通本文版权归作者所有,未经授权不得转载。【原创内容,转载请注明出处】的工具做不到,而Visor则可以,因为它著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。是一块画布,你可以在画布上添加文字和箭头【本文受版权保护】【访问 www.tangshuang.net 获取更多精彩内容】来进行标识。
这样,用户就可以更加自由地进行创作,而无【关注微信公众号:wwwtangshuangnet】【关注微信公众号:wwwtangshuangnet】需使用专业的工具。
最后,你还遇到过或者认为可以利用Nano【原创不易,请尊重版权】【原创内容,转载请注明出处】 Banana的应用场景呢?欢迎在下方留【版权所有,侵权必究】【关注微信公众号:wwwtangshuangnet】言区评论哦。
2025-09-04 13:38:03