AI看片,Nano Banana最令人欣慰的能力,远不止于P图那么简单

广告位招租
扫码页面底部二维码联系
大概两周前,坊间爆料Nano Banan著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.neta是google的新一代图像模型,在等待著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】了大概两周后,google终于官宣,并上著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。线了新的gemini flash版本,但【转载请注明来源】未经授权,禁止复制转载。可能Nano Banana这个名称实在太【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。有意思了,google首次在正式产品中使著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。用预览版的别称作为最终产品名,现在,在A【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.netI Studio中它以自己的原始名字作为原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。模型选项。
Image
这几天,在Nano Banana已经成为【转载请注明来源】本文作者:唐霜,转载请注明出处。公众号的热点词,我已经在公众号看到好多篇【未经授权禁止转载】原创内容,盗版必究。关于用Nano Banana来P图的玩法【未经授权禁止转载】【转载请注明来源】的文章了。但是,我今早突然意识到一个问题【本文受版权保护】本文作者:唐霜,转载请注明出处。,为什么google发布的是gemini【版权所有】唐霜 www.tangshuang.net本文作者:唐霜,转载请注明出处。而非imagen的版本呢?是否意味着,这【原创不易,请尊重版权】未经授权,禁止复制转载。其实是一个多模态模型,而非一个生图模型?未经授权,禁止复制转载。未经授权,禁止复制转载。在有了这样的疑惑之后,我开始进行验证,用【原创不易,请尊重版权】【访问 www.tangshuang.net 获取更多精彩内容】大模型的方式“你是一个xxx,你会基于用【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。户的xxx,然后xxx”的公式,命令大模【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】型进行推理,结果令人震撼。
接下来,我就将总结Nano Banana【本文受版权保护】【关注微信公众号:wwwtangshuangnet】的一些常见玩法,以及非常见的令人不可思议本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】的使用场景。以及,我将提供一个我自己开发著作权归作者所有,禁止商业用途转载。【本文受版权保护】的可免费使用nano的产品。
一、常见的图片处理场景
P照片
例如去除路人、瘦脸、白平衡处理、色调处理原创内容,盗版必究。本文作者:唐霜,转载请注明出处。等等以前在手机上需要一个App才能完成的【本文首发于唐霜的博客】著作权归作者所有,禁止商业用途转载。复杂照片处理,现在只需要用一个模型就可以未经授权,禁止复制转载。【原创内容,转载请注明出处】解决。
Image
Image
图片风格转化
例如将照片转化为漫画风格、转化为表情包、【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】变线稿等风格化处理也只需要一个模型就可以原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。完成。
Image
图片转手办照
这是现在网上最流行的一个nano的应用场转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】景,只需要提供一张图,就可以为你生成对应本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】的手办照。
Image
多图融合
多图融合可以让AI帮你把多张图片融合在一【关注微信公众号:wwwtangshuangnet】【本文受版权保护】起,这是很多其他功能的基础,比如试穿、室著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。内装修等,都是提供一张主图和多张副图,让【本文受版权保护】未经授权,禁止复制转载。nano把它们融合在一起。而nano不负转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。众望,几乎可以完美地完成这一任务。
Image
Image
照片修复
不用过多介绍了,在有一段时间火的一塌糊涂本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。的照片修复,现在只需要一个模型解决。
Image
Image
上色或变色
为线稿上色。这个我深有体会,孩子在给线稿【转载请注明来源】【本文受版权保护】涂色的时候没有思路,我就拍了一张照给AI【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net上色,让孩子看一下。
Image
动作引导
通过向nano提供一份人物动作的引导图,【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】可以让原始图片中的人物按照引导图中的动作本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。对齐。
Image
Image
电商图:试穿与解穿
电商场景下,试穿变得更加轻松。同时,还可【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。以把衣服从模特身上脱下来展示。
Image
Image
Image
室内装修
Image
产品结构分析图
Image
配合视频生成模型,还可以将上面的图片作为转载请注明出处:www.tangshuang.net【本文受版权保护】首尾帧,实现产品拆解效果,这种只有以前的本文版权归作者所有,未经授权不得转载。【本文受版权保护】广告后期才能做,现在只需要两个模型搞定了原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】
剧情演变或补间分镜生成
Nano Banana可以基于给定的图片【原创内容,转载请注明出处】【关注微信公众号:wwwtangshuangnet】,提供基于该图的更多演变。(其实照片修复未经授权,禁止复制转载。转载请注明出处:www.tangshuang.net、瘦脸等本质上也是一样的。)
Image
Image
更猛的是,nano还可以基于你提供的图和原创内容,盗版必究。【本文首发于唐霜的博客】描述,衍生出剧情。
Image
Image
Image
Image
也就是说,如果有耐心,完全可以用nano【版权所有】唐霜 www.tangshuang.net【作者:唐霜】 banana来实现一部漫画。并且,基于【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。漫画和视频模型,生成一部动漫。想想都很可【版权所有,侵权必究】【未经授权禁止转载】以。
好了,以上就是我们常见的一些nano的应【本文受版权保护】【原创内容,转载请注明出处】用场景。当然,由于网友们的脑洞无限大,还【转载请注明来源】未经授权,禁止复制转载。有很多其他的场景在开发。
但是,现在还并没有结束。接下来,我才会带未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。来更为令人震惊的nano banana的未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net一些场景。
二、深度学习和研究的工具
正如我文章开头说的,gemini是一个推著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net理模型,nano banana作为gem本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。ini的小版本,它的本质还是推理,只不过【原创内容,转载请注明出处】【转载请注明来源】在推理的基础上,进一步优化了生图的能力,著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。以前gemini生图类似于agent调用【本文受版权保护】【转载请注明来源】工具一样调用imagen来生图,而现在它【转载请注明来源】【原创内容,转载请注明出处】已经隐藏了工具调用的特征,看上去就是ge本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.netmini自己在生图。这也就意味着,gem【版权所有,侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】ini不仅可以理解图,还能用图给你讲解。
Image
Image
让gemini直接在原图中标注出你不懂的【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。或者需要理解的部分。这使得我们(作为人)本文版权归作者所有,未经授权不得转载。【作者:唐霜】可以深度的学习和掌握以前不曾也不敢掌握的【本文受版权保护】著作权归作者所有,禁止商业用途转载。知识,例如造火箭、看病。
例如我们对植物感兴趣,在网上看到一朵很奇转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。怪的花,不知道它的名字,那么你可以拍下来本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。,让gemini辅助你学习。
Image
上面是我的一个例子,当我看到这个花的时候【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。,觉得很奇怪,便让gemini为我解释。著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。如果不是gemini生成的图片,我绝对理转载请注明出处:www.tangshuang.net【本文受版权保护】解不了“兜”的含义,因为原图的视角没有拍【原创不易,请尊重版权】【访问 www.tangshuang.net 获取更多精彩内容】出兜来。
Image
此外,你有没有过这样的经历,你去医院拍片本文版权归作者所有,未经授权不得转载。【原创内容,转载请注明出处】(x光片),然后回去找医生,医生随便一瞅本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshuang.net,说“你得手术”,你拿过片,看半天看不懂本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】。现在可以让gemini帮你看片了。
Image
Image
通过合理的提示词引导,让gemini理解本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。x光片,并在原片基础上标注出病变的位置。原创内容,盗版必究。转载请注明出处:www.tangshuang.net这让我想到曾经有一位中国的极客创办了一个著作权归作者所有,禁止商业用途转载。【本文受版权保护】在线看片网站,受到世界卫生组织的关注,但【访问 www.tangshuang.net 获取更多精彩内容】未经授权,禁止复制转载。仍然谢绝资助的感人故事。
https://github.com/J转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.netimmyLv/awesome-nano-【本文受版权保护】【版权所有,侵权必究】banana
https://github.com/P本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】icoTrex/Awesome-Nano本文作者:唐霜,转载请注明出处。【本文受版权保护】-Banana-images
三、创业感悟和产品推荐
在过去一年里,我做了几个产品,和图像有关原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。。包括我在内的很多做应用创业的朋友,都面【本文首发于唐霜的博客】【原创不易,请尊重版权】临着巨大的痛苦。当我们有了一个不错的点子【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。,吭呲吭呲做了小半年,产品上线了,也获得著作权归作者所有,禁止商业用途转载。【转载请注明来源】了一些关注,结果最后大厂的一次模型升级,【本文受版权保护】本文版权归作者所有,未经授权不得转载。就把我们的功能覆盖了。
这次nano banana出来之后,我在转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】网上也听到了一些哀嚎,很多人投身在com【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。fyUI的道路上,但是随着大模型的升级,【关注微信公众号:wwwtangshuangnet】未经授权,禁止复制转载。一起要用复杂流水线才能完成的,现在只需要转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】一段提示词就可以了。这对原本做comfy本文版权归作者所有,未经授权不得转载。【关注微信公众号:wwwtangshuangnet】的人而言,真的是一次打击。
我也在不断反思,到底做什么样的产品,才不【本文受版权保护】本文作者:唐霜,转载请注明出处。至于由于大厂模型的一次升级,就不再需要我本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。们这样的产品了呢?现在很多做agent产【版权所有】唐霜 www.tangshuang.net【本文受版权保护】品的创业团队,其实也是一样的。像open【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。AI、google、微软这样的公司,直接本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。在大模型层面就可以实现agent的能力,【关注微信公众号:wwwtangshuangnet】【转载请注明来源】把工具封装起来,你都不知道它是在调用ag【作者:唐霜】著作权归作者所有,禁止商业用途转载。ent,例如写代码、做设计稿这些。
最后,我终于明白了一个道理。就像我们行业【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。流行的一句话,“能用javascript【本文受版权保护】【版权所有】唐霜 www.tangshuang.net实现的,一定会被javascript实现【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net”,这个背后的墨菲定律告诉我们一个道理,【版权所有,侵权必究】【未经授权禁止转载】只要我们现在能想到的,无论看上去多么离谱【作者:唐霜】本文版权归作者所有,未经授权不得转载。,它都有可能实现。所以,“能用AI完成的【本文受版权保护】【原创内容,转载请注明出处】,一定会被AI完成”不是一句玩笑。既然A转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。I都能做我们能做的事情了,我们还有什么意本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】义呢?
我觉得,我们的意义就在于“做自己感兴趣的原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】事”。就像这个世界上,有亿万富豪在忙着造著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】火箭,也不妨碍我们在感兴趣的捏泥巴这件事【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net上继续捏泥巴,然后把捏泥巴的过程做成短视【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。频发到网上逗大家开心。我们做自己感兴趣的【未经授权禁止转载】【本文首发于唐霜的博客】事,并不是要获得来自谁的认可,而是我们自本文作者:唐霜,转载请注明出处。【版权所有,侵权必究】己感兴趣,即便这个事情已经在别人来看不屑本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。一顾的境地。
我最近更新了很久以前发布的Visor(https://visor.fuuai.【未经授权禁止转载】【关注微信公众号:wwwtangshuangnet】com),这是一个AI作画的画布工具,你现在(直到无法使用)可以在它上面免费使用Nano Banan【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。a。之所以推荐用它来使用nano ban著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。ana,是因为在某些场景下,AI并不能直【原创内容,转载请注明出处】【作者:唐霜】接理解图片中物品的尺寸大小,从而在生图时【作者:唐霜】【版权所有,侵权必究】让物品呈现出错误的尺寸。而画布,则可以让【关注微信公众号:wwwtangshuangnet】【原创内容,转载请注明出处】你在一个界面内,按照实物比例和角度来合成未经授权,禁止复制转载。【作者:唐霜】草稿图像。一图胜千言:
Image
我想让这位模特穿上这双靴子,但是由于AI本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net无法准确得到这双靴子的实际尺寸,在生成时【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】就有可能显得太肥或太瘦,通过在图片中合理【关注微信公众号:wwwtangshuangnet】【版权所有,侵权必究】安排靴子尺寸和模特的比例,就可以让AI准本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】确理解其尺寸大小。
Image
同样,这种室内装修的生图,也需要把多个物【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。品按照实际尺寸和位置进行放置。然后让AI【关注微信公众号:wwwtangshuangnet】【转载请注明来源】生成效果图。
Image
另外,还有一种场景:
Image
这是一张手绘的草图,作者用文字、箭头标识【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。了让AI用来生成新图时的细节提示。也就是【版权所有,侵权必究】【版权所有】唐霜 www.tangshuang.net说,直接将提示指令写在了图片里面。最后可未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。以得到:
Image
当我们需要在图片中进行提示词标注时,普通【作者:唐霜】著作权归作者所有,禁止商业用途转载。的工具做不到,而Visor则可以,因为它未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net是一块画布,你可以在画布上添加文字和箭头转载请注明出处:www.tangshuang.net【本文受版权保护】来进行标识。
Image
这样,用户就可以更加自由地进行创作,而无【本文首发于唐霜的博客】【原创内容,转载请注明出处】需使用专业的工具。
最后,你还遇到过或者认为可以利用Nano本文作者:唐霜,转载请注明出处。【作者:唐霜】 Banana的应用场景呢?欢迎在下方留著作权归作者所有,禁止商业用途转载。【本文受版权保护】言区评论哦。