AI看片,Nano Banana最令人欣慰的能力,远不止于P图那么简单

广告位招租
扫码页面底部二维码联系
大概两周前,坊间爆料Nano Banan【访问 www.tangshuang.net 获取更多精彩内容】【未经授权禁止转载】a是google的新一代图像模型,在等待【未经授权禁止转载】【版权所有】唐霜 www.tangshuang.net了大概两周后,google终于官宣,并上【版权所有】唐霜 www.tangshuang.net【本文受版权保护】线了新的gemini flash版本,但转载请注明出处:www.tangshuang.net【本文受版权保护】可能Nano Banana这个名称实在太【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】有意思了,google首次在正式产品中使【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.net用预览版的别称作为最终产品名,现在,在A未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。I Studio中它以自己的原始名字作为【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。模型选项。
Image
这几天,在Nano Banana已经成为【本文首发于唐霜的博客】【本文受版权保护】公众号的热点词,我已经在公众号看到好多篇【版权所有】唐霜 www.tangshuang.net【原创不易,请尊重版权】关于用Nano Banana来P图的玩法著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。的文章了。但是,我今早突然意识到一个问题【本文首发于唐霜的博客】未经授权,禁止复制转载。,为什么google发布的是gemini【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。而非imagen的版本呢?是否意味着,这转载请注明出处:www.tangshuang.net【转载请注明来源】其实是一个多模态模型,而非一个生图模型?【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】在有了这样的疑惑之后,我开始进行验证,用本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】大模型的方式“你是一个xxx,你会基于用转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net户的xxx,然后xxx”的公式,命令大模【版权所有】唐霜 www.tangshuang.net【作者:唐霜】型进行推理,结果令人震撼。
接下来,我就将总结Nano Banana本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】的一些常见玩法,以及非常见的令人不可思议著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。的使用场景。以及,我将提供一个我自己开发【本文首发于唐霜的博客】【关注微信公众号:wwwtangshuangnet】的可免费使用nano的产品。
一、常见的图片处理场景本文版权归作者所有,未经授权不得转载。
P照片【关注微信公众号:wwwtangshuangnet】
例如去除路人、瘦脸、白平衡处理、色调处理本文版权归作者所有,未经授权不得转载。【本文受版权保护】等等以前在手机上需要一个App才能完成的【本文受版权保护】【版权所有】唐霜 www.tangshuang.net复杂照片处理,现在只需要用一个模型就可以【原创内容,转载请注明出处】【原创内容,转载请注明出处】解决。
Image
Image
图片风格转化【原创不易,请尊重版权】
例如将照片转化为漫画风格、转化为表情包、【关注微信公众号:wwwtangshuangnet】转载请注明出处:www.tangshuang.net变线稿等风格化处理也只需要一个模型就可以【版权所有】唐霜 www.tangshuang.net【作者:唐霜】完成。
Image
图片转手办照本文版权归作者所有,未经授权不得转载。
这是现在网上最流行的一个nano的应用场未经授权,禁止复制转载。原创内容,盗版必究。景,只需要提供一张图,就可以为你生成对应转载请注明出处:www.tangshuang.net原创内容,盗版必究。的手办照。
Image
多图融合【未经授权禁止转载】
多图融合可以让AI帮你把多张图片融合在一【访问 www.tangshuang.net 获取更多精彩内容】【转载请注明来源】起,这是很多其他功能的基础,比如试穿、室【本文首发于唐霜的博客】【本文受版权保护】内装修等,都是提供一张主图和多张副图,让【关注微信公众号:wwwtangshuangnet】【版权所有,侵权必究】nano把它们融合在一起。而nano不负本文作者:唐霜,转载请注明出处。【本文受版权保护】众望,几乎可以完美地完成这一任务。
Image
Image
照片修复【未经授权禁止转载】
不用过多介绍了,在有一段时间火的一塌糊涂本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。的照片修复,现在只需要一个模型解决。
Image
Image
上色或变色【原创内容,转载请注明出处】
为线稿上色。这个我深有体会,孩子在给线稿原创内容,盗版必究。【作者:唐霜】涂色的时候没有思路,我就拍了一张照给AI【作者:唐霜】未经授权,禁止复制转载。上色,让孩子看一下。
Image
动作引导【访问 www.tangshuang.net 获取更多精彩内容】
通过向nano提供一份人物动作的引导图,【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net可以让原始图片中的人物按照引导图中的动作著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net对齐。
Image
Image
电商图:试穿与解穿【未经授权禁止转载】
电商场景下,试穿变得更加轻松。同时,还可【版权所有,侵权必究】【作者:唐霜】以把衣服从模特身上脱下来展示。
Image
Image
Image
室内装修【原创不易,请尊重版权】
Image
产品结构分析图【关注微信公众号:wwwtangshuangnet】
Image
配合视频生成模型,还可以将上面的图片作为【原创内容,转载请注明出处】【本文首发于唐霜的博客】首尾帧,实现产品拆解效果,这种只有以前的【未经授权禁止转载】【本文受版权保护】广告后期才能做,现在只需要两个模型搞定了【转载请注明来源】【版权所有,侵权必究】
剧情演变或补间分镜生成【版权所有】唐霜 www.tangshuang.net
Nano Banana可以基于给定的图片【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。,提供基于该图的更多演变。(其实照片修复本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】、瘦脸等本质上也是一样的。)
Image
Image
更猛的是,nano还可以基于你提供的图和【关注微信公众号:wwwtangshuangnet】转载请注明出处:www.tangshuang.net描述,衍生出剧情。
Image
Image
Image
Image
也就是说,如果有耐心,完全可以用nano【转载请注明来源】【版权所有,侵权必究】 banana来实现一部漫画。并且,基于【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】漫画和视频模型,生成一部动漫。想想都很可著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】以。
好了,以上就是我们常见的一些nano的应本文作者:唐霜,转载请注明出处。原创内容,盗版必究。用场景。当然,由于网友们的脑洞无限大,还【本文受版权保护】【作者:唐霜】有很多其他的场景在开发。
但是,现在还并没有结束。接下来,我才会带【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。来更为令人震惊的nano banana的【本文首发于唐霜的博客】【转载请注明来源】一些场景。
二、深度学习和研究的工具【本文首发于唐霜的博客】
正如我文章开头说的,gemini是一个推【关注微信公众号:wwwtangshuangnet】本文版权归作者所有,未经授权不得转载。理模型,nano banana作为gem著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.netini的小版本,它的本质还是推理,只不过【访问 www.tangshuang.net 获取更多精彩内容】未经授权,禁止复制转载。在推理的基础上,进一步优化了生图的能力,本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。以前gemini生图类似于agent调用著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】工具一样调用imagen来生图,而现在它【未经授权禁止转载】转载请注明出处:www.tangshuang.net已经隐藏了工具调用的特征,看上去就是ge本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshuang.netmini自己在生图。这也就意味着,gem【作者:唐霜】原创内容,盗版必究。ini不仅可以理解图,还能用图给你讲解。
Image
Image
让gemini直接在原图中标注出你不懂的【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。或者需要理解的部分。这使得我们(作为人)原创内容,盗版必究。原创内容,盗版必究。可以深度的学习和掌握以前不曾也不敢掌握的【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net知识,例如造火箭、看病。
例如我们对植物感兴趣,在网上看到一朵很奇【作者:唐霜】本文作者:唐霜,转载请注明出处。怪的花,不知道它的名字,那么你可以拍下来【未经授权禁止转载】【转载请注明来源】,让gemini辅助你学习。
Image
上面是我的一个例子,当我看到这个花的时候【作者:唐霜】原创内容,盗版必究。,觉得很奇怪,便让gemini为我解释。【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net如果不是gemini生成的图片,我绝对理【未经授权禁止转载】本文作者:唐霜,转载请注明出处。解不了“兜”的含义,因为原图的视角没有拍【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。出兜来。
Image
此外,你有没有过这样的经历,你去医院拍片【本文受版权保护】本文版权归作者所有,未经授权不得转载。(x光片),然后回去找医生,医生随便一瞅转载请注明出处:www.tangshuang.net原创内容,盗版必究。,说“你得手术”,你拿过片,看半天看不懂【原创内容,转载请注明出处】【未经授权禁止转载】。现在可以让gemini帮你看片了。
Image
Image
通过合理的提示词引导,让gemini理解【未经授权禁止转载】【访问 www.tangshuang.net 获取更多精彩内容】x光片,并在原片基础上标注出病变的位置。未经授权,禁止复制转载。转载请注明出处:www.tangshuang.net这让我想到曾经有一位中国的极客创办了一个【作者:唐霜】【本文首发于唐霜的博客】在线看片网站,受到世界卫生组织的关注,但转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。仍然谢绝资助的感人故事。本文作者:唐霜,转载请注明出处。
https://github.com/J【版权所有】唐霜 www.tangshuang.net本文作者:唐霜,转载请注明出处。immyLv/awesome-nano-【作者:唐霜】著作权归作者所有,禁止商业用途转载。banana
https://github.com/P【作者:唐霜】【转载请注明来源】icoTrex/Awesome-Nano【本文受版权保护】本文版权归作者所有,未经授权不得转载。-Banana-images
三、创业感悟和产品推荐原创内容,盗版必究。
在过去一年里,我做了几个产品,和图像有关【转载请注明来源】【原创不易,请尊重版权】。包括我在内的很多做应用创业的朋友,都面转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】临着巨大的痛苦。当我们有了一个不错的点子【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。,吭呲吭呲做了小半年,产品上线了,也获得原创内容,盗版必究。【转载请注明来源】了一些关注,结果最后大厂的一次模型升级,本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】就把我们的功能覆盖了。
这次nano banana出来之后,我在本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】网上也听到了一些哀嚎,很多人投身在com著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】fyUI的道路上,但是随着大模型的升级,【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.net一起要用复杂流水线才能完成的,现在只需要著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。一段提示词就可以了。这对原本做comfy未经授权,禁止复制转载。【原创内容,转载请注明出处】的人而言,真的是一次打击。
我也在不断反思,到底做什么样的产品,才不【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。至于由于大厂模型的一次升级,就不再需要我【原创不易,请尊重版权】【作者:唐霜】们这样的产品了呢?现在很多做agent产原创内容,盗版必究。【转载请注明来源】品的创业团队,其实也是一样的。像open著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。AI、google、微软这样的公司,直接【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。在大模型层面就可以实现agent的能力,【本文首发于唐霜的博客】【原创不易,请尊重版权】把工具封装起来,你都不知道它是在调用ag著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】ent,例如写代码、做设计稿这些。
最后,我终于明白了一个道理。就像我们行业【本文首发于唐霜的博客】【转载请注明来源】流行的一句话,“能用javascript著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】实现的,一定会被javascript实现【作者:唐霜】【原创不易,请尊重版权】”,这个背后的墨菲定律告诉我们一个道理,【作者:唐霜】【原创内容,转载请注明出处】只要我们现在能想到的,无论看上去多么离谱未经授权,禁止复制转载。【未经授权禁止转载】,它都有可能实现。所以,“能用AI完成的【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。,一定会被AI完成”不是一句玩笑。既然A转载请注明出处:www.tangshuang.net原创内容,盗版必究。I都能做我们能做的事情了,我们还有什么意【版权所有,侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】义呢?
我觉得,我们的意义就在于“做自己感兴趣的未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。事”。就像这个世界上,有亿万富豪在忙着造【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。火箭,也不妨碍我们在感兴趣的捏泥巴这件事【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。上继续捏泥巴,然后把捏泥巴的过程做成短视【转载请注明来源】著作权归作者所有,禁止商业用途转载。频发到网上逗大家开心。我们做自己感兴趣的【版权所有,侵权必究】【转载请注明来源】事,并不是要获得来自谁的认可,而是我们自【原创内容,转载请注明出处】【本文受版权保护】己感兴趣,即便这个事情已经在别人来看不屑原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net一顾的境地。
我最近更新了很久以前发布的Visor(【原创内容,转载请注明出处】https://visor.fuuai.【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.netcom),这是一个AI作画的画布工具,你著作权归作者所有,禁止商业用途转载。现在(直到无法使用)转载请注明出处:www.tangshuang.net可以在它上面免费使用Nano Banan原创内容,盗版必究。【原创不易,请尊重版权】a。之所以推荐用它来使用nano ban【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。ana,是因为在某些场景下,AI并不能直【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。接理解图片中物品的尺寸大小,从而在生图时【本文首发于唐霜的博客】【未经授权禁止转载】让物品呈现出错误的尺寸。而画布,则可以让著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。你在一个界面内,按照实物比例和角度来合成【访问 www.tangshuang.net 获取更多精彩内容】未经授权,禁止复制转载。草稿图像。一图胜千言:
Image
我想让这位模特穿上这双靴子,但是由于AI【转载请注明来源】本文作者:唐霜,转载请注明出处。无法准确得到这双靴子的实际尺寸,在生成时【本文受版权保护】本文版权归作者所有,未经授权不得转载。就有可能显得太肥或太瘦,通过在图片中合理本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。安排靴子尺寸和模特的比例,就可以让AI准转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】确理解其尺寸大小。
Image
同样,这种室内装修的生图,也需要把多个物【版权所有】唐霜 www.tangshuang.net【原创不易,请尊重版权】品按照实际尺寸和位置进行放置。然后让AI本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】生成效果图。
Image
另外,还有一种场景:【转载请注明来源】
Image
这是一张手绘的草图,作者用文字、箭头标识著作权归作者所有,禁止商业用途转载。【转载请注明来源】了让AI用来生成新图时的细节提示。也就是【原创不易,请尊重版权】未经授权,禁止复制转载。说,直接将提示指令写在了图片里面。最后可【本文受版权保护】【版权所有,侵权必究】以得到:
Image
当我们需要在图片中进行提示词标注时,普通【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。的工具做不到,而Visor则可以,因为它未经授权,禁止复制转载。【未经授权禁止转载】是一块画布,你可以在画布上添加文字和箭头著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net来进行标识。
Image
这样,用户就可以更加自由地进行创作,而无【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】需使用专业的工具。
最后,你还遇到过或者认为可以利用Nano【关注微信公众号:wwwtangshuangnet】【版权所有,侵权必究】 Banana的应用场景呢?欢迎在下方留【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。言区评论哦。