我曾经也是AI旁观者,直到这两个词把我卷进洪流(1)

很多人以为自己不适合 AI,不会用AI,其实只是一直没碰到“让你立刻上手并得到正反馈”的那个入口。
看着别人ai变现,一人成军,热火朝天的讨论现在的趋势,而你只会用豆包,豆包豆包,帮我写个小作文,看着产出的ai文翻个白眼关掉。继续刷短视频,去群聊里水群。日复一日。
AI还离我很远,没什么用。
并不是,你只是没想到AI的能力。
真正把你带进 AI 世界的,不是概念最多的教程,而是第一次“我竟然真能用上”的体验。
当你从“学 AI”到“用 AI 做一件小事”,成长曲线会突然变陡。1. 我与AI的初见
我自己从 gpt 3.5 的那会就开始接触ai,后来又用到SD,mj等工具,无非也就是画画美女,并没有真正的打起兴趣,why?

“因为我没有获得除了自嗨之外的任何正反馈”
人是有惯性的,必须有一个外力,促使其改变原有的运行轨迹,对我来说。这两个外力就是:
“Nano banana” 和 “vibe coding”
2. 小香蕉,大能量
Nano Banana,不是一个单独的某个ai,通俗讲,它是:
“一个能用自然语言改图、生图、续改图的 AI 修图/出图模型。” ,就是一个画图的ai啦,在25年大概9月推出,几个月过去,现在差不多人人都在用了。
所以如果你还没接触到这个名词,
我建议你现在立刻马上就直接去Gemini网站上用一下:Google Gemini

3. 让我辞职后,兼职收入持平上班的救星
我的本职是设计师,除了跟甲方/业主吹牛逼,干活时候老几样的工作流:rhino,D5,PS 之类的建模+出图工具,基本就是我的日常。
在AI初期,SD就很火热,在效果图阶段,已经开始逐渐取代了传统的出图流程,但对于熟练工来说,改图是非常麻烦的,而且界面的学习和上手难度也比较高。要控制各种细节问题,效果还是不如古法手搓的效果好。我也在工作中主动推行了这些工具并切实实现了效率上的提升。但是到了25年,一切又都不一样了。

Nano banana画图、分析图和效果图,很实际地节省了时间,在辞职兼职那段时间给了我很大帮助。

当时,被铺天盖地的banana画图能力有多牛逼的言论所洗脑,那我也来试试,而下面这些,则都是ai在很短时间内给我的结果,分别包含了不同时间段下的效果图。




这么说吧,如果我要古法手搓全部的内容。至少需要3天时间,哪怕用SD+Comfyui,也需要选模型,lora,微调提示词等工作,效果还不一定好。
而这一切,在banana的加持下,这几张图的产出只需要30分钟,并这里面有20分钟我都是在等待网络和ai输出结果,我完全可以离开座位,去泡杯茶,干点别的。最后拿到结果,然后p掉水印即可。至于清晰度的问题,有高清放大功能的ai,也完全不是难点。
那么,上面的案例是有参考图的,那我能不能从头开始呢?
当然可以

一个软件不开,一张草图不画。
“一张人视角建筑设计效果图,建筑为多层跌落的白色体块组成,现代主义,场地位于海边,有着干净利落的虚实关系,白色实体墙面和玻璃幕墙,木材质框架。”
一句话,便能产出如此正确且美观的图像,属实是震撼人心,我原本的comfyui工作流,立即便被取代了一大半。大厂的闭源多模态大模型,能力真的是远超开源。
而下一步,针对这张效果图,自然也能产出清晰,有逻辑性的分析图等内容。现在,分析图和文本内容的产出,也可以被优化了。
以上的一切流程,至今才过去了不到一年。**而依靠由此带来的效率的提高我离职之后,依靠之前工作积累下来的客源,在几个月内,总收入就已经持平了工作期间的收入。**这还是我比较犯懒的情况下。
4. 我的第一次 Vibe coding(氛围编程)
这是我最终决定all in ai,并开始主动去学习ai,产品相关知识的直接因素。因为这使得我真正跳出了原有的行业围城,发现了更广阔,更全新的可能性。
最初的vibe尝试,我使用的是浏览器里的Coplit,在之前工作当中用到,只写了一小段程序,但我并不会编程,代码运行的也不是很好,我也并没有真正意识到ai能写代码意味着什么。
巧合的是,与banana相同,第一次真正接触到vibe coding,还是用的google的Gemini,我长期用的ai工具就是Gemini,可以说当时如果我没有注册google账号,我应该就不会走上现在的道路(但谷歌你做个人吧,你看看现在做的产品都是些什么狗屎)。这里放一张我第一次vibe coding做出来的工具截图
无论你是什么职业行业,都一定要尝试一下独立创造的成就感。
《画外》照片边框水印工具 RZFrame :

github链接:画外边框 一款照片边框生成工具。专为摄影爱好者,支持读取照片元数据(光圈、快门、ISO、镜头等),并根据预设模版为照片增加艺术风格边框。
(青春版)web端链接:RZFrame Web

