谷歌最新「香蕉」AI 图像模型,让网友疯玩「Vibe Photoshoping」(3) / BTC123 | 区块链信息行情第一站

谷歌最新「香蕉」AI 图像模型,让网友疯玩「Vibe Photoshoping」(3)

09-01 , 13:17 分享新闻

一秒帮程序员「挽尊」| 图片来源:极客公园

这种体验打破了很多人对 AI 图像生成以往印象 —— 「玄学」:无论你提示词写得好,出图效果惊艳;提示词写得一般,生成的东西可能完全跑偏。

但在 Gemini 2.5 Flash Image 里,我发现这种「玄学感」被削弱了很多。它对提示词的理解更精准,也更贴近用户的直觉—— 这就是为什么不少人会突然觉得它会好用很多的原因。

比如我对它说「模糊背景,突出前景人物」,几秒钟后生成的图正是我想要的效果;我让它「把照片里的人换成微笑的表情」,结果不仅嘴角微微上扬,连眼神都做了调整,细节非常到位;我甚至试过「给黑白照上色」,结果输出的彩色图并不是乱涂一气,而是尽可能贴近历史照片中该有的色彩氛围。

这种「说到做到」的能力,让我想到过去用美图秀秀时,明明只是想磨皮,结果整张脸变成了「开了十级美颜」的假人脸。而现在,Gemini 2.5 Flash Image 的操作是精准的、克制的,它真的理解你要什么,然后尽量还原。

02 能力加强,旦用难回

为了更直观,我特意拿它和我日常常用的移动端修图工具做了对比。

在 Snapseed 上,我如果要模糊背景,通常需要花一两分钟手动圈选前景区域,再调整模糊程度。即使操作熟练,也免不了反复修改。

在美图秀秀上,虽然有一键背景模糊功能,但经常会把人物的边缘模糊掉,效果不够自然。

而在 Gemini 2.5 Flash Image 上,我只需要一句话,它自动识别出人物和背景的边界,模糊效果自然,完全不需要二次修饰。

在更改画面中细节的同时,仍然对其他背景部分避免了此前 AI 工具经常出现的「乱涂乱画」 | 图片来源:Twitter

这种对比其实说明了一点:Gemini 2.5 Flash Image 把用户从复杂操作中解放了出来,把更多的工作交给了模型。对于普通人来说,它降低了修图的门槛;对于专业人士来说,它节省了大量时间。

体验下来,我最大的感受是,Gemini 2.5 Flash Image 已经不再只是一个修图工具,而是更接近「智能助手」。

过去,我们用美图秀秀,是在使用一个预设好的功能合集,滤镜、美颜、马赛克,每一个按钮对应一个功能。你要做的就是一点点选择、一步步调整,直到满意。

而现在,Gemini 2.5 Flash Image 的逻辑完全不同。它不再要求你学习工具的逻辑,而是直接理解你的需求。你只要说出来,它就替你完成。

这种转变看似细微,但实质上完全改变了 P 图这个流程的关系。以前是我们去适应工具,现在是工具来适应我们。这种交互方式,本身就是下一代应用形态的雏形。