谷歌最新「香蕉」AI 图像模型，让网友疯玩「Vibe Photoshoping」(3) / BTC123

一秒帮程序员「挽尊」｜图片来源：极客公园

这种体验打破了很多人对 AI 图像生成以往印象 —— 「玄学」：无论你提示词写得好，出图效果惊艳；提示词写得一般，生成的东西可能完全跑偏。

但在 Gemini 2.5 Flash Image 里，我发现这种「玄学感」被削弱了很多。它对提示词的理解更精准，也更贴近用户的直觉—— 这就是为什么不少人会突然觉得它会好用很多的原因。

比如我对它说「模糊背景，突出前景人物」，几秒钟后生成的图正是我想要的效果；我让它「把照片里的人换成微笑的表情」，结果不仅嘴角微微上扬，连眼神都做了调整，细节非常到位；我甚至试过「给黑白照上色」，结果输出的彩色图并不是乱涂一气，而是尽可能贴近历史照片中该有的色彩氛围。

这种「说到做到」的能力，让我想到过去用美图秀秀时，明明只是想磨皮，结果整张脸变成了「开了十级美颜」的假人脸。而现在，Gemini 2.5 Flash Image 的操作是精准的、克制的，它真的理解你要什么，然后尽量还原。

02 能力加强，旦用难回

为了更直观，我特意拿它和我日常常用的移动端修图工具做了对比。

在 Snapseed 上，我如果要模糊背景，通常需要花一两分钟手动圈选前景区域，再调整模糊程度。即使操作熟练，也免不了反复修改。

在美图秀秀上，虽然有一键背景模糊功能，但经常会把人物的边缘模糊掉，效果不够自然。

而在 Gemini 2.5 Flash Image 上，我只需要一句话，它自动识别出人物和背景的边界，模糊效果自然，完全不需要二次修饰。

在更改画面中细节的同时，仍然对其他背景部分避免了此前 AI 工具经常出现的「乱涂乱画」｜图片来源：Twitter

这种对比其实说明了一点：Gemini 2.5 Flash Image 把用户从复杂操作中解放了出来，把更多的工作交给了模型。对于普通人来说，它降低了修图的门槛；对于专业人士来说，它节省了大量时间。

体验下来，我最大的感受是，Gemini 2.5 Flash Image 已经不再只是一个修图工具，而是更接近「智能助手」。

过去，我们用美图秀秀，是在使用一个预设好的功能合集，滤镜、美颜、马赛克，每一个按钮对应一个功能。你要做的就是一点点选择、一步步调整，直到满意。

而现在，Gemini 2.5 Flash Image 的逻辑完全不同。它不再要求你学习工具的逻辑，而是直接理解你的需求。你只要说出来，它就替你完成。

这种转变看似细微，但实质上完全改变了 P 图这个流程的关系。以前是我们去适应工具，现在是工具来适应我们。这种交互方式，本身就是下一代应用形态的雏形。