莫崇宇 · 2026-02-27

Nano Banana 2发布:AI生图的新里程碑

摘要

Google正式发布Nano Banana 2(Gemini 3.1 Flash Image)图像生成模型。该模型在画质、提示词理解力和性价比方面实现突破,能够准确理解中文排版、处理复杂UI场景,并保持角色一致性(最多5个角色脸不崩或14个物品不变)。API价格降至上一代Pro模型的一半,生成一张4K高清图成本约0.15美元。

内容框架与概述

文章首先回顾了AI生图技术三年来的发展历程,指出早期模型缺乏常识、无法理解中文和空间关系的痛点。Nano Banana 2通过接入Gemini庞大的真实世界知识库和实时网页搜索,显著改善了这些问题。文章用多个案例展示了模型在中文书法、复杂UI排版、双页漫画、信息图设计等方面的能力提升,并特别强调了其空间理解力和透视关系的处理水准。

主体一致性是此次更新的另一大亮点。文章指出,该模型能在一次生成中保持5个角色的面部特征或14个物品的形态稳定,这使得连载漫画和影视分镜制作成为可能。画质方面,从512px配图到4K超高清海报均能胜任,文章展示了赛博朋克风街景、波普艺术、时尚大片等多种风格的生成效果。

文章也客观指出了模型的短板:在跨维度融合场景(如二次元人物、素描和黏土人混入真实场景)中,效果不如前代自然。性价比才是Nano Banana 2站稳脚跟的关键。API价格较上一代Pro模型减半,4K高清图成本约0.15美元。免费用户24小时内可生成100张,Pro订阅用户高达1000张。

核心概念及解读

主体一致性(Subject Consistency):指AI模型在生成图像时保持角色或物品外观特征稳定的能力。Nano Banana 2可保持5个角色的面部特征或14个物品的形态不变。

SynthID数字水印:Google开发的AI生成内容标识技术,可在图像中嵌入不可见水印,用于验证图片是否由AI生成以及其修改历史。

C2PA内容凭证(Content Credentials):一种开放技术标准,用于追踪数字内容的来源和编辑历史,帮助用户识别AI生成的内容。自去年11月以来,Gemini验证功能已被调用超过2000万次。


原文信息


此摘要卡片由 AI 自动生成