每周 15 亿张图。这是 ChatGPT 图像生成功能交出的最新成绩单。OpenAI 的研究员与产品负责人在一场对谈中把这个数字摆上台面,紧接着就把话题抛向了更棘手的问题:当生成图片比发短信还快,人们究竟在用这些东西干什么,接下来又会往哪走。自 Images 2.0 发布以来,用例早已跳出“在向日葵田里奔跑的柴犬”那种自嗨阶段。团队观察到,大量用户把图片生成嵌入了真实的工作流——产品设计师用它出概念草图、电商卖家批量生成模特图、内容创作者直接把故事板从纸面搬进了对话框。
一个微妙的趋势是,生成行为正在从“单张求美”转向“序列输出”。过去人们绞尽脑汁雕琢一张完美图片,现在越来越多的对话围绕着一组图片展开:同一角色的不同表情、同一场景的不同光照方案、甚至连续的漫画分镜。这背后对模型的一致性控制提出了全新要求,也解释了为什么 OpenAI 着急把角色一致性、风格锁定这类能力塞进 Images 2.0。对谈中透露的另一层信号藏在数据的体感里——15 亿张不是峰值,而是周活常态。这意味着图像生成已经从 AI 爱好者圈子破壁,挤进了更务实的商业土壤。当图像生产的边际成本趋近于零,比拼的就不再是谁能画,而是谁能精准描述、谁能把生成结果串成可交付的资产。这场对话没有给出答案,但给出了一个足够锋利的判断:视觉叙事的权力棒,正在从工具人手里,移交到所有会打字的人手上。

