12 月 10 日消息,消息源 @marmaduke091 今天(12 月 10 日)在 X 平台发布推文,报道称继 gpt-image-1 发布七个月后,OpenAI 正在测试代号为“Hazelnut(榛子)”和“Chestnut(栗子)”的两款全新 AI 图像模型。
爆料指出 OpenAI 正在加快产品迭代的步伐,这两个模型在过去 24 小时内频繁出现在 Design Arena 和 LM Arena 等模型竞技场中。
若消息属实,OpenAI 极有可能在近期推出这两款新模型,甚至可能作为传闻中即将发布的 GPT-5.2 模型的伴生产品一同登场。
目前行业内普遍猜测 GPT-5.2 的发布窗口已近,而图像生成能力的更新往往是模型大版本升级的重要组成部分。不过,官方尚未对此作出最终确认,具体的发布时间表仍需等待进一步消息。
早期测试反馈显示,新模型最大的技术突破在于对“图像内代码”的渲染能力。相比以往模型在生成包含文字或代码的图片时常出现的乱码现象,新模型能更可靠地在图像中呈现清晰、准确的代码文本。
此外,其展现出的“世界知识”水平也大幅提升,在通用场景的理解力上已能与谷歌旗下的 Nano Banana Pro 模型分庭抗礼。
不过该媒体指出,OpenAI 早期测试模型尽管在文本渲染上有所突破,新模型在人像生成的质感上仍有待打磨。
多位 X 平台用户在查看测试样张后指出,虽然生成的名人自拍在构图上颇具逼真感,但面部皮肤纹理呈现出明显的“塑料感(Plasticky)”,缺乏真实皮肤的细腻度。相比之下,竞争对手谷歌的 Nano Banana Pro 在人像细节和自然度上目前仍保持着领先优势。
技术架构方面,业内传闻称这两款正在测试的模型并非基于最新的 gpt-image-1 迭代,而是基于早期的 GPT-4o 模型架构开发,可能意味着 OpenAI 正尝试通过不同的技术路径来优化图像生成能力。当然,在官方正式发布技术白皮书之前,关于模型底层架构的具体细节仍属于推测阶段。


微信扫一扫
支付宝扫一扫 