以下是使用过程中出现频率最高的问题,以及经过测试确认有效的解法。
文字 / LOGO 渲染问题
生成的图片里文字变形或乱码
AI 模型对精确文字的渲染能力有限制。简化策略:把文字量控制在8个字以内,提示词里加 clearly readable text, sharp letterforms。如果文字对品牌很重要,用 Canva 或 Photoshop 后期叠加更可靠。
英文单词拼写错误
可以在提示词里做拼写强调:spell exactly: P-R-O-D-U-C-T,或者多生成几次选最准确的。长期来看,重要品牌文字走后期方案更稳定。
角色 / 主体一致性问题
多张图里同一个人物面孔不一致
方法一:保持在同一个会话窗口生成(不要开新对话)。方法二:把第一次满意的图上传作为参考图,新的生成以它为基准。方法三:提示词里每次都详细描述角色特征(发色、发型、面部特征、服装)。NB2 支持最多跨5张图的角色一致性。
批次生成中服装/配饰发生变化
每次生成时重复写服装描述,不能只写"穿着之前的服装"—— 模型没有真正的跨生成记忆。要写 wearing the same [颜色+款式+具体特征] as before。
内容安全限制
真实名人图像生成被拒绝
这是 Google 的内容安全策略,无法绕过。用职业描述代替人名:a woman in her 30s, professional businesswoman, dark hair, confident expression。
NB2 修改金融信息被拒绝
2026年2月后,NB2 对票据、证件、价格标签等金融信息的修改请求拒绝率大幅提升。这类需求需要通过其他方式处理(例如直接在图片编辑软件里修改)。
视频质量问题
视频里运动不自然或有抖动
最有效的方法是简化场景(场景越简单,运动越流畅),并且明确指定镜头运动方式。"展示产品"这类模糊描述会导致不可控的随机运动。用 slow push-in、static camera 这类具体词。
Veo 3.1 生成的音效不符合预期
音效描述越具体越好:soft piano with occasional string swell 比 beautiful music 好,quiet café ambient with distant conversation 比 café sounds 好。对音效要求很精确的内容,考虑生成无音效版本后期配音。
Seedance 2.0 生成的视频出现多余肢体或物品消失
这是复杂场景下的已知问题(约10%的发生率)。减少同时运动的物体数量,简化主体动作,提示词控制在60词以内。如果反复出现,换 Seedance 1.5 生成,质量稍低但稳定性更好。
其他问题
多轮对话后生成风格偏离了之前的方向
开启新会话,每次生成重复核心风格描述,把第一次满意的提示词存下来作为"种子",不要依赖会话历史保持风格。
更多提示词优化方法见 提示词写作技巧,具体模型的使用方法见各模型指南。