你是否有过这样的经历?为了让 AI 画出 “阳光透过梧桐叶洒在石板路” 的意境,写了三百字描述,结果它却交出一张梧桐树照片;但当你只说 “法式梧桐斑驳光影”,生成质量反而提升。
这个现象其实在大语言模型和 AI 绘图方面都有体现。网上有些教程会给一大段玄而又玄的 Prompt,但效果未必比一句简短的“人话”输出结果更好。甚至稍微多问几次就完全不按照要求执行了。
所以本文想用尽量通俗的语言聊聊“AI 提示词为什么不是越长越好?”这个话题。
注意力蛋糕理论
想象 AI 大脑里有一块固定大小的蛋糕,每个字都在瓜分这块蛋糕。当我们输入 “请用幽默的口吻,以三个分论点,对比分析新能源汽车和燃油车的优缺点,控制在 800 字以内” 时,“幽默”“三个分论点”“对比分析”“800 字” 这些关键词都在争夺蛋糕 —— 最终每个词分到的注意力可能不足 20%。
最新研究显示,当提示词包含超过 5 个非核心要素时,AI 对主任务的关注度会骤降 37%。这就像同时给厨师下达 “做川菜”“少放盐”“用青花瓷盘装”“摆成心形”“五分钟完成” 等等细节指令,甚至写一篇小作文细化所有细节,反而容易得到一盘四不像的菜品。
而“做一份微辣的麻婆豆腐”这样的明确指令,反而可以让厨师(AI)有更明确的目标,用户也能获得更符合预期的效果。
上下文窗口限制
你可能听说过 AI 有 “上下文窗口”,通俗的讲,上下文窗口就像哆啦 A 梦的记忆面包(只要把内容印在面包上,再吃下去,就能记住内容)。但这块面包的容量是有限的:当前最先进的模型能记住约 30 万汉字(128K Token),不过面包的新鲜度会从第一口开始递减。