AI幻觉(Hallucination)是指AI模型生成的内容虽然在语法和逻辑上看起来合理,但包含事实性错误。这是所有大语言模型的固有特性,不是Bug。
为什么会产生幻觉
- LLM本质是"概率预测器",而非"事实数据库"
- 训练数据中可能包含错误信息
- 面对不确定的问题,模型倾向于"编造"而非承认不知道
- 长文本生成中,模型可能遗忘前面的约束条件
幻觉的常见类型
- 事实错误:说爱因斯坦发明了电话
- 引文编造:引用不存在的论文、书籍、法律条文
- 数据虚构:编造统计数字和"研究表明"
- 逻辑矛盾:前后自相矛盾
- 信息拼接:把两个正确的事实组合成错误的信息
如何减少幻觉
1. RAG:让模型基于真实文档回答,而非依赖记忆 2. Grounding:要求模型标注信息来源 3. 约束Prompt:"如果你不确定,直接说不知道" 4. 多轮验证:让另一个模型检查答案的事实性 5. 降低Temperature:减少随机性,增加确定性
重要认知
幻觉不可能完全消除。2026年最好的模型(GPT-5、Claude 4)仍有3-8%的幻觉率。使用AI产出重要内容时,必须人工验证关键事实。