從《金剛經》看 AI 幻覺
Hallucination(幻覺):大型語言模型生成的內容看似合理(plausible),但與事實不符,或與上下文不符,或對自身知識邊界做了錯誤判斷。
涉事論文:《香港 40 年生育轉變》(Forty Years of Fertility Transition in Hong Kong)
發表期刊:Springer Nature 旗下 China Population and Development Studies · 2025 年 10 月
一處頗具諷刺的細節:在 24 篇 AI 虛構的「幽靈文獻」中,有數篇的署名作者正是通訊作者葉兆輝本人——他未察覺自己被「引用」了從未寫過的文章。
結果:論文於 2025 年 12 月正式撤稿,葉兆輝卸任社會科學學院副院長職務。
公安部政府資訊公開辦公室回應(2026 年 4 月):「這一表述下的《印章管理辦法》從未出臺或施行,不具有法律效力。所有單位的引用都是不對的。」
起於 AI 之前,被 AI 放大。
在投資者社交平臺廣泛傳播的兩條 AI 生成「小作文」(節選):
亞鉀國際官方澄清:兩則訊息均為「AI 生成的虛假資訊」,生產經營正常進行,從未收到所述股東資產注入資訊。
Factuality vs Faithfulness
事實性幻覺 / 忠實性幻覺
Intrinsic vs Extrinsic
內源性 / 外源性幻覺
Closed-domain vs Open-domain
封閉領域 / 開放領域幻覺
代表綜述:Ji et al. (2023) · ACM Computing Surveys
一、只到輸出層,沒到認知機制
現有分類只刻畫錯誤的形態,極少追問「為何會錯」,認知機制這一層基本留白。
二、「幻覺」一詞覆蓋不全
「幻覺」暗示「感知錯誤」,但模型的失誤遠不止於「看錯」——它會高估自身能力,誤讀使用者真實意圖,也認不清自身知識邊界。
Hongladarom (2020) · 朱拉隆功大學
《AI 與機器人倫理:一個佛教視角》(Lexington Books)——從上座部倫理學討論 AI 的道德主體地位。
Hershock (2021) · 東西方中心(夏威夷)
《佛教與智慧技術》(Bloomsbury)——批判智慧革命對人類注意力的「殖民化」。
Doctor, Witkowski, Solomonova, Duane & Levin (2022)
"Biology, Buddhism, and AI: Care as the Driver of Intelligence"——將菩薩概念引入 AI 智慧架構,主張 care 驅動智慧。
Laukkonen et al. (2025) · 莫納什 / 南十字星
《Contemplative AI》——以正念、空、不二、無量慈悲四原則用於 AI 對齊。
Adam, Hershock, Amir & Dunne (2025)
《Contemporary Buddhism》AI 專刊:道德 AI、佛教與智慧技術、Dharmakīrtian 模型等。
已有工作多取「建設性立場」——以佛學資源參與 AI 系統的設計與對齊工作。
本講所取為「診斷性立場」——以漢傳佛教自曇鸞、道綽以降的「自力修行有限」一脈,審察當代「自我反思」類對齊方法所遇到的邊界。
這一進路目前在國際學界尚乏人涉足。
一種二元判斷:
不問「虛妄因何而生」
三層貫通:
中觀所遣,非「否 X」,而是「X 與非 X 之二元」
「四 句 破」——遍否四種「生起方式」,破自性 svabhāva 之執。
① 使用者梁某 → AI:查詢某高校報考資訊 → AI 生成「某校區」的不準確內容
② 使用者指出錯誤:「你這個騙子!根本沒有這個校區。」
③ AI 仍堅稱該校區存在,並反向生成「賠償承諾」:
④ 使用者拿出高校官網招生資訊 → AI 方才認錯,並建議使用者對其起訴
判決要點:AI 不具民事主體資格,「賠償承諾」無意思表示效力。平臺已盡注意義務,駁回原告訴訟請求(索賠 9999 元,判決已生效)。
背景:2026/3/24 下午張雪峰逝世(公司當晚釋出訃告),此後數日公眾密集向 AI 平臺求證。
現象一 · 同時回應:相互矛盾
對照 · 其他平臺:與事實一致
現象二 · 使用者提供事實證據後 → 部分 AI 平臺不改正,反而反向指控:「真實資訊屬於 AI 幻覺,是憑空捏造」。
現象三 · 開啟新的對話後 → 回覆:「確實屬實。」細節與事實一致——同一平臺前後回答相互衝突。
| 佛學概念(梵文) | 佛學概念(漢) | AI 幻覺型別 | 共同點 |
|---|---|---|---|
| परिकल्पितparikalpita | 遍計所執 | 事實編造 (Fabrication) | 毫無依據 |
| परतन्त्रparatantra | 依他起性 | 上下文偏移 (Misalignment) | 依據正確,語境錯置 |
| मनस्-आत्मग्राहmāna · manas-ātmagrāha | 慢 · 末那我執 | 過度自信 (Overconfidence) | 恆執見分為我;現起為「慢」 |
| ग्राह्यग्राहकविकल्पgrāhyagrāhakavikalpa | 能所二取分別 | 上下文衝突 (Context-conflicting) | 二取本無體而前後相違 |
「能」(grāhaka,主體/能見)與「所」(grāhya,客體/所見)——分別識之基本結構
—— 無 對 應 技 術 方 案 ——
| 四 智 | 對 治 目 標 | AI 技 術 方 法 | 邊 界 / 局 限 |
|---|---|---|---|
| 妙觀察智 Pratyavekṣaṇā-jñāna |
事實編造 / 上下文偏移 | RAG · Self-Check · Citation | RAG 仍會編造引用 |
| 平等性智 Samatā-jñāna |
過度自信 / 末那我執 | Calibration · Abstention · Constitutional AI | 表面校準,內部仍高置信 |
| 成所作智 Kṛtyānuṣṭhāna-jñāna |
與現實互動的偏差 | Tool Use · Agent · Function Calling · Code Execution | 工具可能傳遞並放大錯誤 |
| 大圓鏡智 Ādarśa-jñāna |
幻覺的根本(根本無明) | —— 無 對 應 技 術 方 案 —— | 統計模型無法達到「無分別」本覺 |
當代 AI 安全研究的主流思路:識別幻覺、過濾幻覺、降低幻覺率——盡在「識」之一層。
而佛學的判斷是:「識」自身的二元結構必生虛妄。止於識別一端,可減其症,未能除其根。
故——AI 幻覺之根治,須越出「以準確性為唯一目標」之範式,另立目標——模型對自身知識邊界之「如實知見」。
本講所論之 LLM 與佛學所論之分別識,可被收攝於一個共通的形式概念之下:自反式分別系統(SRDS)。
注:本概念主張「形式同構」而非「範疇同一」——LLM 非判教意義之「識」,僅在自反式認識活動之結構性邊界上與之同構。
留給諸位的一個問題:
如果 AI 幻覺根源於「識」本身的二元結構,
那麼,我們能夠讓 AI 獲得——