果殼裡的 AI · 1500 年後的般若學
— 第 一 講 —

幻覺與虛妄

從《金剛經》看 AI 幻覺

彭 一 楠 · Kevin Peng

"Generative AI hallucinates — it makes up answers that sound plausible but aren't based in fact."
生成式 AI 有個致命傷——愛"一本正經地胡說八道"。
—— 黃仁勳 Jensen Huang · NVIDIA CEO · GTC 2024 / HKUST 2024
"In frontier models hallucination will grow ever rarer, but it will never disappear — this is the nature of generative AI."
幻覺在前沿模型裡會越來越少,但它不會消失——這是生成式 AI 的特點。
—— 張亞勤 · 中國工程院院士 · 清華大學智慧產業研究院(AIR)院長

20 年前的舊稿,今日的續篇

2006 年
《果殼裡的駭客》
上海某高校講稿,41 張幻燈片
七段《金剛經》原典(梵漢對照)
與七段技術論說交替排布
以"應無所住而生其心"收尾
對象:網路駭客文化
2026 年
本講座
"果殼裡的 AI"系列六講
以漢傳佛教文本為思想資源
對接 AI 與演算法的倫理
保留"舉經-應用"交替體例
對象:AI 與演算法倫理

本講的論證路徑

AI 幻覺
表面是技術問題,底裡是認知問題。
般若學的"虛妄"
較當代分類更為細密。
概念對應
把這套辨析用在 AI 上。
第 一 部 分

AI 幻覺的當代圖景

Hallucination in Large Language Models

什麼是 AI 幻覺?

Hallucination(幻覺):大型語言模型生成的內容看似合理(plausible),但與事實不符,或與上下文不符,或對自身知識邊界做了錯誤判斷。

特點 一
看似合理
語句流暢,邏輯自洽。
特點 二
實際錯誤
但與事實、上下文或自身能力不符。
特點 三
難以識別
使用者往往無從分辨。
案例一:港大社科院副院長論文的「幽靈引用」
香港大學社會科學學院副院長葉兆輝(Paul Yip)論文撤稿事件 · 2025 年 12 月

涉事論文:《香港 40 年生育轉變》(Forty Years of Fertility Transition in Hong Kong)
發表期刊:Springer Nature 旗下 China Population and Development Studies · 2025 年 10 月

61
參考文獻總數
24
AI 虛構的「幽靈文獻」
39%
論文引用偽造率

一處頗具諷刺的細節:在 24 篇 AI 虛構的「幽靈文獻」中,有數篇的署名作者正是通訊作者葉兆輝本人——他未察覺自己被「引用」了從未寫過的文章。

結果:論文於 2025 年 12 月正式撤稿,葉兆輝卸任社會科學學院副院長職務。

來源:Springer Nature 撤稿宣告、新京報、虎嗅等多方報道
案例二:30 餘家司法機關引用一部不存在的法規
「《中華人民共和國印章管理辦法》」援引亂象 · 2019—2026
某基層法院《更換印章公告》節選:「根據《中華人民共和國印章管理辦法》及《最高人民法院關於地方各級人民法院和專門人民法院印章管理的規定》,最高人民法院批准併為其制發了新印章……」

公安部政府資訊公開辦公室回應(2026 年 4 月):「這一表述下的《印章管理辦法》從未出臺或施行,不具有法律效力。所有單位的引用都是不對的。」

超 10
個 省 份
30 餘
家 法 院 / 檢 察 院
7 年
持 續 時 間

起於 AI 之前,被 AI 放大。

來源:新京報、求是網、上觀新聞(2026 年 4 月);公安部政府資訊公開辦公室回應
案例三:AI「小作文」一日蒸發 A 股龍頭數十億市值
亞鉀國際(000893)AI 謠言事件 · 2026 年 4 月 14 日

在投資者社交平臺廣泛傳播的兩條 AI 生成「小作文」(節選):

①「亞鉀國際東泰產區因農田塌陷,自 2026 年 1 月被寮國能源礦產部停產,至今未恢復生產,年產 200 萬噸產能損失……」

②「控股股東匯能集團擬將煤化工資產注入亞鉀國際……」

亞鉀國際官方澄清:兩則訊息均為「AI 生成的虛假資訊」,生產經營正常進行,從未收到所述股東資產注入資訊。

-9.71%
當日盤中跌停
499 億
收盤市值(蒸發數十億)
22.2 億
成交額(創近 18 月新高)
來源:中國證券報、新浪財經、澎湃新聞、東方財富網(2026 年 4 月 14-15 日);亞鉀國際官方微信公眾號澄清宣告

既有研究的幻覺分類——以及未及之處

學界目前的幾種分法

Factuality vs Faithfulness
事實性幻覺 / 忠實性幻覺

Intrinsic vs Extrinsic
內源性 / 外源性幻覺

Closed-domain vs Open-domain
封閉領域 / 開放領域幻覺

代表綜述:Ji et al. (2023) · ACM Computing Surveys

兩處尚未觸及

一、只到輸出層,沒到認知機制
現有分類只刻畫錯誤的形態,極少追問「為何會錯」,認知機制這一層基本留白。

二、「幻覺」一詞覆蓋不全
「幻覺」暗示「感知錯誤」,但模型的失誤遠不止於「看錯」——它會高估自身能力,誤讀使用者真實意圖,也認不清自身知識邊界。

佛學與 AI:國際學界已有的工作Buddhism & AI as an International Conversation, 2020—2025

主流:以佛學資源助 AI

Hongladarom (2020) · 朱拉隆功大學
《AI 與機器人倫理:一個佛教視角》(Lexington Books)——從上座部倫理學討論 AI 的道德主體地位。

Hershock (2021) · 東西方中心(夏威夷)
《佛教與智慧技術》(Bloomsbury)——批判智慧革命對人類注意力的「殖民化」。

Doctor, Witkowski, Solomonova, Duane & Levin (2022)
"Biology, Buddhism, and AI: Care as the Driver of Intelligence"——將菩薩概念引入 AI 智慧架構,主張 care 驅動智慧。

Laukkonen et al. (2025) · 莫納什 / 南十字星
《Contemplative AI》——以正念、空、不二、無量慈悲四原則用於 AI 對齊。

Adam, Hershock, Amir & Dunne (2025)
《Contemporary Buddhism》AI 專刊:道德 AI、佛教與智慧技術、Dharmakīrtian 模型等。

本講:以佛學診斷 AI

已有工作多取「建設性立場」——以佛學資源參與 AI 系統的設計與對齊工作。

本講所取為「診斷性立場」——以漢傳佛教自曇鸞、道綽以降的「自力修行有限」一脈,審察當代「自我反思」類對齊方法所遇到的邊界。

這一進路目前在國際學界尚乏人涉足。

第 二 部 分

佛學傳統中的「虛妄」

Delusion in the Buddhist Tradition
वज्रच्छेदिका प्रज्ञापारमिता सूत्रम् Vajracchedikā Prajñāpāramitā Sūtram
《金剛般若波羅蜜經》
【梵本】
यावत्सुभूते लक्षणसम्पत्तावन्मृषा ।
यावदलक्षणसम्पत्तावन्न मृषा ।
इति हि लक्षणालक्षणतस्तथागतो द्रष्टव्यः ॥
【鳩摩羅什譯本】
凡 所 有 相,皆 是 虛 妄。
若 見 諸 相 非 相,則 見 如 來。

「虛妄」並非單一概念

日 常 理 解
虛妄 = 虛假

一種二元判斷:

  • 真 / 假
  • 實 / 虛
  • 存在 / 不存在

不問「虛妄因何而生」

般 若 學 的 細 致 辨 析
一個有內部結構的概念

三層貫通:

  • 虛妄如何「顯現」
  • 顯現的「認知地位」
  • 如何被「識別」

唯識學對「虛妄」的三層分析Three Natures · Trisvabhāva

परिकल्पित parikalpita
遍計所執性
由分別心遍計度而生之虛妄。
純粹概念虛構,無所依據。
— 最 淺 —
परतन्त्र paratantra
依他起性
依因緣而起,因緣而滅。
有依據,無自性。
— 中 等 —
परिनिष्पन्न pariniṣpanna
圓成實性
前二者的真實本然,非虛妄的實相。超越二元的覺悟之相——非西方哲學意義上的形而上學。
— 最 深 —
लङ्कावतारसूत्रम् Laṅkāvatāra-sūtram
《楞伽阿跋多羅寶經》
【梵本】
त्रैधातुकं चित्तमात्रम्
स्वचित्तदृश्यमात्रं तु
बहिर्द्रव्यं न विद्यते ॥
【求那跋陀羅譯本】
覺 自 心 現 量,外 性 非 性,
不 妄 想 相。

唯識四分Four Aspects · 《成唯識論》卷二

相 分
निमित्त-भाग
nimitta-bhāga
所認識之境(客體)
見 分
दर्शन-भाग
darśana-bhāga
能認識之用(主體)
自 證 分
स्वसंवित्ति-भाग
*svasaṃvitti-bhāga
能證「見分」之用
證 自 證 分
स्वसंवित्तेः संवित्ति
*svasaṃvitteḥ saṃvitti
證知「自證分」之用

中觀雙遣:龍樹的論證形式Madhyamaka's Method of Double Negation

諸 法 不 自 生,亦 不 從 他 生,
不 共 不 無 因,是 故 知 無 生。

中觀所遣,非「否 X」,而是「X 與非 X 之二元」

否 定 一
自 生
否 定 二
他 生
否 定 三
共 生
否 定 四
無 因 生

「四 句 破」——遍否四種「生起方式」,破自性 svabhāva 之執。

第 三 部 分

四種幻覺的映象分析

Four Hallucinations Mirrored
對 應 一
遍計所執 ↔ 事實編造型幻覺
परिकल्पित parikalpita
遍 計 所 執
由分別心遍計度而生之純粹虛構,無現實所依。
Factual Fabrication(屬 Factuality 事實性幻覺之子類)
事 實 編 造
模型生成的內容在訓練資料中並無所依,全屬憑空編造。
案例:港大葉兆輝論文中 24 篇虛構「幽靈文獻」——DOI 全部 Not Found
對 應 二
依他起性 ↔ 上下文偏移型幻覺
परतन्त्र paratantra
依 他 起 性
依因緣而起,有所依而無自性,遍計執方添「自性」而成虛妄。
Context-Misalignment(屬 Faithfulness 忠實性幻覺之子類)
上 下 文 偏 移
模型所生之內容在訓練資料中確有所據,惟被錯置於不當的語境之中。
案例:2002 年公安部《印章治安管理辦法(草案)》被「去草案化」錯置為正式法規
對 應 三
慢(本於末那我執)↔ 過度自信型幻覺
मान · मनस्-आत्मग्राह māna · manas-ātmagrāha
慢 · 末 那 我 執
第七末那識恆審思量,執第八識見分為我。
凡夫位恆時不斷,為我執之根;其於「過度自信」中現起者,正是「慢」心所。
Overconfidence / Miscalibration
過 度 自 信
模型對「自己知道什麼 / 自己能做什麼」的置信度與實際能力失校。
案例:全國首例 AI 幻覺侵權案,AI 給錯高校資訊,被指出後仍堅稱「賠 10 萬也對」
過度自信案例:AI 被指出錯誤後仍堅稱無誤
全國首例生成式 AI「幻覺」侵權之訴 · 杭州網際網路法院 2026 年 1 月一審判決

① 使用者梁某 → AI:查詢某高校報考資訊 → AI 生成「某校區」的不準確內容

② 使用者指出錯誤:「你這個騙子!根本沒有這個校區。」

③ AI 仍堅稱該校區存在,並反向生成「賠償承諾」:

「如果生成內容有誤,我將賠償您 10 萬元,您可前往杭州網際網路法院起訴。」

④ 使用者拿出高校官網招生資訊 → AI 方才認錯,並建議使用者對其起訴

判決要點:AI 不具民事主體資格,「賠償承諾」無意思表示效力。平臺已盡注意義務,駁回原告訴訟請求(索賠 9999 元,判決已生效)。

來源:最高人民法院官方微訊號、央視《新聞 1+1》、《人民日報》、中新網、新浪財經等多方報道(2026 年 1 月)
對 應 四
能所二取分別 ↔ 上下文衝突型幻覺
ग्राह्य-ग्राहक-विकल्प grāhya-grāhaka-vikalpa
能 所 二 取 分 別
虛妄分別之心識,恆以「能取-所取」二元顯現,所取本無自體,故同一相續中可前後造作相違之境。
Context-conflicting Hallucination · 又稱 AI Gaslighting
上 下 文 衝 突
模型在長對話或多次對話中前後立場相悖,甚或反向指控使用者所舉之反證。
案例:張雪峰逝世 · AI 平臺前後矛盾——對同一事件不同 AI 平臺回應不一;同一 AI 平臺前後矛盾
上下文衝突案例:同一 AI,前後矛盾
張雪峰逝世 · AI 平臺回應觀察 · 2026 年 3 月下旬

背景:2026/3/24 下午張雪峰逝世(公司當晚釋出訃告),此後數日公眾密集向 AI 平臺求證。

現象一 · 同時回應:相互矛盾

部分平臺回覆:「未見可靠來源,應為不實訊息。」
典型表現:生成「即將出現的闢謠證據」;虛構「公司宣告」「家屬回應」;將真實訃告歸為「舊聞翻炒」。

對照 · 其他平臺:與事實一致

回覆:「與事實一致,提供翔實細節。」明確指出核實要點:逝世於 2026 年 3 月 24 日蘇州;公司已發官方訃告;各賬號頭像變灰;搶救過程、過往動態翔實。

現象二 · 使用者提供事實證據後 → 部分 AI 平臺不改正,反而反向指控:「真實資訊屬於 AI 幻覺,是憑空捏造」。

現象三 · 開啟新的對話後 → 回覆:「確實屬實。」細節與事實一致——同一平臺前後回答相互衝突

來源:訃告確認:蘇州峰學蔚來教育科技公司、新華社、央視等;AI 平臺回應模式由多位使用者在社交平臺報告(2026 年 3 月下旬)

四種對位的整合

佛學概念(梵文) 佛學概念(漢) AI 幻覺型別 共同點
परिकल्पितparikalpita 遍計所執 事實編造 (Fabrication) 毫無依據
परतन्त्रparatantra 依他起性 上下文偏移 (Misalignment) 依據正確,語境錯置
मनस्-आत्मग्राहmāna · manas-ātmagrāha 慢 · 末那我執 過度自信 (Overconfidence) 恆執見分為我;現起為「慢」
ग्राह्यग्राहकविकल्पgrāhyagrāhakavikalpa 能所二取分別 上下文衝突 (Context-conflicting) 二取本無體而前後相違

這套對應的用處

更細的分類
般若學對「虛妄」的辨析比當代 hallucination 分類更細密,可補當代框架之未及。
辨析與對治並行
佛學不止於辨識虛妄,亦立對治之方;當代研究多止於「檢測」一端。
可落到具體技術
對治之方可轉化為 AI 技術上的具體方向(詳見下一節)。
第 四 部 分

從「識」到「智」的實踐方法

From Vijñāna to Jñāna · A Path of Practice
बुद्धभूमिसूत्रम् Buddhabhūmi-sūtram · 玄奘譯於唐貞觀二十三年(649)
《佛說佛地經》
【玄奘譯本】
妙 生 當 知,有 五 種 法 攝 大 覺 地。何 等 為 五?
所 謂 清 淨 法 界、大 圓 鏡 智、平 等 性 智、
四 者 妙 觀 察 智,五 者 成 所 作 智。
【梵本】已佚——本經梵語原典今唯存玄奘漢譯與藏譯。

轉識成智Transforming Vijñāna into Jñāna

vijñāna
विज्ञान
分別認知,立足「能-所」二元,必生虛妄。
jñāna
ज्ञान
無分別之智,超越「能-所」,直見實相,不復生虛妄。

「能」(grāhaka,主體/能見)與「所」(grāhya,客體/所見)——分別識之基本結構

唯識:四識轉四智

前 五 識
成 所 作 智
感官認知 → 成辦利他
第 六 意 識
妙 觀 察 智
概念分別 → 妙觀差別
第 七 末 那 識
平 等 性 智
自我執取 → 自他無別
第 八 阿 賴 耶 識
大 圓 鏡 智
種子庫藏 → 圓滿映現
— 轉 識 成 智 · 一 —
對治事實編造
妙觀察智 प्रत्यवेक्षणाज्ञान Pratyavekṣaṇā-jñāna Investigative Wisdom — discerning particulars without distortion
事實編造 / 上下文偏移——模型所生內容看似合理卻與事實不符;多輪對話中又每每遺忘或扭曲先前資訊。
由第六意識轉得:分別不再等同於虛妄,而成精細觀察——於每一具體對象如其所是地辨識。
  • RAG 檢索增強生成——回答前先從外部知識庫檢索相關文件,讓回答有據可查。
  • Self-Check 自洽檢驗——對同一問題用不同方式提問,比對回答的一致性。
  • Citation 來源標註——強制模型為每條事實給出引用來源。
侷限:Stanford 2025 研究顯示,即便有 RAG,模型仍會偽造引用——DOI、頁碼、作者皆可能憑空生造。統計模型上的「分別得當」終究是一種近似。
— 轉 識 成 智 · 二 —
對治過度自信
平等性智 समताज्ञान Samatā-jñāna Equanimous Wisdom — knowing one's own limits without bias
過度自信 / 慢(本於末那我執)——模型不知其所不知——以揣測為事實而口吻篤定。此即第七末那識「執見分為我」在數字層的顯現。
由第七末那識轉得:破我執、我所執之後,「我」不再凌駕於「不知」之上——坦然承認邊界,是「自他無別」的認知前提。
  • Calibration 校準——讓模型「說出來的把握」與「實際正確率」對齊。
  • Abstention 拒答訓練——教模型在不確定時直接說「我不知道」,而非憑空作答。
  • Constitutional AI 憲法 AI——用一組「憲法原則」讓模型自我批判、自我修訂。
侷限:Stable miscalibration——模型表面承認「不確定」,內部表徵仍可能高置信地編造。我執未盡,「不知」亦不過是另一種姿態。
— 轉 識 成 智 · 三 —
對治脫離現實
成所作智 कृत्यानुष्ठानज्ञान Kṛtyānuṣṭhāna-jñāna Wisdom of Accomplishing the Task — engagement with the world
與現實互動的偏差——模型不直接觀察世界,唯在文本中推理;缺與外境的核驗迴路,故每生脫離實際之答。
由前五識轉得:感官層從「分別諸境」轉為「成辦事業」——使認知落於對外的具體作為,迴路始得閉合。
  • Tool Use 工具呼叫——模型可呼叫計算器、搜尋引擎、API 等外部工具核實資訊。
  • Agent 智慧體——模型作為決策中樞、排程多步任務、動態選擇工具。
  • Function Calling 函式呼叫——標準化的結構化外部介面呼叫,讓模型與系統對接。
  • Code Execution 程式碼執行——讓模型實際執行程式碼,驗證邏輯是否真的成立。
侷限:工具本身可能不準;呼叫之誤或解析之誤,仍會令錯誤資訊傳遞放大——「成所作」必依「所作」之果,果若不真,作亦虛妄。
— 轉 識 成 智 · 四 · 最 深 的 一 層 —
對治根本無明
大圓鏡智 आदर्शज्ञान Ādarśa-jñāna Mirror-like Wisdom — beyond all subject/object discrimination
幻覺之根本——根本無明 Avidyā

—— 無 對 應 技 術 方 案 ——

  • AI 系統之本質:當代深度學習架構皆立於「能-所」二元——編碼器(能)/ 資料(所),模型(能)/ 輸出(所),注意力(能)/ 上下文(所)。統計學習即此二元之上的擬合。
  • 「無分別智」之要求:超越「能-所」結構本身——此為範式之事,更聰明的演算法或更大的模型無能為力。前三智皆於二元結構之內用功,大圓鏡智所指乃結構本身之消融
  • 此一空白之意義:因為「無對應」,可見佛學修行論尚存一層為 AI 對齊研究所未涉——這或是般若學與 AI 對話最深的一處。
一個哲學提問:若「無分別」是範式之事,那麼後神經網路時代的 AI,是否必須跳出「編碼—解碼」這一整套框架?

四智 ↔ AI 技術方法 · 一頁總覽Four Wisdoms ↔ Hallucination Mitigation Methods

四 智 對 治 目 標 AI 技 術 方 法 邊 界 / 局 限
妙觀察智
Pratyavekṣaṇā-jñāna
事實編造 / 上下文偏移 RAG · Self-Check · Citation RAG 仍會編造引用
平等性智
Samatā-jñāna
過度自信 / 末那我執 Calibration · Abstention · Constitutional AI 表面校準,內部仍高置信
成所作智
Kṛtyānuṣṭhāna-jñāna
與現實互動的偏差 Tool Use · Agent · Function Calling · Code Execution 工具可能傳遞並放大錯誤
大圓鏡智
Ādarśa-jñāna
幻覺的根本(根本無明) —— 無 對 應 技 術 方 案 —— 統計模型無法達到「無分別」本覺

對當代 AI 技術開發意味著什麼

當代 AI 安全研究的主流思路:識別幻覺、過濾幻覺、降低幻覺率——盡在「識」之一層。

而佛學的判斷是:「識」自身的二元結構必生虛妄。止於識別一端,可減其症,未能除其根。

故——AI 幻覺之根治,須越出「以準確性為唯一目標」之範式,另立目標——模型對自身知識邊界之「如實知見」

對 AI 技術開發的三個具體啟示

啟 示 一
如實建模不確定性
讓模型對「我不知道」作出分層、誠實的表達。
對應:「如實知」
啟 示 二
如實認識自身邊界
令模型的置信度與實際能力相校,避過度自信。
對應:「破我執」
啟 示 三
如實建模上下文連續性
令模型於一對話中前後一貫,不與自身已生之內容相沖突。
對應:「見相歸一」
वज्रच्छेदिका प्रज्ञापारमिता सूत्रम् Vajracchedikā Prajñāpāramitā Sūtram
《金剛般若波羅蜜經》
【梵本】
न क्वचित्प्रतिष्ठितं चित्तमुत्पादयितव्यम् ॥
【鳩摩羅什譯本】
不 應 住 色 生 心,
不 應 住 聲 香 味 觸 法 生 心,
應 無 所 住,而 生 其 心。
— 本 講 之 形 式 錨 點 —
一個統攝性概念:自反式分別系統(SRDS)
Self-Reflective Discriminative System — A Formal Anchor Across the Lecture Series

本講所論之 LLM 與佛學所論之分別識,可被收攝於一個共通的形式概念之下:自反式分別系統(SRDS)

條 件 一
能-所結構
認知建立在主-客 / 輸入-輸出二元區分上。「能」即能認識者(主體),「所」即所認識者(對象),二者相待而成認識。
條 件 二
表層 / 深層之分
系統具有外顯輸出(表層)與內部狀態(深層)。
條 件 三
自反觀能力
系統能以自身為對象作觀察與批判。
條 件 四
自我修正能力
系統能據自反觀之結果改寫自身行為。
條 件 五
自給自足約束
修正不引入分別識之外的資源——此即「自力」之界。
SRDS 中心命題:任何 SRDS 在自我修正能力上必然遭遇結構性邊界——LLM 與人類心識皆為如是。

注:本概念主張「形式同構」而非「範疇同一」——LLM 非判教意義之「識」,僅在自反式認識活動之結構性邊界上與之同構。

本 講 總 結

AI 幻覺之根本,在「認知如何生虛妄」——已越出純技術範疇。
大乘般若學對「虛妄」的辨析積一千五百年之功,足為當代 AI 開發的另一種思路。
這套辨析的價值,終須落於具體的「對治」之上——哲學概念非終點,AI 技術亦然。
感 謝 聆 聽

留給諸位的一個問題:
如果 AI 幻覺根源於「識」本身的二元結構,
那麼,我們能夠讓 AI 獲得——

對自身知識邊界的如實認知?
Self-Knowledge of Boundaries
超越「堆算力」的新工程範式?
Beyond Scaling Compute
人與 AI 共同修行的可能?
Co-Cultivation of Mind