iPAS AI 應用規劃師 中級 科目二 大數據處理分析與應用

同態加密的核心特性是什麼?

原題 13

下列何者為同態加密(Homomorphic Encryption)技術的核心特性?

白話

同態加密(Homomorphic Encryption)是一種加密技術。這道題在問它最根本的、最與眾不同的特性是什麼。

問你:同態加密技術最核心的特性是哪一個?

點選你的答案。

01 總結

一句話總結

同態加密(Homomorphic Encryption)的核心特性:資料在加密狀態下可以直接進行計算,解密後的結果與對原始明文計算完全相同。這讓雲端服務商可以處理你的資料,但永遠看不到原始內容。

02 情境

先感受問題:把資料給別人算,但不能讓他看到資料

聯合醫院有 10 萬筆病患的血液檢查數據,想把這些資料送到雲端 AI 公司做疾病預測分析。

但是:這是醫療敏感資料,法規要求不能讓外部廠商看到個別病患的原始數據。

問題是:你要讓 AI 公司「分析」這些數據,但又不能讓他們「看到」這些數據。這像是一個邏輯矛盾:分析 = 必須接觸資料,保護隱私 = 不能接觸資料。

同態加密就是這個矛盾的解法。

03 對照

傳統加密方法為什麼解決不了這個問題

  1. 傳統加密的「使用前必須解密」限制:AES、RSA 這類傳統加密,資料在計算前必須解密成明文。交給雲端廠商時,廠商必然能看到解密後的原始資料,隱私保護失效。
  2. 匿名化(Anonymization)並非真正保護:把姓名換成代碼、刪除識別欄位,在小資料集中依然可能透過「重識別攻擊」還原個人身分。而且匿名化後的資料無法再做精確的個人化分析。
  3. 聯邦學習(Federated Learning)的局限:聯邦學習讓模型訓練在本地端,只傳梯度,但梯度本身也可能洩漏原始資料(Gradient Inversion Attack)。
  4. 安全多方計算(MPC)的通訊開銷:MPC 讓多個持有部分資料的方共同計算,不需互相暴露資料,但通訊複雜度高,適合少量方,不適合大規模雲端運算。
  5. 差分隱私(Differential Privacy)的精度犧牲:在資料中加入雜訊來保護隱私,但計算結果有誤差,不適合需要精確計算的金融或醫療分析。
04 解法

同態加密讓「加密資料」直接參與運算

聯合醫院的解法:

醫院把病患數據加密後送給 AI 雲端公司。AI 公司的系統直接在加密資料上跑機器學習模型,從頭到尾看到的都是「密文」(亂碼),永遠沒有機會接觸原始病患資訊。

當 AI 公司把「加密的計算結果」送回給醫院,醫院用自己的私鑰解密,得到疾病預測結果。

神奇的地方在於:加密狀態下的計算結果,解密後與直接對明文計算的結果完全一致。這是同態加密的數學魔法。

這就是選項 D 講的:可直接在加密狀態下進行數據運算

技術版:同態加密的數學基礎與實務限制

同態加密的核心數學性質

設加密函數為 E,解密函數為 D,同態加密滿足以下性質(以加法同態為例):

E(a) ⊕ E(b) = E(a + b)

意思是:對加密後的 a 和加密後的 b 做「密文加法」,結果等同於先把 a+b 算出來再加密。解密後就是 a+b 的正確答案。

三種同態加密類型

  • 部分同態加密(Partially Homomorphic,PHE):只支援某一種運算(加法或乘法),例如 RSA(僅乘法同態)、Paillier(僅加法同態)。運算效率高,但功能受限。
  • 有限深度同態加密(Somewhat Homomorphic,SHE):支援加法和乘法,但乘法次數有限制(雜訊會累積)。
  • 全同態加密(Fully Homomorphic,FHE):無限制地支援加法和乘法,理論上可做任意計算。2009 年 Craig Gentry 首次實現,但計算開銷極大(比明文計算慢數百萬倍),仍在優化中。

實務限制

全同態加密目前計算成本極高,主要用於:(1) 隱私保護的機器學習推論(不是訓練);(2) 金融數據的隱私計算;(3) 醫療數據跨機構分析。訓練大型模型仍不實際,更多是推論階段的隱私保護。

與其他隱私保護技術的比較

技術核心保護方式
同態加密(HE)加密狀態下直接計算,不暴露明文
聯邦學習(FL)模型訓練在本地,只傳梯度
差分隱私(DP)加入雜訊,統計結果不洩漏個體
安全多方計算(MPC)多方合作計算,各自不知道他人資料
05 陷阱

為什麼其他選項是錯的

A將資料轉換為匿名識別碼以隱藏身分

字面在說什麼

把個人資訊替換成代碼,讓人看不出是誰的資料。

為什麼不對

這描述的是「匿名化(Anonymization)」或「假名化(Pseudonymization)」技術,不是同態加密。匿名化是把識別欄位刪除或替換,讓資料無法對應到特定個人。同態加密的核心不是隱藏身分,而是在加密狀態下進行計算。兩者目的部分重疊(都是保護隱私),但技術本質完全不同。

誰會選錯

對各種隱私保護技術混淆的人。匿名化是「隱藏特定欄位」,同態加密是「保持整體加密的前提下計算」,這是兩種截然不同的方法。

B對資料進行標準化處理以提升模型精度

字面在說什麼

對資料做標準化(例如 Z-score 標準化),讓機器學習模型表現更好。

為什麼不對

資料標準化是資料前處理(Data Preprocessing)的一步,目的是讓不同量綱的特徵處於相同尺度,與加密技術毫無關係。同態加密是「安全計算」的工具,不是提升模型精度的手段。

誰會選錯

把「加密」和「資料處理」混為一談的人。這兩個是完全不同的技術領域。

C自動偵測與排除異常值

字面在說什麼

能夠自動找出並去除資料中不正常的數據點。

為什麼不對

異常值偵測(Outlier Detection)是統計或機器學習的任務,與加密技術完全無關。同態加密是密碼學工具,它的設計目標是「隱私保護計算」,不是「資料清理」。

誰會選錯

題目有「運算」這個關鍵字,但沒有看清楚「加密狀態下」才是核心,把各種「資料處理能力」都當成加密技術的人。

06 變形

同個考點下次怎麼變形

變形 1

同態加密和差分隱私有什麼不同?

直覺

兩個都是隱私保護技術,如何分辨?

答案

同態加密是「完整保留計算結果的精確性」,只是計算在加密狀態下進行,解密後的結果與明文計算完全一致。差分隱私是「主動加入統計雜訊」讓輸出結果模糊化,保護個體資訊但犧牲計算精度。兩者都保護隱私,但同態加密適合需要精確結果的場景(金融、醫療),差分隱私適合可接受一定誤差的統計分析。

變形 2

銀行想讓雲端 AI 分析客戶交易,但不讓 AI 公司看到資料,應採用什麼技術?

直覺

這不就是同態加密的應用場景嗎?

答案

是的,這是同態加密的典型應用場景。銀行將交易資料加密後送給雲端 AI,AI 在加密資料上執行風險評估模型,返回加密的評估結果,銀行解密後取得分析。整個過程中,雲端 AI 廠商永遠無法看到客戶的原始交易明細。

變形 3

全同態加密(FHE)目前為什麼還沒有廣泛普及?

直覺

既然同態加密這麼好,為什麼不是所有系統都用?

答案

計算開銷是最大瓶頸。全同態加密的計算複雜度遠高於明文計算,目前做一次加密狀態下的乘法,需要的計算量可能是明文計算的數萬到數百萬倍。硬體加速(GPU、FPGA 優化的 HE 計算)和演算法改進正在持續進行,但要達到實用規模仍需時間。

變形 4

聯邦學習(Federated Learning)能完全保護隱私嗎?

直覺

聯邦學習只傳梯度不傳資料,應該很安全?

答案

聯邦學習能大幅降低隱私風險,但不是完全安全。研究表明,透過「梯度逆向攻擊(Gradient Inversion Attack)」,有時可以從模型更新(梯度)中還原出原始訓練資料的近似版本。因此,聯邦學習往往需要搭配差分隱私或安全聚合(Secure Aggregation)才能提供更強的隱私保護。

變形 5

「加密」和「雜湊(Hash)」有什麼根本差別?

直覺

兩個都把資料「變成看不懂的東西」,有什麼不同?

答案

加密是「可逆的」:有正確的金鑰就能解密還原原始資料。雜湊(Hash)是「不可逆的」:從雜湊值無法還原原始資料(設計上)。同態加密屬於加密體系,保留可逆性但加了「可以在加密狀態下計算」的特性。雜湊常用於資料完整性驗證(例如:驗證密碼是否正確),而非資料保護計算。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二梯次 iPAS AI 應用規劃師 中級 科目二 大數據處理分析與應用 第 13 題

查看官方原文 PDF