久慧說法｜數字辦應制定更全面的AI應用指引

文/鄭久慧

4月15日，數字政策辦公室（數字辦）公布《香港生成式人工智能技術及應用指引》（《指引》），旨在為技術研發者、服務提供者及使用者，提供應用生成式人工智能技術的實務操作指引，其核心目標是平衡人工智能的創新發展、應用與倫理責任，締造符合香港情境、具有本地特色的治理框架，造福每一位人工智能生態圈的持份者。據政府介紹，這份《指引》的內容涵蓋生成式AI技術的應用範圍、應用局限、潛在風險及治理原則，包括需關注的資料洩露、模型偏見和錯誤等技術風險等。

筆者詳閱《指引》，產生不少疑問，希望提出來讓大家集思廣益，共同完善本港生成式人工智能技術的治理框架。

一、數字辦應遵循基本法原意　向公眾提供全面指引

在數字辦網頁，提交予公眾參考的文件實際上有兩份，一份是《人工智能道德框架》（《框架》，只提供英文版），另一份是政府強調的《香港生成式人工智能技術及應用指引》（備有中英文版，中文版見鏈接）。基於基本法第9條的立法原意，希望數字辦盡快備妥《人工智能道德框架》的中文版，方便各界遵行。

筆者發現，單看僅37頁的《指引》並不能獲得足夠應用指南，大量實務指引實際上在長達150頁、僅得英文版的《框架》裏面。舉例來說，「雲端」引發資料洩露是常見的網絡保安問題，設立AI演算模型時，無可避免要研究是否設立及如何正確選擇雲端服務器。但在《指引》僅一處提及「雲端」（第2.1.3.3點），而且是非常概括的一句：「機構在選擇服務模式時（無論是基於雲端的解決方案、自建的開源模型，還是裝置端的部署方式）均應仔細評估相關風險」。試問一份「技術及應用指引」怎能如此籠統處理這麼重要的保安問題？後來筆者才發現，原來具體操作指引竟然是在《人工智能道德框架》裏，共有11處提到「cloud（雲端）」，包括在《框架》第4.1.4.5.5點建議將AI數據上載到可靠的雲端，但並不禁止上載至安全系數可能較低的「public cloud（公用雲）」。

由此可見，業界人士單看中文版的《香港生成式人工智能技術及應用指引》根本不得要領，數字辦的分類存在頗大缺陷，恐引發使用者混淆，所謂的「人工智能道德框架」非常廣泛，並非單指「道德」範疇，而是將生成式人工智能技術的應用中的技術考量、操作準則，乃至於實際操作步驟，都包括在全英文的《人工智能道德框架》裏。

正因為參考數字辦的《指引》難以獲得全面實際操作的指引，須結合《框架》才能滿足實際應用層面的需求，數字辦應盡快提供中文版《框架》，再結合兩者推出完整版，以免社會各界左看右看，兩份文件互相對照，費時失事，浪費社會資源。

二、未提及受本港語言所限的生成式AI挑戰

在數字辦發布的《指引》第2.1.1點，提出不少生成式人工智能技術層面的局限，甚至舉了ChatGPT等對話語言平台為例子，但令筆者驚訝的是，《指引》完全未提及本港的社會氛圍及文化特性，即普遍使用繁體中文及大量粵語用字。而環顧全球，繁體中文在生成式AI訓練中的佔比非常低，有數據指現時繁體中文在全球AI訓練資料的佔比甚至低於0.5%，更勿論加上粵語用字，只會更低，但數字辦竟然完全沒關注這一問題。

有能力提交全英文數據予生成式AI演算的，無疑是本港的公營機構及大型私企。對於中小企而言，能脫離以谷歌文件記錄資料，創建屬於自己的資料庫已屬不易，更別說是全英文資料庫。換言之，如何開發滿足本地語言需求的AI技術平台，能令缺乏研發資源的中小企亦能乘着生成式AI的浪潮分一杯羹，獲得充足技術及算力支持，進而拓展新商機，是非常值得政府創科部門重視及探討的。

三、未對系統韌性投放足夠重視

在數字辦的《指引》中，對於系統韌性（resilience）着墨近乎零；而在《框架》中，亦未將應對外來駭客攻擊、遭遇各類天災人禍時，如何迅速恢復系統運作，盡量減少損失及減低影響，當作重點。例如在《框架》第4部分的第43頁，僅提出AI核心資料（core data）僅須與其他IT系統實行同等的保安措施；「backup（備份）」這個重要舉措，僅在長達150頁的《框架》第3部分的第28頁提過一次；「recovery（復原/恢復）」亦僅在《框架》第4部分的第42頁出現一次。數字辦對系統韌性的「淡定」態度，令人詫異。

四、忽視越趨重要的ESG議題

本港社會日趨重視ESG議題，從「Environmental（環保）」、「Social（社會)」及「Governance（公司治理）」三方面優化經營原則和投資框架，達致永續投資。

數字辦的《指引》及《框架》都沒提到ESG字眼，對於ESG中，公眾最關注的環保議題，僅在《框架》附件的「AI Application Impact Assessment Questions」第2點輕輕帶過。事實上各國的例子均顯示，隨着生成式AI的需求激增，大量興建數據中心，從而提升算力，對能源供應和環境保護帶來巨大挑戰，包括增加碳排放和消耗大量水資源及電力，故此在推動生成式AI發展的同時須考慮其對環境的長期影響。同時，對於生成式AI所涉系統硬件的材料、規格、棄置、回收要求，均無着墨，明顯缺乏環保意識。

五、未提到設立「安全運營中心」（SOC）

「安全運營中心」（Security Operations Center, SOC）無論在本港、我國乃至國際都不是新概念，約廿年前就已設立ISO 27001的國際認證標準。在網絡攻擊日趨頻繁的今天，SOC集技術人員、防禦流程及核心技術於一體，不斷改善企業的網絡安全狀態，積極預防、檢測、分析外來的威脅。生成式AI本身涉及大量資料分析，數字辦的《指引》及《框架》並未提及設立SOC來提升公營機構及私企的資料安全管理能力，從而保護資料安全，並確保模型能持續運作。

六、缺乏維護國安、反情報收集及提升企業防詐騙敏感度的具體監控機制

數字辦的《指引》及《框架》並未提及反情報收集及維護國安的具體措施。僅數段篇幅約略帶過生成式AI可能涉及的各類罪案，並未詳細規範公營機構及企業如何提升敏感度，採取措施防範關鍵資料被盜，進而被不法分子利用生成犯罪材料。

對於市民非常關心的詐騙罪案，其中採用AI生成的深偽技術（deepfake）用於製造逼真的虛假相片、影片與音頻，乃至於深偽可能被用作生成影響社會穩定的假消息假新聞，在《指引》第2.2.3點，數字辦並未提出任何常態化的監控機制。

查找數字辦的《指引》及《框架》，均未見如何從AI演算模型中，區分出最重要「核心模型」，再提出如何着重保護「核心模型」免遭破壞或篡改。而較多生成式AI研發企業所採用的防禦攻擊措施，例如「Red Team」（紅隊演練）、「Prompt Diversity Injection」（提示多樣性注入機制），亦未見提及。

七、私隱條例絕非萬能　應推動AI相關的大數據規範立法

從以上第六點來看，仿效其他國家，立法規範生成式AI刻不容緩。筆者發現，在數字辦發布的《指引》及《框架》中，每每提及可能被犯罪分子利用、被大量收集作情報甚至危害國安的敏感資料，數字辦就會引出《個人資料(私隱)條例》作為法律保障及執法行事的準則。

然而，僅僅側重保護個人資料及私隱，以此作為可運用的法例框架，忽視了生成式AI將負責大數據的綜合分析與決策，一旦缺乏妥善的監管機制，勢必面臨巨大風險。而當局積極推動香港成為「智慧城市」，就應積極推動AI相關的大數據規範立法工作，持續強化自身的AI安全政策，完善法例規管，確保AI技術在安全與效率間取得最佳平衡，才能為未來科技的可持續發展鋪平道路。

事實上，許多公共安全甚至國家安全問題，並非關乎個人隱私的洩露，而是關乎一些地理、公共衞生或財務等群體數據被收集並集中到一個由境外勢力控制的系統，進行綜合分析。舉例，某保險經紀將部分客戶資料（不含個人資訊）上載至AI，幫助分析保單風險或投保機率，上傳的數據可能包括：

- 客戶所在地區或大樓名稱，包括「甲乙丙大廈」（因為沒包含詳細地址、電話或人名，所以不屬於個人私隱）

- 所購買的保險（例如勞工保險）

- 風險因素（是否吸煙、健康史、索償歷史紀錄）

- 業務或職業的性質

- 公司各職位及薪酬（用於計算工傷保險費）

- 該公司員工（或家庭成員）的醫療索償歷史，可能不包括個人姓名，只有員工的職位

此後，另一間同地區的物業管理公司上載了包括「甲乙丙大廈」在內的單位管理費繳費紀錄，供AI協助其建立催繳管理費提醒系統。同區的一家地產代理公司上載了一些建築物的公司目錄列表，其中包括「甲乙丙大廈」，以便AI助其分析樓宇成交機率並準備相對應的銷售信函及電郵，再發送給租約即將到期的公司。不久之後，同區另一間公司如香港不少公司一樣，將商業客戶的紀錄（包括公司名、電話號碼、地址）上傳至谷歌試算表，其中一些公司位於「甲乙丙大廈」。而同區一所一條龍的中小學將學生家長的僱主名稱連同學生班級座號等資料，包括位於「甲乙丙大廈」的商業僱主，上傳到谷歌文件。此後，越來越多同區、亦與「甲乙丙大廈」有關聯的資料被上載到AI及公共雲端伺服器。

AI可以是矛，也可以是盾。假若西方勢力控制的AI，能夠從不同來源匯集到足夠信息，一方面可以分析不同建築物（例如「甲乙丙大廈」）裏員工的健康情況、情緒狀態、財務狀況，另一方面更能從中篩選出易受到物理攻擊、謠言影響的較脆弱目標群組，而非個人。因此，保護個人隱私永遠不是真正保護平民免受此類攻擊的方法。故此，單單祭出「個人資料私隱」這面大旗，顯示《指引》及《框架》缺乏國家安全的考量。

最令人費解的是，在《指引》附錄第1.1點，指出我國一直以來穩步推進人工智能治理與監管，更整合《網絡安全法》、《數據安全法》和《個人信息保護法》的法律框架，於2023年8月生效了《生成式人工智能服務管理暫行辦法》，作為內地生成式人工智能治理的核心規範性文檔。那麼，更開放、更容易受到網絡攻擊的香港，為何不盡快推進類似的立法工作？

稿件由上傳 · 文責自負 · 不代表本網立場

久慧說法｜數字辦應制定更全面的AI應用指引

相關推薦