想打造專屬 ChatGPT ,企業仍要面臨這些具體挑戰

11月初,除了 Elon Musk 推出以自家大語言模型 Grok-1 打造的聊天機器人「Grok」;AI 趨勢大師李開復也公開旗下公司零一萬物所開發的首款開源大語言模型 Yi-34B 和 Yi-6B;而 OpenAI 更是在首屆開發者大會上公布名為 GPT-4 Turbo 的升級版大型語言模型,以及發表客製化 AI 服務GPTs,針對需求打造客製化 ChatGPT,並在社群上引發討論。

隨著越來越多新的大型語言模型發表,以及調整方法不斷推陳出新,許多公司開始思考如何利用大型語言和圖像生成式人工智慧(Generative AI)模型等新興科技,結合自家企業的專業知識,打造出 AI 應用,有效且敏捷的創造、管理、應用、重組,以及部署知識資產。

目前,將組織的特定領域知識納入生成式模型的方法主要有 3 種,分別是:「從頭開始訓練一個大語言模型」、「微調現有的大語言模型」,以及「用提示調整現有的大語言模型」。對於一般公司而言,透過提示調整語言模型是效率最高,且不需要大量資料來訓練模型的方法。使用這種方法時,原始模型保持凍結狀態,人們透過對話視窗(context window)裡的提示進行修改,這些提示包含領域的特定知識。透過提示調整後,模型可以回答與該知識有關的問題。

企業仍須面臨技術挑戰

雖然用提示調整現有的 LLM 已經是相對簡單的方法,也不代表企業在使用時不需付出技術成本。當我們需要將文本等非結構化資料輸入 LLM 時,資料中可能包含太多重要特徵(attributes )而過於龐大,導致無法直接使用,這時候就會需要建立向量嵌入(vector embeddings),也就是由另一個預訓練機器學習模型從文本所產生的數值陣列,保留了文本中的脈絡關係,以更緊湊的方式代表這些資料。當使用者輸入提示到系統中,相似性演算法會決定哪些向量應該送交給 GPT-4 模型。由於過程仍是相當複雜,即使已有企業提供相關工具的服務,大部分企業內部仍需要資料科學人才,讓提示調整的過程更為容易。

當更多的企業可以更快速的使用客製化 GPT 服務時,在使用上需要注意哪些風險呢?

麻省理工學院數位商業中心(MIT Center for Digital Business)研究員湯瑪斯.戴文波特(Thomas H. Davenport)指出,企業在使用客製化 GPT 服務時,仍需要注意內容挑選、品質確認與法律治理等方面的挑戰。

內容的管理與治理

在以任何方式客製化 LLM 前,高品質的內容仍是必須,如果不是已經經過編選的資料,企業仍需要投入人力進行編選,以確保內容的準確性、即時性且不重複。

品質保證和評估

另一方面,確保回應的品質仍是管理生成式 AI 內容的重要層面。我們都知道,生成式 AI 有時會「產生幻覺」,答出不正確或不存在的事實。這種類型的錯誤,除了可能會為企業製造問題,在健康照護的應用上也可能帶來致命危機。

不過,根據已用特定領域資訊來調整 LLM 的公司經驗,比起直接使用的 LLM,調整過的 LLM,較少出現虛構的問題,至少在沒有延長對話或沒有輸入無關業務的提示時是這樣。 建議採用企業在使用時生成式 AI 時,應該制定一個評估策略。

法律和治理風險

和 LLM 部署有關的法律和治理問題非常複雜且仍變動,造成一些風險因素,包括智慧財產、數據隱私與安​​全、偏見和倫理,以及虛假/不準確的輸出結果。目前,LLM 的產出成果,其法律地位仍不明朗。由於 LLM 的產出結果,不會完全相同於任何用來訓練模型的文本,因此許多法律觀察家認為著作權法的「合理使用」條款適用於 LLM,雖然這一點還沒有在法庭上受到測試,且不是所有國家的著作權法都有這種條款。因此,建議廣泛使用生成式 AI 進行知識管理,或應用到生成式 AI 用途的公司,都應在調整 LLM 以及治理調整的過程中,邀請法律代表參與。

此外, 一些供應商為了解決機密和隱私方面的問題,正在為 LLM 增加進階和改良的安全與保護功能,包括刪除使用者的提示、限制特定主題,以及防止將原始碼和專有數據輸入到開放大眾使用的 LLM。而企業軟體系統的供應商正在自家產品和服務中加入「信任層」(Trust Layer)。例如,有些公司希望能快速部署 LLM 的能力,但又擔心這些系統在商業環境中會帶來上述風險。

塑造使用者行為

由於使用與取得容易,加上能提供各種不同領域知識的實用答案等因素,促使員工迅速採用以生成式 AI 為基礎的知識管理方法,以現況而言,使用過程並沒有受到指導,發生得自然而然,當中究竟有哪些風險,當然也沒有經過評估。

為了實現將生成式 AI 應用在知識管理上的機會並管理潛在風險,企業必須營造透明與當責的文化,讓以生成式 AI 為基礎的知識管理系統取得成功。使用者除了執行政策和指導方針,還需要知道如何安全有效地將生成式 AI 能力融入員工所負責的任務中,以提升績效和生產力。

生成式 AI 的能力,包括察覺脈絡和歷史、彙總或組合各種來源的知識生成新的內容,以及根據資料進行預測,這些能力可以為知識工作提供強而有力的支持。以生成式 AI 為基礎的知識管理系統,能將資訊密集的搜尋過程,如法律案例研究和大量低複雜性的認知任務自動化,如回覆例行性的顧客電子郵件。這種方法可以提高員工的效率,讓他們釋出更多心力,轉而投入工作上較為複雜的層面,例如決策和解決問題,且部分特定行為需要透過訓練或政策宣導,讓員工得以貫徹執行。