IBM CEO:更小的、特定領域的 genAI 模型是未來

在波士頓舉行的年度 Think Conference 上,IBM 首席執行官 Arvind Krishna 表示,他的公司專注於使用與邊緣網絡功能集成的小型 genAI 模型來解決成本、速度和安全問題。

IBM 首席執行官 Arvind Krishna 表示,由於眾多數據中心、雲服務和邊緣環境之間缺乏集成和協調,迄今為止只有 1% 的企業數據可以通過生成式人工智能 (genAI) 模型訪問。為了改變這種情況,需要針對特定​​領域任務(例如人力資源、銷售、零售和製造)量身定制的更小、專用的 genAI 模型。

講話於IBM 的 Think 2025週二在波士頓舉行的會議上,克里希納闡述了公司未來的重點:整合開源和開源(法學碩士)和無論企業使用它們。

“較小的模型非常準確,”克里希納說。 “它們的速度要快得多。它們的運行成本效益要高得多。而且您可以選擇在您想要的地方運行它們。它不是大型 [AI] 模型的替代品,而是與您現在可以根據企業需求定制的大型模型的‘和’。”

以及作為他說,較小的 AI 模型的運行成本比傳統的 LLM 低 30 倍。

Krishna 表示,正如存儲和計算成本自 20 世紀 90 年代以來急劇下降一樣,隨著時間的推移,人工智能技術也將變得更加便宜。 “當這種情況發生時,你可以用[人工智能]來解決更多問題,”他說。 “計算機科學中沒有法律規定人工智能必須保持昂貴和龐大。這就是我們面臨的工程挑戰。”

Krishna 重點介紹了 IBM 的 Granite 系列開源 AI 模型(具有 30 億到 200 億個參數的較小模型),以及它們與 GPT-4 等擁有超過 1 萬億個參數的 LLM 的比較。 (OpenAI、Meta 和其他 AI 模型構建者也專注於為其較大平台創建“迷你”模型,例如 GPT o3 和 GPT o4 mini,以及 Llama 2 和 Llama 3,據報導,所有這些模型的參數數量都在 80 億個或更少。)

IBM 最新的 Granite 3.0 模型已集成到其 WatsonX 平台中,該平台是該公司的 AI 和數據平台,旨在幫助企業大規模構建、訓練、調整和部署 AI 模型,特別是針對特定的業務應用程序。 Granite 3.0 於去年 10 月推出,是 IBM 更廣泛戰略的一部分,旨在為企業提供可擴展、高效和可定制的 AI 解決方案

“人工智能實驗的時代已經結束,”克里希納說。 “成功將由集成和業務成果來定義。這就是我們今天宣布的內容。借助我們的 WatsonX Orchestrate 系列產品,您可以在不到五分鐘的時間內構建自己的代理。”

WatsonX Orchestrate 還附帶 150 個用於各種目的的預構建 AI 模型。

為了使 AI 嵌入式網絡能夠連接地理上分散的數據源,IBM 和電信公司 Lumen Technologies 在 Think 期間宣佈建立合作夥伴關係。兩家公司將專注於在更接近數據生成位置的地方創建實時人工智能推理,隨著公司擴大 genAI 的採用範圍,這將降低成本和延遲並解決安全障礙。

Lumen 首席執行官 Kate Johnson 表示,她的公司正在啟動數十年來最大規模的網絡升級和擴展; Lumen 的網絡現在將在邊緣運行 WatsonX,從而能夠更安全地訪問正在創建的數據,從而克服更傳統網絡上可能出現的延遲問題。

“我們為那些試圖充分利用人工智能的公司帶來了接近的力量,”她說。 “想像一下,使用您的 AI 模型,不斷地將所有數據發送回雲端並等待。它成本高昂、速度緩慢、安全性也差強人意。我們與邊緣 WatsonX 的組合功能可實現實時推理。

“所有邊緣位置都連接到結構,”約翰遜說。 “它無處不在,涵蓋所有用例。”

例如,genAI 可用於臨床環境中對患者記錄進行實時診斷。當對患者進行檢查時,該數據會被輸入本地數據庫,genAI 可以訪問該數據庫,並將其與另一個位置(醫院數據中心)的歷史數據相結合。

“這將改變遊戲規則,並可能挽救生命,”約翰遜說。

約翰遜還闡述了人工智能如何在無人值守的製造工廠中工作,幾乎完全由機器人運行,並生成數 TB 的數據來運行。

“每一毫秒都很重要。我們看到工廠正在尋找鄰近數據中心,從網絡到電力和冷卻,我們的組合解決方案為他們提供了開箱即用的強大功能,”她說。