IBM 人工智能的基礎技術多年來已經取得了長足的發展
怎樣才能讓計算機像 IBM 所說的沃森那樣通過感官、學習和經驗來理解世界呢?首先也是最重要的,是大量的數據。
為了構建 Watson 在 Jeopardy 中使用的知識體系,研究人員匯集了2億頁結構化和非結構化的內容,包括詞典和百科全書。當提出問題時,Watson 最初會使用 100 多種算法進行分析,識別任何名稱、日期、地理位置或其他實體。它還檢查問題的短語結構和語法,以更好地判斷所問的內容。總之,它使用數百萬條邏輯規則來確定最佳答案。
如今,Watson 經常被應用於新領域,這意味著學習新材料。研究人員首先將 Word 文檔、PDF 和網頁加載到 Watson 中以積累知識。然後添加問題和答案對來訓練 Watson 關於該主題的知識。為了回答一個問題,Watson 會搜索數百萬份文檔以找到數千種可能的答案。在此過程中,它會收集證據並使用評分算法來評估每個項目的質量。根據該評分,它會對所有可能的答案進行排名並提供最佳答案。下面的視頻更詳細地解釋了該過程。
隨著時間的推移,沃森從經驗中學習。當新信息發佈時,它也會自動更新。就具體細節而言,Watson用途IBM 的 DeepQA 軟件以及各種其他專有和開源技術。其原始形式包括 Hadoop 和 Apache UIMA(非結構化信息管理架構)軟件以及由 90 台 Power 750 計算機組成的集群,總共包含 2880 個處理器核心。
如今,Watson 是通過雲交付的,但隨著競爭的加劇,IBM 對底層細節保持沉默。
IBM Watson 副總裁兼首席技術官 Rob High 表示:“我們的 DeepQA 推理和其他基礎認知技能利用了深度學習技術、專有算法以及開源內核和框架,這些內核和框架利用了針對這些工作負載進行了優化的硬件技術。”
