Sciscape.org 徵求編輯 - 訂閱電子報
最新消息 新聞檔案 專題文章 好站連結 討論區 站務公告 關於本站 編輯群
天文 - 物理 - 化學 - 生命科學 - 醫學 - 地球科學 - 應用科學 - 其它領域 - 國內學界

We need your help! 請參與科景讀者問卷調查

Sciscape新聞報導

[Feb 12, 2005]

應用科學:Google與詞義辨識的人工智能化


編輯 HCC 報導

以Google搜尋不同字詞同時出現在同一網頁的頻率來定義字詞間的關聯性,人工智能或許能夠開始了解字詞的義意。

對文字工作者而言,無論是寫作或譯述,Google已經是不可或缺的重要工作利器了,比方說在翻譯一個陌生的英文字詞時,許多人都會將想要轉譯的字詞google幾次(“to google”已經變成一個動詞了),然後從搜尋到的千百筆資料中,研判哪個中文意思最接近。例如我壓根兒不知“fluorescence microscopy”是啥意,於是把fluorescence microscopy”丟入Google,google出了好多筆資料都提到螢光顯微鏡,而且出現的頻率很高,於是很篤定的認為“fluorescence microscopy”就是螢光顯微鏡。所以許多人除了以Google搜尋資料之外,亦以Google進行文字意義的處理與辨識。

一個字詞的意義經常能從其他與它並用的字眼而獲得,例如"rider"這個英文字,經常與"horse" 以及"saddle"一道出現,所以從horse、saddle、rider此些字眼的關聯性可以推測出rider的意思了,於是八九不離十,rider和馬、馬鞍有關。當然企圖從上千萬的字詞關係析出其意義,需要一個龐大、詳盡的資料庫,否則怎知rider 與horse、saddle 一起出現的頻率很高,thanks god,我們有一個現成且免費的Google。

荷蘭阿姆斯特丹數學與電腦科學學院的Paul Vitanyi與Rudi Cilibrasi發現Google搜尋引擎能用來檢測兩個字詞之間的關聯性,例如電腦想要知道“hat”為啥,首先得建立一個字詞樹狀結構,亦即一個足以顯現字詞之間關聯性的資料庫,此種樹狀結構資料庫可以從任兩個字詞開始,去了解其間的關聯性,例如於google鍵入hat與head此兩個字詞,幾乎可以搜尋到8,800,000筆資料,不過若鍵入hat與banana此兩個字詞,則僅有576,000筆資料,很明顯的,hat與head之間的關聯性較hat與banana為強。

為了要量測其關聯性,Vitanyi 與Cilibrasi基於搜尋到的資料筆數發展了一種統計指標,能顯示一對字詞之間的邏輯距離,並稱之為正常化的Google距離(normalized Google distance, NGD),NGD越低,兩個字詞之間的關聯性越緊密。對許多的字詞對(pairs of words)重複上述統計過程,即可能建立字詞對之間的關聯性距離圖譜,顯示此些字詞之間的關聯性,電腦由此即能推測出某個字詞的意義。Vitanyi.認為此即電腦的字詞意義萃取機制,能讓電腦辨識字詞。研究人員根據其在Google搜尋到的資料筆數與出現頻率,已經能利用電腦辨識出顏色、數字與不同宗教等字詞的意義。

參考來源:

本文版權聲明與轉載授權資訊:

若對本文內容有所建議與指正,請至本文專屬討論串

本站其他相關新聞:

討論區 -- 目前共有2篇討論,最近2篇列表如下: 進入本新聞討論串
標題 發表者 時間
誤解 HCC Feb 20, 2005
i think many people know this method bigKID Feb 16, 2005
我要留言 \ 進入本新聞討論串

工具箱
列印友善頁
email本新聞給朋友
將本文加入網路書籤
Google Yahoo! MyShare HemiDemi Fiigo YouPush PChome Furl Technorati Digg Baidu
說明 & 進階搜尋

最近應用科學類新聞
Falcon 9 運載火箭處女航

人形機器人進入太空

美國空軍無人太空飛機 X-37B順利發射

雲端計算與機器人

美國國防研究轉向軟性科學

印度自製低溫引擎(cryogenic engines)運載火箭GSLV-D3發射失敗

印度即將驗證其自製低溫引擎火箭技術

全球網際網路100大熱門網站

如何在塞爆的電子郵件信箱,理出郵件的處理優先順序。

監測龐大量測物理量的智慧型異常偵測運算法

....更多的應用科學新聞

站務公告
[Nov 11] 科景讀者問卷調查(11/10∼12/15)
[May 23] 本站新增"加入網路書籤"功能
[Aug 20] 本站開始使用創用CC (creative commons) 授權模式

版權與轉載授權資訊
轉載登記簿

版權所有
本站版權聲明與轉載授權規定請見 http://www.sciscape.org/copyright.php

有任何建議或批評嗎?請聯絡我們, 謝謝!