《商業周刊》網站日前刊登了分析文章指出,就在Google上市成?人們談論最多的話題之時,科技巨頭IBM在大力推崇其名?WebFountain的網路搜索技術。Google的搜尋範圍能力和IBM的WebFountain技術都有什麼不同呢?我們不妨來聽聽IBM該業務兩位主管的說法。
8年前,斯坦福大學兩名電腦專業的學生開始在網路搜索技術領域內展開了新的探
索,並希望能與當時也在進行相關技術開發的IBM決一勝負。這兩名學生改變了此前僅僅在文檔中進行搜索的傳統方式,而採取了提供互聯網鏈結的全新方案。這兩名學生後來創建了著名的Google公司,並準備在今後數月內進行它的首次公開募股(IPO)活動。
與Google相比,IBM的網路搜索技術似乎已經從公眾的視線中消失。儘管如此,IBM多年來卻從沒有停止自身網路搜索技術的研發工作。在經過七年的秘密行動之後,IBM于去年正式向外公佈了它名稱: WebFountain的網路搜索技術。IBM稱,它的這項技術具備了高智慧篩選搜索資訊的特點。
眾所周知,目前絕大部分搜索引擎所採用的方式是通過關鍵字及相關網頁鏈結來實現。與這種傳統的方式不同,WebFountain將可以提供基於文章觀點的搜索方式。舉例來說,通過WebFountain技術,你不僅可以來搜索與索尼CyberShot數位相機的相關資訊,你還可以鍵入“人們對CyberShot產品品質的看法?”這樣的句子,從而得到與該產品有關見解的文章資訊。
由此可見,WebFountain技術的終極目標是想給網路搜索技術帶來全新的變革。就目前而言,大多數網路搜索還無法具備記憶功能。換句話說,搜索者進行過相關主題搜索後,在他再次進行此類主題搜索活動時,搜索引擎不但無法提供他以前所搜索過的相關資訊,而且也無法就此主題的相關進展情況進行合理的分析。而WebFountain技術就是想要針對這些不足而提出自己的解決方案。
IBM稱,它的WebFountain技術並不是想取代Google目前的市場位置,而只是想提供一種更智慧的搜索服務方式。就這個問題,《商業周刊》記者採訪了IBM WebFountain業務總負責人丹-格魯爾(Dan Gruhl)及首席科學家安德魯-湯姆金斯(Andrew Tomkins)。下面就是這次採訪的摘要。
問:?何你們IBM目前急於給自己挂上搜索服務商的招牌?
格魯爾:雖然目前已有的搜索技術使我們獲取資訊更加容易,但這還僅僅是個開始。如何對各種資訊的進展情況進行智慧分析,這就是我們開發WebFountain技術的基本目的之一。
問:那WebFountain的長期目標是什麼?與Google的技術相比,你們是否也會在今後提供一種全能型的搜索引擎服務?
湯姆金斯:我們採取了不同的搜索結果解決方案。我們更願意搜索者在進行搜索時,他所使用的搜索語言更豐富,也更有形象。當然這需要使用者花上一定的時間來熟悉WebFountain的技術特徵,這樣才能最大程度地利用這一新技術。我們認為,如果說傳統的搜索技術向人們提供了網路上“有什麼樣的資訊”這一功能,而WebFountain則向人們回答了網上“為何會有這麼多的相關新資訊”這一新問題。
問:那從長期目標看,你們的WebFountain業務是否會與Google的業務出現重疊的情況?
湯姆金斯:我們的長期目標是,我們將力爭能實現每20分鐘就對相關網頁資訊做到隨時更新。我們的這項業務能在每分鐘內回答某個特定問題的最新進展。由此可見,我們WebFountain所面向的是一個與Google迥然不同的市場。
問:那將來普通消費者是否也能享受到你們WebFountain所提供的最新服務?
格魯爾:如果有人願意做這方面的開發工作,我們當然不會反對。事實上是普通的網民正成?網上搜索的主力軍,這種趨勢還會進一步發展下去
那什麼是 Webfountain呢??
WebFountain is an Internet analytics engine implemented by IBM for the study of unstructured data on the World Wide Web. IBM describes WebFountain as:
. . . a set of research technologies that collect, store and analyze massive amounts of unstructured and semi-structured text. It is built on an open, extensible platform that enables the discovery of trends, patterns and relationships from data.[1]
The project represents one of the first comprehensive attempts to catalog and interpret the unstructured data of the Web in a continuous fashion. To this end its supporting researchers at IBM have investigated new systems for the precise retrieval of subsets of the information on the Web, real-time trend analysis, and meta-level analysis of the available information of the Web.
Factiva, an information retrieval company owned by Dow Jones and Reuters, licensed WebFountain in September 2003, and has been building software which utilizes the WebFountain engine to gauge corporate reputation.[2] Factiva reportedly offers yearly subscriptions to the service for $200,000. Factiva has since decided to explore other technologies, and has severed its relationship with WebFountain.
WebFountain is developed at IBM's Almaden research campus in the Bay Area of California.
相關的文章下載:
1. WebFountain
2. WebFountain—today’s key to proactive management
3. Sentiment Mining in WebFountain
據IBM資訊管理集團的總經理珍妮特表示稱,IBM一直在悄悄地開發資料存儲軟體,將能夠極大地提高企業查找“分散”在網路上的各種文檔。
新的搜索軟體和其他資訊獲取軟體,彰顯出IBM退出PC等廉價硬體業務領域、轉向高利潤的軟體、服務業務的戰略。珍妮特說,開發新的搜索軟體將加快IBM由關聯資料庫廠商向資訊管理軟體提供商轉型的速度。
珍妮特表示,與資料庫相關的搜索軟體將使企業客戶能夠以XML格式存儲文檔,這將大大提高文檔的查找速度。該搜索工具的α版正在由約30家客戶進行測試,正式版將于明年下半年完成。IBM還沒有為該搜索工具命名,或透露有關如何封裝的資訊。
珍妮特說,關聯資料庫是企業的“中流砥柱”,主要用於存儲各種記錄和交易資料。但約85%的企業資料被存儲在所謂的非結構化資料源中??例如字處理文檔、XML文檔、圖像,這就給資料的查找帶來了困難。
通過收購和對搜索技術的大規模投資,IBM正在悄悄地成為搜索技術領域的領頭羊,其目標是使對企業網路的搜索象使用Google搜索互聯網那樣常見和方便。
通常情況下,企業的員工通過口頭傳達的方式瞭解業務報告,或者他們會重新編寫一份已經存儲在企業伺服器上的報告。對現有報告“倉庫”進行搜索將大大加快員工瞭解業務報告的過程,還可能減少不必要的資訊冗餘。
分析人士指出,隨著業務範圍的擴展,IBM將與微軟、甲骨文,以及其他一些規模較小的專業企業搜索公司發生激烈競爭。甲骨文的OracleFiles10g能夠幫助用戶查找以文本方式存儲的文檔,將使甲骨文的優勢擴展到資料庫之外的領域;微軟一直在積極地開發搜索技術,WinFS檔系統能夠簡化對存儲在PC上的不同類型內容的查找。另外,微軟也銷售內容管理軟體,並在開發新的搜索引擎,挑戰Google和雅虎。幾家小公司也推出了基於文本的搜索軟體,使企業客戶對它們的網路進行搜索。
儘管信息量要少得多,但對企業網路進行搜索要比對互聯網進行搜索複雜得多。與互聯網不同的是,企業的資訊可能存儲在多個地方,而且以多種格式進行存儲。另外,企業客戶還要求穩定的存儲系統,需要遵守一些監管條例。臺式機搜索與互聯網搜索的另一個重大不同之處是,在企業網路中搜索需要從多個資料源收集資訊,並使它們之間發生關聯。
IDC估計,去年企業搜索市場達到了6.2億美元,增長幅度達到了20%。IDC的分析師菲爾德曼說,由於不同的廠商都希望在企業資訊管理市場上分一杯羹,傳統的內容管理提供商和專業搜索廠商之間的碰撞是必然的。內容管理和搜索廠商以前合作得非常愉快,但現在這二個市場融合了。這一新興的資訊架構正是IBM、甲骨文以及其他廠商追逐的目標。
IBM正在通過收購和利用自己的研發成果開發內容管理和搜索產品。目前,在IBM的研發部門約有300名工程師在從事與搜索相關的專案的研究。WebFountain專案旨在改進簡單的文本匹配搜索規則,並通過檢查句子中各單詞間的關係發現文檔中更多的含義。IBM已經開發了一個名為Marvel的搜索引擎原型產品,能夠在視頻內容中找到特定的場景。
今年早些時候DB2InformationIntegrator的發售,使得IBM在企業搜索市場上取得了一席之地。IBM還計畫改變在資料庫中存儲XML文檔的方式,從而提高搜索能力。
川崎汽車公司負責資訊管理的主管維克多說,IBM的技術非常有吸引力,因為它能夠處理不同類型的資訊,適應不同的運行環境。他關注過的一些小公司的技術只能搜索範圍要窄得多的資訊類型。
珍妮特說,同時管理結構化資料和電子郵件、文本文檔等非結構化資料代表著內容管理產業的未來。IBM的策略是開發面向大企業客戶的全功能資訊管理平臺。菲爾德曼表示,其他公司銷售的產品只能解決不太複雜的技術。
儘管IBM在關聯資料庫市場上是一家重量級廠商,但其大多數與搜索相關的工作仍然處於研發階段。維克多表示,IBM在企業搜索市場上最大的挑戰可能是其形象,而不是技術。當客戶想到搜索時,它們不會想到IBM。IBM能夠使自己被客戶接受為搜索服務提供商嗎?
沒有留言:
張貼留言