有些用戶將RSS搜索誤認(rèn)為“博客搜索”。雖然很多博客網(wǎng)站提供RSS聚合功能(自動(dòng)創(chuàng)建聚合是大多數(shù)博客軟件的特征),但并不是所有博客網(wǎng)站均提供這項(xiàng)服務(wù)。此外,理論上RSS可應(yīng)用于任何基于Web類(lèi)型的內(nèi)容。RSS從根本來(lái)講還是一種相對(duì)簡(jiǎn)單的規(guī)范,它利用了XML,并遵循一種標(biāo)準(zhǔn)的方式來(lái)組織和安排網(wǎng)絡(luò)內(nèi)容。
事實(shí)已經(jīng)證明,博客可以提供大部分RSS內(nèi)容。此外,新聞網(wǎng)站同樣也可以通過(guò)RSS實(shí)現(xiàn)內(nèi)容聚合。大部分新聞?wù)军c(diǎn)已經(jīng)實(shí)現(xiàn)這一功能。
并且RSS聚合將被更多地應(yīng)用于其他類(lèi)型的內(nèi)容。譬如,用戶可以利用RSS聚合獲得天氣預(yù)報(bào)、公司新聞及金融信息、包裹跟蹤等等方面的信息。甚至一直以來(lái)倍受人們推崇的雅虎目錄也已經(jīng)實(shí)現(xiàn)了RSS聚合。
盡管理論上存在著上百萬(wàn)聚合內(nèi)容,但要從中找到自己有用的相關(guān)的信息卻非易事。一方面,主要搜索引擎均開(kāi)始涉足聚合搜索,但截至目前還未有一家推出完善的聚合搜索服務(wù)。另一方面雖然也有一些規(guī)模較小、專(zhuān)業(yè)的博客和聚合搜索引擎,但由于它們?nèi)鄙賰?nèi)容資源,同時(shí)博客和聚合內(nèi)容中充斥著大量垃圾信息通常導(dǎo)致他們的搜索結(jié)果相關(guān)性極低。
RSS搜索引擎
互聯(lián)網(wǎng)上已經(jīng)誕生并發(fā)展起許多專(zhuān)業(yè)RSS搜索引擎,以下僅列決幾個(gè)較為知名的聚合搜索引擎,更多可參考
http://allrss.com/rsssearch.htmlBloglines(
http://www.bloglines.com)搜索引擎Ask Jeeves旗下的Bloglines,既是一個(gè)聚合搜索工具,又是一款聚合閱讀器/新聞聚合器。Bloglines主頁(yè)右上角放置了兩個(gè)搜索框,用戶可在第一個(gè)搜索框的下拉菜單中選擇搜索范圍,比如所有Bloglines索引的博客,個(gè)人訂閱的博客,全部網(wǎng)站,或添加一個(gè)聚合地址至個(gè)人訂閱;第二個(gè)搜索框則輸入關(guān)鍵字。
Bloglines的高級(jí)搜索頁(yè)面,提供有基于表格的簡(jiǎn)單布爾邏輯搜索功能,還可以按照流行度或日期過(guò)濾搜索結(jié)果,選擇不同的搜索范圍(所有博客、個(gè)人定制博客或個(gè)人定制博客意外的所有博客)。
Bloglines網(wǎng)站上公布了其已經(jīng)被收錄文章的總量,截至2005年9月8日為701,667,885。
此外,作為一款閱讀器,Bloglines在聚合內(nèi)容閱讀,管理個(gè)人訂閱等方面還有很多好用的特色功能。它集信息訂閱、分享、發(fā)布和搜索于一體,相對(duì)于其他同類(lèi)產(chǎn)品極具個(gè)性。
BlogPulse (
http://www.blogpulse.com)BlogPulse主要作為一卷跟蹤博客世界的流行趨勢(shì)和熱門(mén)話題的工具而眾所周知,實(shí)際上它還有一款很不錯(cuò)的聚合搜索引擎,同時(shí)它還擁有同類(lèi)聚合搜索服務(wù)中最大的聚合內(nèi)容索引庫(kù)之一。BlogPulse網(wǎng)站上目前公布的索引量為,可確認(rèn)博客網(wǎng)頁(yè)15,870,290個(gè)。
BlogPulse的高級(jí)搜索頁(yè)面提供有短語(yǔ)搜索,分別按照“包含全部關(guān)鍵字”、“包含任意一個(gè)關(guān)鍵字”和“精確關(guān)鍵字”三個(gè)選項(xiàng),此外你還可以在這里創(chuàng)建自己的布爾算子搜索請(qǐng)求。另外,你還可以按照指定時(shí)間范圍限制搜索結(jié)果,以時(shí)間或相關(guān)性排列搜索結(jié)果。
Daypop(
http://www.daypop.com)Daypop 是第一代博客/聚合搜索引擎之一,曾在2001年和2002年榮獲Search Engine Watch最佳提名(Search Engine Watch每年對(duì)所有搜索引擎進(jìn)行一次分類(lèi)評(píng)選)。Daypop的運(yùn)作完全依靠其創(chuàng)始人和所有者Dan Chan一人之力,因此較之其他同類(lèi)工具缺乏一定的發(fā)展動(dòng)力。
Daypop的高級(jí)搜索頁(yè)面提供有基本的按日期過(guò)濾結(jié)果,此外還有其他博客/聚合搜索工具未曾推出的按指定語(yǔ)言或國(guó)家限制搜索結(jié)果。
Daypop搜索框底部顯示了其當(dāng)前搜索范圍,涉及59000個(gè)新聞網(wǎng)站、博客網(wǎng)站及RSS 聚合。
Feedster(
http://www.feedster.com)Feedster 提供了多種有趣的特色功能,如訂閱某個(gè)搜索請(qǐng)求并將其保存為一個(gè)feed,或通過(guò)電子郵件發(fā)送新的搜索結(jié)果。此外,較之全文本搜索,F(xiàn)eedster還提供有獨(dú)特的搜索聚合內(nèi)容內(nèi)含信息和搜索聚合地址。在搜索聚合地址時(shí),用戶可以利用關(guān)鍵字或URL搜索,或者兩者結(jié)合進(jìn)行搜索。
在Feedster高級(jí)搜索頁(yè)面,用戶可將搜索范圍限制在某個(gè)聚合地址,也可以是多個(gè)聚合。此外,還能過(guò)濾某些聚合,包括你自己的。
Feedster主頁(yè)頂部顯示其當(dāng)前搜索量達(dá)到14,000,569個(gè)feeds(聚合地址)。
Findory Blogory(
http://findory.com/blogs/)Findory 是一款新聞搜索工具,同時(shí)具有獨(dú)立的博客搜索功能。Blogory的主頁(yè)版面看起來(lái)與Google新聞主頁(yè)相似,頁(yè)面頂部首先列出的是“top blogs”熱門(mén)博客,接著是按照類(lèi)別組織的其他博客鏈接,包括商業(yè)、政治、科技、個(gè)人、教育、綜合、法律、娛樂(lè)、世界、地區(qū)、運(yùn)動(dòng)、藝術(shù)、圖書(shū)、健康、科學(xué)。
Blogory沒(méi)有提供博客高級(jí)搜索,但其具有獨(dú)特的個(gè)性化適應(yīng)性RSS聚合功能,基于用戶的興趣或其他已經(jīng)越多的博客自動(dòng)為用戶尋找適當(dāng)?shù)牟┛汀?br>
Gigablast 博客搜索(
http://blogs.gigablast.com/)Gigablast是一個(gè)網(wǎng)絡(luò)搜索引擎,同時(shí)提供博客搜索。雖然博客搜索還處于測(cè)試版,但搜索結(jié)果質(zhì)量較之其他博客搜索引擎有過(guò)之而無(wú)不及。Gigablast沒(méi)有為各個(gè)搜索選項(xiàng)分別設(shè)置高級(jí)搜索頁(yè)面,但利用共用的高級(jí)搜索頁(yè)面也能夠很好地精確搜索結(jié)果。
Gigablast還提供XML搜索服務(wù),基于Gigablast搜索結(jié)果創(chuàng)建自己的聚合。雖然此功能稍顯多余,但對(duì)于希望跟蹤Gigablast搜索結(jié)果的用戶還說(shuō),還是值得一用。
Gigablast 還提供其他搜索選項(xiàng),其中網(wǎng)頁(yè)索引量達(dá)到2,068,530,608,博客索引量達(dá)到27,086,736個(gè)網(wǎng)頁(yè),旅游搜索量達(dá)到5,420,820個(gè)網(wǎng)頁(yè),政府搜索量達(dá)到34,367,200個(gè)網(wǎng)頁(yè)。Gigablast除了網(wǎng)頁(yè)和目錄搜索外,其他搜索功能均為測(cè)試階段。
IceRocket博客搜索(
http://www.icerocket.com/?tab=blog)與Gigablast類(lèi)似,IceRocket也提供多種搜索選項(xiàng),包括網(wǎng)頁(yè)搜索、新聞搜索、手機(jī)圖片搜索、圖片搜索、多媒體搜索。IceRocket博客高級(jí)搜索頁(yè)面提供有基本的布爾算子搜索和時(shí)間區(qū)間過(guò)濾搜索,并提供有獨(dú)特的按作者搜索功能。
IceRocket最近宣布將名稱(chēng)改為BlogScour,但未透露是否保留其他搜索選項(xiàng)。
PubSub(
http://www.pubsub.com)本文所列的所有博客和聚合搜索工具中,PubSub顯得較為獨(dú)特。
第一,PubSub不提供直接搜索。用戶必須首先為某個(gè)自己感興趣的關(guān)鍵字創(chuàng)建訂閱,然后PubSub將把隨時(shí)找到的相匹配的最新內(nèi)容通過(guò)預(yù)警方式通知用戶。預(yù)警方式包括電子郵件、SMS、PDA/移動(dòng)設(shè)備及即時(shí)通訊工具等。
PubSub的第二個(gè)獨(dú)特之處在于,它是一款“實(shí)時(shí)”搜索工具。也就是說(shuō),當(dāng)新內(nèi)容被發(fā)布到網(wǎng)絡(luò)后,用戶幾乎馬上就能得到預(yù)警通知,第一時(shí)間獲得這些信息。
目前,PubSub的存儲(chǔ)量超過(guò)1600萬(wàn)博客,50,000多個(gè)互聯(lián)網(wǎng)新聞組及所有SEC美國(guó)證監(jiān)會(huì)(EDGAR,電子數(shù)據(jù)集中與報(bào)告系統(tǒng))文件。
Technorati (
http://www.technorati.com)Technorati提供有網(wǎng)絡(luò)搜索、標(biāo)簽搜索和博客搜索,并允許用戶分別按關(guān)鍵字、URL或標(biāo)簽進(jìn)行搜索。在Technorati的統(tǒng)一搜索頁(yè)面上,集合了所有搜索方式,用戶只要在恰當(dāng)?shù)乃阉骺騼?nèi)輸入不同格式的搜索請(qǐng)求,就能獲得相匹配的搜索結(jié)果。
Technorati網(wǎng)絡(luò)搜索當(dāng)前可跟蹤1,680萬(wàn)網(wǎng)站和15億鏈接;標(biāo)簽搜索可跟蹤實(shí)時(shí)更新的200萬(wàn)個(gè)網(wǎng)絡(luò)標(biāo)簽;博客搜索目前還是測(cè)試版,實(shí)際是Technorati按照主題組織的博客目錄。
此外,Technorati的流行列表也值得一看。在這里,Technorat按照新聞、書(shū)籍、電影、Top 100博客等,展示了網(wǎng)上用戶當(dāng)前關(guān)注的各種熱門(mén)話題。流行列表中的所有資源都保持實(shí)時(shí)更新?tīng)顟B(tài)。
主流搜索引擎與RSS
大量小型但專(zhuān)業(yè)的RSS搜索引擎涌現(xiàn)的同時(shí),主流搜索引擎又在作何打算呢?盡管這些主流引擎都在窺覷RSS搜索,但目前還未有任何一家推出較為成熟的RSS搜索服務(wù)。
. Ask Jeeves已經(jīng)通過(guò)旗下Bloglines推出RSS搜索服務(wù),并承認(rèn)RSS為其重要發(fā)展項(xiàng)目之一。但Bloglines是否繼續(xù)拓展,集成類(lèi)似于 Teoma的強(qiáng)大搜索能力,還是Ask公司繼續(xù)Bloglines現(xiàn)有的RSS搜索能力仍未為可知。最大的可能性是以其他補(bǔ)充功能來(lái)增強(qiáng)這兩種服務(wù)。
. Google沒(méi)有為RSS聚合內(nèi)容開(kāi)通獨(dú)立搜索入口,但自從Google推出可定制個(gè)性化首頁(yè)之后,Google用戶就可以通過(guò)“創(chuàng)建新的板塊” (create a new section)鏈接,發(fā)現(xiàn)尋找聚合內(nèi)容的搜索框。此外,用戶還可以在任意Google搜索框內(nèi),使用“filetype:rss”及 “filetype:xml”命令過(guò)濾聚合信息。最新推出的Google Desktop 2桌面搜索第二代還增加了專(zhuān)門(mén)針對(duì)RSS聚合內(nèi)容的自動(dòng)搜索功能。
2003年Google收購(gòu)Blogger時(shí)曾表示,博客搜索已是板上釘釘?shù)氖虑椤1M管Google對(duì)其RSS搜索計(jì)劃一直三緘其口,但最終推出已然顯而易見(jiàn)并且肯定會(huì)盡早發(fā)布。
. MSN搜索也沒(méi)有推出RSS搜索服務(wù),但微軟同樣正著手該技術(shù)的開(kāi)發(fā)。MSN搜索首頁(yè)已經(jīng)增加了RSS聚合功能,微軟最近還推出一款RSS聚合的屏保程序。
. 雅虎無(wú)疑是與RSS“緣分”最長(zhǎng)的搜索引擎。雅虎高級(jí)搜索已經(jīng)提供了XML,RDF及RSS文件過(guò)濾功能。此外,雅虎一般搜索結(jié)果中也能夠返回聚合內(nèi)容。不僅如此,用戶只要點(diǎn)擊搜索結(jié)果中的“Add to My Yahoo(加入我的雅虎)鏈接,就可將該聚合直接添加進(jìn)“My Yahoo”(我的雅虎)頁(yè)面。