一(yī)、搜索?
我們先說(shuō)搜索。Google、百度代表一(yī)種模式,可(kě)以說(shuō)是(shì)全網的(de)基礎搜索模σ式;而qihoo和(hé)daqi代表另一(yī)種全網模式。這(zhè)裡(lǐ)我想詳細說(shuō)說(shuō):從(cóng)表面看(kàn),qihoo和(hé•)daqi目前都(dōu)是(shì)對(duì)BBS內(nèi)容進行(xíng)聚合,似乎是(shì)“垂直搜索(聚合)”,但(dàn)其實他(tā)們也(σyě)是(shì)基于全網的(de)廣域搜索和(hé)聚合――即基本上(shàng)針對(duì)所有(yǒu)中文(wén)bbs₩;所以我并不(bù)把他(tā)們看(kàn)作(zuò)是(shì)“垂直”的(de)。而第三種搜索模式,就(jiù)是(shì)酷訊網為(wèi)代表的(de),真正的 (de)“垂直搜索”――他(tā)們不(bù)用(yòng)索引海(hǎi)量的(de)網站(zhàn),直接索引相(xiàng)關信息的(✔de)宿主網站(zhàn)就(jiù)可(kě)以了(le)。而根據酷訊的(de)業(yè)務範圍,我分(fēn)析,比如(rú)租房γ(fáng)這(zhè)塊,他(tā)們索引主要(yào)的(de)百來(lái)個(gè)租房(fáng)網站(z™hàn)即可(kě)。
而一(yī)個(gè)真正的(de)搜索網站(zhàn),主要(yào)需要(yào)三個(gè)功能(nén₩g):1,爬蟲系統分(fēn)析海(hǎi)量未知(zhī)網站(zhàn)的(de)網頁;2,索引經過爬蟲抓取回來(lái)的(de)網站(zhàn)網頁;3,對(duì)用(yòng)戶搜索請(qǐng)求的(de)分(fēn)析和(hé)響應。在上(shàng)一(yī)段中,我之所∞以試圖澄清目前三種不(bù)同類型的(de)“搜索”網站(zhàn),是(shì)因為(wèi)這(zhè)三種不(bù)同搜索模式,在搜索的(de)三個(gè)功能(néng)上(sφhàng),技(jì)術(shù)含量是(shì)完全不(bù)同的(de)。Google,baidu的(de)技(jì)術(shù)含←量要(yào)求最高(gāo);而酷訊模式的(de)技(jì)術(shù)含量最低(dī)。
因為(wèi)第一(yī),酷訊根本不(bù)需要(yào)用(yòng)爬蟲分(fēn)析未知(zhī)網站£(zhàn),隻需要(yào)人(rén)工(gōng)對(duì)有(yǒu)限的(de)分(fēn)類信息宿主網站(zhàn₩)進行(xíng)分(fēn)析,然後爬蟲定向抓取即可(kě);(酷訊是(shì)否采用(yòng)機(jī)器π(qì)分(fēn)析另說(shuō),我隻是(shì)說(shuō)明(míng)人(rén)工(gōng)分(fēn)析在此點上(shàng)能(néng)達到(dào)同樣效果);第二π,索引這(zhè)些(xiē)宿主網站(zhàn)也(yě)不(bù)需要(yào)特别的(de)策略,因為(wèi)幾個(gè)分(fēn)類确定了↓(le),信息就(jiù)很(hěn)容易格式化(huà),比如(rú),租房(fáng)無非就(jiù)地(dì)點,房(fáng)租,聯♦系方式等等信息;最有(yǒu)趣的(de)是(shì)第三――其實真正的(de)搜索網站(zhàn),對(duì)用(yòng)戶搜索請(qǐng)求的(de)語義理(lǐ)解β,技(jì)術(shù)含量非常高(gāo);但(dàn)酷訊采取了(le)兩個(gè)“取巧”的(de)方式,降低(dī)了(le)這(zhè)方面的(de)技(jì)術δ(shù)難度:(1)“限定”用(yòng)戶的(de)查詢請(qǐng)求,以降低(dī)系統對(duì)用(yòng)戶語義解釋的(de)難度。以租房(fáng)為(wè&i)例,提示用(yòng)戶輸入名詞的(de)“地(dì)名”,這(zhè)樣系統對(duì)用(yòng)戶語義的(de)解釋就(jiù)很(hěn)容易了(le)――但(dàn)即使如(rú)此,酷訊做(zuò)的(de)也(yě)不(bù)好(hǎoβ),比如(rú),搜索“北(běi)三環”有(yǒu)1033條信息;而搜索同義的(de)“北(běi)三環附近(jìn)”隻有(y•ǒu)143條信息;“北(běi)三環一(yī)帶”隻有(yǒu)7條信息;(2)網站(zhàn)列出了( le)主要(yào)查詢條件(jiàn),類似分(fēn)類,用(yòng)來(lái)降低(dī)用(βyòng)戶個(gè)性化(huà)查詢請(qǐng)求的(de)可(kě)能(néng)性,因此降低(dī)了(le)系統語✘義解釋的(de)難度。同樣以租房(fáng)為(wèi)例,酷訊通(tōng)過幾個(gè)最常用(yòng)的(de)分(fēn)類推薦,實際上(shàng)用(yòng)戶完全可(kě)能(néng)不(bù)用(yòng)再搜索,隻點選這(zhè)幾↔個(gè)“分(fēn)類”即可(kě),系統也(yě)就(jiù)不(bù)用(yòng)去(qù)理(lǐ)解用(yòng£)戶的(de)語義
通(tōng)過如(rú)上(shàng)分(fēn)析可(kě)知(zhī),理(lǐ)論上(sδhàng),其實不(bù)太需要(yào)搜索技(jì)術(shù),酷訊網站(zhàn)就(jiù)可(kě)以被做(zuò)出來(lái)。所以說(σshuō)酷訊是(shì)一(yī)個(gè)搜索概念的(de)網站(zhàn),看(kàn)起來(lái)有(yǒu)點勉為(wèi)←其難,比較恰當的(de)定位應是(shì)一(yī)個(gè)分(fēn)類網站(zhàn)“mashup的(de)輕量級應用(yòngβ)”。
值得(de)一(yī)提的(de)是(shì),酷訊比較引以為(wèi)豪的(de)一(yī)些(∑xiē)“技(jì)術(shù)”,其實也(yě)恰恰是(shì)mashup的(de)應用(yòng)。比如(rú),“拉框搜索”,即是(λshì)分(fēn)類和(hé)mapbar的(de)地(dì)圖服務的(de)mashup;又(yòu)比σ如(rú),“世界上(shàng)第一(yī)個(gè)會(huì)‘冒泡’的(de)搜索引擎”,其實就(jiù)是(shì)爬蟲爬得(de)勤快(kuài)點,再加上(shàng)頁面的(de)€ajax就(jiù)能(néng)解決――這(zhè)些(xiē)“世界第一(yī)”的(de)技(jì)術(shù),看(kàn)起來(lái)₽“酷”,其實如(rú)上(shàng)所述,真正從(cóng)技(jì)術(shù)上(shàng)看®(kàn)也(yě)都(dōu)是(shì)輕量級的(de)“花(huā)活兒(ér)”。
二、脆弱的(de)産業(yè)鏈
也(yě)就(jiù)是(shì)說(shuō),酷訊其實就(jiù)是(shì)分(fēn)類信息的(de)用(yòng)戶入口網站(zhàn),即用(yòng)戶如(r ú)果要(yào)找相(xiàng)關分(fēn)類信息,首先去(qù)酷訊,這(zhè)個(gè)是(shì)目前酷訊的(de)真實定位。這(zhè)↑種垂直portal的(de)定位,其實和(hé)新浪的(de)新聞門(mén)戶定位是(shì)一(yī)樣的(de),隻是(sh§ì)新浪在産業(yè)鏈中的(de)“宿主”是(shì)傳統報(bào)紙(zhǐ),而酷訊在産業(yè)鏈中的(de)宿主是(shì):分(fēn)類網站(zhàn)。
那(nà)麽酷訊在分(fēn)類信息産業(yè)鏈中,這(zhè)樣的(de)定位合适嗎(ma)?
要(yào)回答(dá)這(zhè)個(gè)問(wèn)題,我們先看(kàn)看(kàn)國(guó)外(wài)分(fēn)類信息第一(y₹ī)網站(zhàn)craigslist的(de)遇到(dào)的(de)兩個(gè)案例:當craigslist成為(wèi)最大(dà)的(de)分(fēn)類信息網站(zhàn)δ之後(請(qǐng)大(dà)家(jiā)務必注意行(xíng)業(yè)老(lǎo)大(dà)這(zhè)個(gè)背景)✔,craigslist允許housingmaps.com引用(yòng)他(tā)們的(de)數(shù)據,但(dàn)是(shì)拒絕了(lσe)另外(wài)一(yī)家(jiā)Oodle。
對(duì)此,非常湊巧,我寫此博客,搜索資料的(de)時(shí)候發現(xiàn),酷訊網站(zhàn)方就(jiù)有(yǒu)一(yī)篇文(wén)章(zhāng)談論此問(wèn)題×,摘抄如(rú)下(xià):
。。。。。。一(yī)直有(yǒu)朋(péng)友(yǒu)關心,酷訊這(zhè)種分(fēn)類信息搜索與分(fēn≠)類信息發布網站(zhàn)是(shì)否存在必然的(de)對(duì)立和(hé)競争關系,分(fēn)類信息發布網站(zhàn≠)是(shì)否會(huì)因為(wèi)利益沖突而拒絕分(fēn)類信息搜索網站(zhàn)進入其網站(zhàn)獲取數(shù)據呢(ne)?
粗看(kàn)起來(lái),這(zhè)兩類網站(zhàn)好(hǎo)象存在一(yī)定的(de)競争關系,而且朋(péng)友(yǒu)們一(yī)般都(dōu)舉美(měi)國(guó)垂直搜索網站(zhàn)Oodle 被craigslist 警告“希望不(bù)要(yào)再使用(yòng)”來(lái)自(zì)其列表 的(de)信息的(de)例子(zǐ),來(lái)證明(míng)這(zhè)種說(shuō)法非常有(yǒu)根據。
但(dàn)是(shì),仔細分(fēn)析後,就(jiù)會(huì)發現(xiàn)這(zhè)是(shì)一(yī)個(gèπ)僞命題。先說(shuō)oodle與craigslist的(de)故事(shì)。為(wèi)什(shén)麽craigslist并不(bù)屏蔽整合其信息的(deΩ)其他(tā)搜索引擎,而獨獨對(duì)oodle進行(xíng)警告呢(ne)?隻要(yào)看(kàn)看(kàn)oodle網站(zhàn)就(jiù)知(zhī)道(→dào)了(le),——它把來(lái)自(zì)多(duō)個(gè)分(fēn)類列表的(de)信息彙聚在一(yī)個(gè)頁面下(xià),看(kàn)起來(lái)簡直就(♥jiù)是(shì)第二個(gè)craigslist。這(zhè)就(jiù)好(hǎo)比google∏如(rú)果抓取雅虎的(de)新聞,而表現(xiàn)形式又(yòu)和(hé)雅虎新聞頻(pín)道(dào)毫無區(qū)别,必然會(huì)被雅虎警告。這(★zhè)也(yě)隻能(néng)說(shuō)明(míng),如(rú)果搜索引擎的(de)業(yè)務模式<與原信息提供者過度重疊,而不(bù)是(shì)另辟蹊徑或有(yǒu)技(jì)術(shù)上(shàng)的(de)創新,那(nà)麽勢必會(huì)與原信息提供者形成沖突。
從(cóng)craigslist 并不(bù)拒絕其他(tā)垂直搜索引擎(如(rú)housingmaps )整合其內(nèi∑)容也(yě)可(kě)以看(kàn)出,craigslist 在美(měi)國(guó)分(fēn)類✔信息發布社區(qū)中雖然享有(yǒu)“一(yī)哥(gē)”的(de)地(dì)位,卻也(yě)無法抵擋互聯網整合和(hé)共享的(de)大(dà)趨勢。從(c$óng)酷訊的(de)用(yòng)戶行(xíng)為(wèi)分(fēn)析調查也(yě)發現(xiàn↔),用(yòng)戶并不(bù)是(shì)隻停留在酷訊網站(zhàn)上(shàng)面,幾乎每位用(yòng)戶對(duì)于感興趣的(de)信息,都(dōu)會↕(huì)點擊進去(qù)看(kàn)原數(shù)據網頁。酷訊作(zuò)為(wèi)分(fēn)類信息搜索門(mén)戶給✘衆多(duō)分(fēn)類信息發布社區(qū)帶去(qù)了(le)活躍的(de)用(yòng)戶。

掃碼立即溝通(tōng)
公衆号加關注