垂直搜索引擎大體上需要以下技術
1.搜索引擎爬蟲:抓取網際網路上的相關網頁
2.網頁結構化信息抽取技術或元數據採集技術:從網頁中抽取出結構化的數據
3.分詞、索引:存儲並索引數據
4.數據展現:由于存儲的數據並非簡單的網頁數據,需要考慮根據行業需求進行展示
5.其他信息處理技術
垂直搜索引擎的技術評估應從以下幾點來判斷
1.全面性
2.更新性
3.準確性
4.功能性
垂直搜索的進入門檻很低,但是競爭的門檻很高。沒有專注的精神和精湛的技術是不行的。行業門戶網站具備行業優勢但他們又是沒有技術優勢的,絕對不要想像著招幾個人就可以搞定垂直搜索的全部技術,作為一個需要持續改進可運營的產品而不是一個項目來說對技術的把握控制程度又是垂直搜索成功的重要因素之一。