搜索引擎Prototype Phoenix
Powered by 张帅, 杨一江, 乔裕哲
详细说明在这里,安装包在这里
整体介绍
Maintained by 张帅
1、载入数据
“在线载入”:在线爬取网页
“本地载入”:使用使用本地数据进行初始化
使用结巴分词
“在线载入”:设定爬取起始地址和最大网页数,开始爬取
*构建了起始地址栏和最大网页数栏与“在线载入”的链接,因此编辑完成之后可以直接按ENTER键,而不需要点击
*使用子线程机制沟通爬虫与主界面,避免了网页获取较慢时界面卡死
*使用子线程沟通倒排索引与主界面,避免了倒排索引写文件较慢时界面卡死
*爬取完成之后自动分词并建立倒排索引
“本地载入”:设定载入目录和最大网页数
*载入数据之后自动建立倒排索引
2、检索数据
检查并识别布尔表达式
根据布尔表达式计算并分词,交付倒排索引
倒排索引调入文件并搜索,搜索结果返回主线程
主线程为搜索结果建立超链接,并对关键词标红
点击超链接可以调用系统浏览器访问
3、界面设计
开始界面
进度条:使用信号-槽机制与子线程沟通,实时显示子线程进度
4、其他设计
程序打包及安装
使用Qtframework,安装程序自动在开始菜单和桌面创建快捷方式,可在“控制面板>卸载程序”卸载
爬虫介绍