自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 2021-07-28

查漏补缺 进行项目总结和反思

2021-07-28 21:27:23 90

原创 2021-07-27

开始录制演示视频

2021-07-27 18:58:39 82

原创 2021-07-26

现在已经进入项目收尾阶段了

2021-07-26 10:35:09 82

原创 2021-07-22

本项目以业务驱动,构建医疗知识图谱,知识schema设计基于所采集的结构化数据生成(对网页结构化数据进行xpath解析)。本项目以neo4j作为存储,并基于传统规则的方式完成了知识问答,并最终以cypher查询语句作为问答搜索sql,支持了问答服务。...

2021-07-22 13:19:20 222

原创 2021-07-20

在测试的时候要考虑到这些问题:爬虫爬取的数据多,网络速度较差时需要很长时间对爬虫,有些仍存在于网页源码中的url链接可能已经失效,但是在浏览器上是看不到这些链接的,此时如果对所有的url进行跳转和进行爬取,就会出现运行时进入已经失效的url链接中,并返回404一类的信息,但是如果不对这类信息处理就会导致后续的对网页源码的分析出现错误导致爬虫程序中途停止,所以在设计的时候一定要考虑各种边界和异常情况并进行处理以免测试时的反复测试导致很多时间上的浪费。...

2021-07-20 17:04:50 79

原创 2021-07-19

测试内容爬虫是我们组获取药品信息的重要手段,我负责测试的部分就是要保证爬虫所爬取的药品信息的正确性,以及系统对药品信息管理的功能是否正常。测试目的:测试报告是指把测试的过程和结果写成文档,对发现的问题和缺陷进行分析,为纠正软件的存在的质量问题提供依据,同时为项目验收和交付打下基础。我的测试目的要是对爬虫模块后续可能的扩展提供经验和维护管理系统对药品信息管理运作的正常测试方法:通过运行爬虫,对爬虫爬取的结果与寻医问药网上的药品信息进行对比,检查是否有遗漏或者多余的信息,对管理系统依次测试每个功能点,

2021-07-19 21:33:30 66

原创 2021-07-16

最近要开始测试工作了,采用黑盒测试和白盒测试的方法,对已有经编写好的程序开始测试。

2021-07-16 01:00:11 78

原创 2021-07-14

初步把文档管理目录定为以下几层文档目录00管理--------------项目计划--------------会议纪要--------------项目周报01需求--------------资料收集--------------调研报告--------------需求变更02设计--------------概要设计--------------详细设计03开发--------------开发指南--------------程序设计04测试--------------测试用例-

2021-07-14 11:17:08 65

原创 2021-07-12

爬虫已经告一段落了,最近开始文档管理工作。

2021-07-12 16:05:33 77

原创 2021-07-11

爬虫数据处理中ing

2021-07-11 01:43:38 75

原创 2021-07-08

pandas处理数据格式遇到的问题总结:1.有的药品说明书中没有【】号,因此在代码中加上【】,但是还存在缺陷,最好的是在爬虫的时候,将爬取的数据做一定的处理。2.在多个商品在一个文件中,采用先将文件中的商品数的位置找出来,然后采用字符串的索引进行分块数据。3.在成分一列中,存在换行,而pandas中读取的数据都是每一行,因此将数据中的换行先list成一句话,在进行处理。最好的方法是在爬虫的过程中进行处理。4.使用pandas中读取 pd.read_csv(file,encoding=“gbk”,n

2021-07-08 20:40:28 70

原创 2021-07-06

爬虫完毕后,开始进行数据处理。1.data\medical.json这里面是已经存储好的疾病知识数据,打开看一下。新建一个openjson.py文件,输入以下内容:with open(r’C:\QASystemOnMedicalKG\data\medical.json’, ‘r’, encoding=‘utf8’) as js:for js_data in js:print(js_data)执行,可以看到,json文件里面的数据是这样的:{ “_id” : { “$oid” : “5bb579

2021-07-06 16:43:24 303

原创 2021-07-01

爬虫:数据来源为寻医问药网的疾病百科 http://jib.xywy.com/。爬取疾病介绍页的简介、病因、预防、症状、检查、治疗、饮食保健等详情页的内容。爬虫模块使用的是urllib库,数据存在数据库中。...

2021-07-01 15:59:18 106

原创 2021-06-30

学习了爬虫相关知识,主要使用以下三个相关工具:BeautifulSoup 库 ,一款优秀的HTML/XML解析库,不用考虑编码;Requests 库,一款比较好用的HTTP库Fiddler. 工具,这是一个HTTP抓包软件,能够截获所有的HTTP通讯。...

2021-06-30 17:42:42 76

原创 2021-06-28

暑期实训记录

2021-06-28 22:14:55 115

原创 项目实训——自定义评论区组件

自定义评论区组件1.评论区的效果图如下:2.相关数据结构对象comment3.组件输入Input一个comment数组4.功能细节1、评论时最多输入64个中文字符2、输入框点击后增高3、输入框输入内容后,提交按钮变为可用4、评论菜单点击后,非本用户的“删除按钮被禁用”(变灰),只有自己的评论点击后是如下状态5、删除确认6、回复评论的按钮样式与评论不同7、评论的回复只能删除不能回复,既最多1层回复详细样式交互细节见:https://xd.adobe.com/view

2021-04-16 20:01:38 294

原创 B类项目实训

个人项目实训开发经历这是本次学生团队项目开发的流程记录博客,因博主主要负责开发前端,故内容以前端为主。项目背景个人分工1.关于React相关内容的学习2.我的任务项目背景为了解决如何让我院学生更高效的学习教师更方便的发布任务和通知的问题,这需要有效管理通知作业文件的系统,如今很多班级使用社交软件进行工作,但也会遇到许多问题,故本组决定试做适用于大学校园的班级管理系统,供班级内教师学生以及学校工作导师使用来更好地完成教学,学习和日常事务管理。个人分工在本次系统设计中,博主主要负责前端的开

2021-04-15 16:19:24 174

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除