- 博客(9)
- 收藏
- 关注
原创 jsoup微信公众号文章标题、发布时间、作者、封面图片的爬取
在做项目时候遇到一个需求,后台添加微信公众号上面的文章时候能自动获取到这篇文章的标题、发布时间、封面图片,这样就不用手动去添加太多的信息,只需要一个url就够了。所以用jsoup做了一个简单的爬虫,根据文章的url获取这些信息。原理封面图片:随便选择一个微信公众号,例如:如图上所示就是文章的封面图片,这些封面图片大多在原文里是有的。但是,像上面这两篇文章,原文里是没有封面图的。但是在文章...
2020-04-29 20:17:04
1878
转载 leetcode刷题笔记5——三数和为0、三数和最接近目标数、四数和为目标数
题目:给你一个包含 n 个整数的数组nums,判断nums中是否存在三个元素 a,b,c ,使得a + b + c = 0 ?请你找出所有满足条件且不重复的三元组。注意:答案中不可以包含重复的三元组。示例:给定数组 nums = [-1, 0, 1, 2, -1, -4],满足要求的三元组集合为:[ [-1, 0, 1], [-1, -1, 2]]题解:...
2020-03-26 17:14:25
297
原创 leetcode刷题笔记4——和为s的连续正数序列
这道题自己想只能想到暴力求解,然后翻看了一下评论后发现一个很厉害的方法,在自己尝试之后特此记录一下。题目:输入一个正整数 target ,输出所有和为 target 的连续正整数序列(至少含有两个数)。序列内的数字由小到大排列,不同序列按照首个数字从小到大排列。示例 1:输入:target = 9输出:[[2,3,4],[4,5]]示例 2:输入:target = 15输出:...
2020-03-06 14:56:42
220
原创 基于基站定位数据的商圈分析
目的通过手机用户的定位数据来进行层次聚类从而划分商圈类型,从而比较不同商圈的价值确定不同的商业营销方案原始数据截图分析过程与方法初步分析1、手机用户在使用短信业务、通话业务、开关机、正常位置更新、周期位置更新和切入呼叫的时候均产生定位数据,定位数据记录手机用户所处基站的编号、时间和唯一标识用户的EMASI号等。2、历史定位数据描绘了用户的活动模式,一个基站覆盖的区域可等价于商圈,通...
2019-11-27 18:11:27
2175
2
原创 用户认购定期存款预测R语言实现
目的把银行已认购定期存款的客户原始数据建立决策树模型,从而预测新一批客户是否会认购定期存款原始数据截取数据离散化在本次实验室数据中,即包括离散型数据,也包括连续型数据,且一些连续型数据中最大值和最小值之间存在很大差异。如原始数据中的duration属性,最大值、最小值之间跨度很大,为了避免这种大跨度产生噪音,对实验结果造成影响,我们利用weka对该属性数据进行等宽离散。建立分类预测模型...
2019-11-27 17:57:24
1209
1
原创 航空公司客户价值分析R语言实现
目的通过K-means把航空公司客户数据进行聚类,在传统航空公司的RFM分类模型基础上进行改进优化,建立LRFMC模型,方便公司对不同类型客户做对应的营销计划。原始数据情况数据截图:数字段解释:分析方法与过程第一步数据抽取1、以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据。对于后续新增的客户详细...
2019-11-27 17:46:57
3355
原创 LeetCode刷题笔记3——java-求最长子串(哈希表)
题目:给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例 1:输入: “abcabcbb”输出: 3解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。示例 2:输入: “bbbbb”输出: 1解释: 因为无重复字符的最长子串是 “b”,所以其长度为 1。示例 3:输入: “pwwkew”输出: 3解释: 因为无重复字符的最长子串是 “wk...
2019-09-28 23:06:18
309
原创 Leetcode刷题笔记1——java-根据和判断加数(哈希表)
Leetcode刷题笔记1作为计算机专业的学生,深感代码量的差距就是实力的差距,故此立个FLAG每天最少抽空刷一道算法题,写下笔记也是监督自己第一题:两数之和题目:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例:给定 nums ...
2019-09-26 10:31:41
247
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人