- 博客(6)
- 资源 (3)
- 收藏
- 关注
原创 EasyExcel linux环境NullPointerException
EasyExcel文件导出, 在linux环境下报NullPointerException异常。
2022-11-22 20:12:03
569
原创 腾讯视频原始链接抓取
1.获取视频名称https://v.qq.com/x/page/y09509jtn4l.html其中y09509jtn4l为视频名称2.获取视频vkeyvids内容填写视频名称http://vv.video.qq.com/getinfo?vids=y09509jtn4l&platform=101001&charge=0&otype=json&defn=shd提取fvkey3.生成视频链接fn内容视频名称,vkey内容填写提取fvkeyhttps://ug
2021-02-04 15:26:17
8204
3
原创 京东商城手机频道商品价格信息的抓取
在做页面解析时,最大难度在于对动态数据的抓取,特别是由ajax加载的内容。目前对这方面的处理还没很好的解决方案,,虽然有htmlunit之类的模拟浏览器运行工具包,但是其效率以及准确性远远不能满足实际生产的需要。通常情况,我们需要对特定的场景进行特殊性分析、比如,一个商品详细页的加载过程,可能存在向服务端多个http请求。所以我们对商城商品内容的解析过程中,需要对价格等动态加载的内容进一步的获取。
2014-11-19 16:52:34
3355
原创 ICTCLAS分词器与Lucene4.9的结合
一直以来喜欢搜索方向,虽然未能如愿以偿,但是依旧保持着那份狂热。还记得那个暑假、那间实验室、那一群人,一切的一切早已随风而去。踏上新的征程,我早已不是曾经的自己。面对三分技术七分业务的环境,我选择了沉淀。社会就是个大机器,我们只是个小螺丝,容不下半点扭扭捏捏。人终究归属于一个时代的产物,也终将被时代所抛弃。言归正题,在lucene加入自定义的分词器,需要继承Analyzer类,实现createCo
2014-08-14 11:44:56
3159
原创 商品分类筛选条件建模数据表的设计
近端时间,由于商城项目的需求,学习探索了一下商品分类筛选条件。在学习过程中,一贯喜欢参考前人的东西,希望能从中得到一些独特的设计思路。京东、淘宝等大牛对这方面做得非常好,不管是用户体验还是技术方面。我们先看看京东的效果图个人分析:京东的商品筛选中,每个子类型都对于一个具体的模型,而模型下又分为属性(如:功能)以及属性值集经过两天的整理,总算成型。现在拿出来跟大家分享一下,有什么不足之处
2014-08-01 14:05:22
5471
原创 简单HQL语句的面向对象化
在一直使用的HQL查询语句,较多仅是对参数的拼凑。在java面向对象化开发语言,能否将其对象化,以此减少反复性的工作。由于HQL查询语句结构上比较清晰,所以实现上复杂度不高。select .. from table where ... groupby row...having...order by... 逐一将查询关键字封装成类,这是小码的开篇博文,技术上有所局限。不足之处,请各位多多指点,不胜感激。
2014-07-03 10:17:47
53251
1
基于lucene3.0的ICTCLAS实现
2014-04-29
solr 4.7.2源码
2014-04-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人