- 博客(23)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注

原创 猫眼加密其实也就这么一回事儿。利用tensorflow建立一个woff模型,解决猫眼加密。
利用深度学习为猫眼woff加密构建模型1. 回顾之前关于猫眼爬虫,我写过一篇通过图像识别的方式解决加密内容识别的文章。在并且在程序中对所获得的woff数据以及解析数据进行了保存,如图:我们woff文件和解析数据,正好可以制作成深度学习的训练集。2. 深度学习这里使用tensorflow进行模型训练。关于tensorflow的安装,大家可以参照使用 pip 安装 TensorFlow。当环境搞定后就该进入正题了。下面的代码也是一遍带过的,没有做调整什么的基本是想到啥就敲啥。总体也就这思路
2020-08-19 18:03:04
720

原创 python关于猫眼爬虫数据加密问题解决(2020)
猫眼数据加密问题研究(一)图像识别1. 介绍最近同学在完成一个课题时,在对猫眼评分票房进行数据爬取时,遇到了问题,与我探讨了关于猫眼数据加密问题。在对网页源代码进行阅读后发现,与58同城、携程等加密方式一致,都是通过woff文件,在前端进行画图渲染,得到图形。前端界面并不知其数值。所以在对问题进行分析后,提出了基于图像识别以及机器学习的方式,构建相关模型,进行数据识别分类。2. 分析首先找到加密数据所在位置。如图:接下来找到woff文件地址并下载woff文件:通过FontCreator对w
2020-07-24 11:00:56
5535

原创 k8s双节点集群搭建详细教程
title: k8s之集群搭建category: Dockerdate: 2019-4-26typora-root-url: \source_posts\imgtypora-copy-images-to: \source_posts\imgK8S v1.13.0 集群搭建环境两台centos主机:Master:192.168.11.112 主机名:k8s-maste...
2020-03-18 12:37:50
7773
2

原创 快速掌握python面试基础,让你面试回答有思路
面试知识点整理python基础知识简述变量名的规范1.变量由字母、数字、下划线任意组成2.不能以数字开头3.不能使用python关键字4.变量要具有可描述性5.变量不能使用中文6.驼峰命名和下划线python编程语言PEP8规范分号:不要在行尾加分号, 也不要用分号将两条命令放在同一行。行长度:1.每行不超过80个字符(长的导入模块语句和注释里的URL除外) 2...
2020-03-18 12:17:54
5005
原创 golang 配置中心
MangoConfig配置管理包github地址:https://github.com/gly-hub/mangoconfigmangoconfig配置服务用于服务器配置修改,在服务器启动或部署中可能存在配置信息更新情况,某些情况需要重启服务从而重新初始化某些服务,例如mysql初始化、redis初始化等。mangoconfig包提供了修改内存配置及重启初始化方法等功能。能够满足小部分需求,相较于现有的配置中心,功能更加简单。使用技术golangrpcetcd使用方法server端
2022-05-23 15:59:48
1249
原创 golang 文件上传聚合器
mangoupload文件上传集成地址:https://github.com/gly-hub/mangoupload集成local 文件夹ali OOShuawei OBSqiniu QBoxtencent COS使用方法1.初始化上传器global.Uploader = mango_upload.NewUploader()global.Uploader.SetKeyModel(true)global.Uploader.SetUploadLimit(config.Conf.Fi
2022-05-23 15:46:49
282
原创 通过经纬度坐标进行定位服务(省市)【python实现】
今天的课题则是在获取经纬坐标的情况下,如何进行省市定位问题。1. 坐标系首先需要先对坐标系进行一个交单的介绍。现在的坐标系包含了:火星坐标系地球坐标系百度坐标系通过同一个经纬度(116.404, 39.915)在百度以及高德进行定位,可以发现他们明显存在偏移,则说明他们使用的坐标系并不一样。地球坐标(WGS84):这是国际公认的标准坐标系。火星坐标(GCJ-02):这是一种国家保密插件,将COM口读出来的真实的坐标信号,加密转换成国家要求的保密的坐标。百度坐标(DB-09):
2021-01-14 20:00:59
4499
4
原创 关于裁判文书网的一些建议
关于裁判文书网的一些建议有部分小伙伴私聊我一些文书网的东西。原因应该是我关于文书网批量下载的博文,写得太过简单。但我认为实现思路其实就这么简单,登录爬取,就没其他操作可言了。今天整理一下大概的问题。数据爬取需谨慎,学习就学习,知道怎么行就好。1. 为什么我的selenium在跳转页面后就是空白?这个问题吧是chrome driver被检测了,这个很常见。解决方式:下载可以将exe文件转换为16进制文件的软件。通过搜索 $cmd_ 把搜到的改为 $xxx_ 就行了。2. 下载按钮和批量框,点击不
2021-01-07 20:55:01
1448
原创 毕设系列三之利用tensorflow做深度学习情感分析
利用tensorflow做深度学习情感分析深度学习作为一项学习数据的多层特征或表征的强大机器学习技术。此项目中,将使用tensorflow深度学习平台,通过相关模型的构建,以及数据的处理,完成微博评论情感分析,已到达类似百度AI情感分析功能,可以通过用户输入的数据进行分析,得到情感为积极性还是消极性。1. 结构html前端界面图像识别模型flask后端接口 API2. 前端HTML设计前端仿的百度ai的情感分析界面。只是做一个简单的交互页面,使用纯html+js就行了。当然,作为毕设,
2021-01-07 20:11:18
2482
6
原创 毕设系列二之垃圾分类小程序
垃圾分类小程序1. 结构微信小程序图像识别模型API2. 微信小程序设计对于小程序的界面设计,我设计的比较简单。如图:当然。界面完全可以依照自己的想法进行设计。对ui设计我考虑的不多。主要还是在模型上重视一点。代码:<!--index.wxml--><view class="container"> <image class='background' src="http://file05.16sucai.com/2015/0714/69b492e5
2020-11-05 11:13:55
9976
21
原创 毕设系列一之tensorflow实现文本切词功能
tensorflow实现文本切词功能1. 文本切词?首先,对于切词这一个词吧,接触了nlp的就一目了然了,中文是无法像英文一样通过空格去判别每一个词的界限的,所以需要计算机去识别词与词的边界。如:this is a text在英语中直接可按空格切分成词,而中文:这是一个文本需要切分成这是、一个、文本。然后句子中并没有明显的区分符号,所以让计算机学习这些词,就成了这个项目的内容。2. 数据?既然是深度学习方面的学习项目,就得有数据才行,一个模型的好坏,一定程度上也取决于数据的好坏。数据对
2020-10-14 10:56:46
800
1
原创 利用selenium实现中国裁判文书网自动登录批量下载功能
利用selenium实现中国裁判文书网自动登录批量下载功能最近关于一个法律机器人项目研究中,需要收集一些法律文件以及一些法律问答,需要大量的数据。然后就把目标定在了文书网,人为下载有点浪费人力,并且数量实在太大了。所以就自动化实现一下。直接上代码了,挺简单的。# -*- coding:utf-8 -*-from selenium import webdriverfrom selenium.webdriver.support.select import Selectfrom selenium.we
2020-09-08 11:26:26
5881
7
原创 想敲代码又怕女朋友找?那就让她去玩桌面图标贪吃蛇,再也不用担心打扰自己敲代码了
golang实现桌面图标贪吃蛇最近在逛博客的时候看见了一个有趣的项目,使用桌面图标进行贪吃蛇游戏。采用的代码是vb,但我实在不会vb,就找了C++中关于桌面图标获取句柄的文章进行查看(第一次接触这个,实属菜鸟)。效果还行 一步步获取到了想要的东西,然后偶然性看见了一位python大佬的博客,这就很OK了,看python代码就没啥问题了,然后就复制复制复制,看了一遍他的代码,接着就是来一个golang版的了。在这里附上这位python版大佬的文章地址:用Windows10桌面图标玩python贪吃蛇程序
2020-08-07 11:22:40
1913
原创 golang实现代理池批量获取及验证
golang实现代理池获取及验证 在做爬虫时,ip被检测限制,应该是一个比较简单的后端访问异常限制的操作。对于爬虫来说,就不得不增加一个有效的IP代理池。网上许多免费的IP代理,连接性往往有待考证,需要通过验证代理点的可用性。所以一个批量检测生成代理ip的方式,可以让你更快获取有效的列表。一、通过golang实现一个IP代理爬虫这里的爬虫网址选用的是:西拉免费代理IP。通过golang中的http请求目标接口,并对响应值进行页面解析。获取对应的td标签数据。下面是golang实现代码:pac
2020-08-05 13:33:41
2079
原创 golang实现九大排序算法
通过golang实现排序算法中九个基础算法。package sortalgorithm/****************************************** 交换排序 ** 包含:冒泡排序、快速排序 ** 计数排序 **========================================*//*********
2020-07-27 17:44:45
4487
原创 golang获取excel中的指定列数据
获取golang中指定列数据func ValueLoc(excel_path, sheet_name string, cols []string) [][]string{ xlsx, err := excelize.OpenFile(excel_path) if err != nil { os.Exit(1) return dataframe, err } rows := xlsx.GetRows(sheet_name) colIndex := make([]int, len(cols
2020-07-27 14:13:10
7711
1
原创 使用golang对excel进行数据读取
golang对excel进行数据读取在使用golang对excel进行表格数据读取时,发现已有的方式读取比较麻烦,代码量多。相比python中的pandas比较麻烦,所以对excel数据读取进行了一个简单的封装1. 导包执行go get github.com/gly-hub/excel_utils进入文件目录执行go mod init 文件目录名2.数据操作直接上代码package mainimport ( "fmt" "github.com/gly-hub/excel_ut
2020-07-07 17:00:09
9143
原创 centos中安装python3
centos安装python3.7一、安装依赖包yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc makeyum install libffi-devel -y二、下载python3.7包wget https://www.pyt...
2020-03-26 09:36:45
4385
1
原创 docker应用栈搭建
前言本文参考《Docker容器和容器云》的2.3.2章节应用栈搭建过程,对原书中出现的问题,以及镜像不断的更新导致的错误,做了修改,特此说明;Docker APP Stack:简化的Docker集群、快速、准确、自动化部署集群;实验环境宿主机:Ubuntu-14.04_X64Docker:1.12.6前期准备我们将搭建一个包含6个节点的Docker应用栈,其中包括一个负载...
2020-03-26 09:32:52
4905
转载 git基础及常用命令
专业名词译名序号英文名译名1Workspace工作区2Index / Stage暂存区3Repository仓库区(本地仓库)4Remote远程仓库git名词解释序号名词解释1克隆(clone)从远程仓库URL加载创建一个与远程仓库一样的本地仓库2提交(commit)将暂存文件上传到本地仓库...
2020-03-26 09:28:54
4122
原创 python中的list
由于面试在list这里吃了亏,所以倒回去复习了一下。 挺基础的,但还是入坑了。python列表函数序号函数作用1cmp(list1,list2)比较两个列表的元素2len(list)列表元素个数3max(list)返回列表元素最大值4min(list)返回列表元素最小值5list(seq)将元组转换成列表python列表...
2020-03-20 11:01:43
4380
原创 分享面试笔试题
一个基础面试题吧,感觉不太难,但在list那里栽了跟头,三个填空仅仅对了一个。至于下面的编程题,也是当时想到什么写什么的,所以没有去管是否存在简单的方法。填空关于list删除a = [1,2,3,4]for i in a: del a[0]print(a)>>>[3,4]a = [1,2,3,4]for i in a: a.remove(i)...
2020-03-20 10:58:13
4376
一个基于自然语言处理构建的搜索引擎
2020-07-30
求解!怎样通过点坐标集,进行分类模型构建
2020-08-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人