- 博客(16)
- 收藏
- 关注
原创 线上成绩17的垃圾代码 ,让你以最快的速度反向第一
这份代码的作用是找图中所有长度3-7的环并按照字典序输出到文件中。package huawei;import java.io.*;import java.util.*;import java.util.concurrent.*;import java.util.stream.IntStream;@SuppressWarnings("unchecked")final clas...
2020-04-27 14:51:52
335
原创 利用Spring boot、neo4j、echarts可视化雪中悍刀行
效果如下:搜索李淳罡:添加节点和关系,在这里添加李淳罡-喜欢-绿袍,如下多出李淳罡和绿袍的关系和绿袍的节点在neo4j中,存储如下图SDN似乎无法任意存储关系,故在这里使用的neo4j-java-driver完成的以上功能:[neo4jConfig.java]加载驱动和提供sessionpackage com.sandalen.water.co...
2019-12-14 16:58:11
5961
26
原创 Spring boot集成neo4j和简单使用
关于spring boot集成neo4j和简单的使用github:https://github.com/whl6785968/Neo4jDemo[pom.xml]这里我使用neo4为5.2.2.RELEASE,neo4j sdn默认使用bolt连接方式,如果想使用http或embedded方式,需要添加依赖<?xml version="1.0" encoding="UTF...
2019-12-11 16:36:37
1304
1
原创 java实现孤立森林
理论非常简单,不作赘述。[结果]score > 0.6和10颗树情况下,score > 0.51和10颗树情况下[数据]链接:https://pan.baidu.com/s/1KW-g-mg00UzhYvtXe1vM7w提取码:q6t6复制这段内容后打开百度网盘手机App,操作更方便哦[代码]package IsoForest;impo...
2019-12-05 14:44:06
2214
11
原创 java实现支持向量机
用到国家地表水 水质自动监测实时数据发布系统爬取的数据,其中Ⅰ- Ⅲ数据作为正常数据,赋予1标签,Ⅳ-Ⅴ数据作为异常数据,赋予-1标签,经测试,使用线性核函树和高斯核函最好的准确率均为95%,但是因为该实现没有使用KKT条件作为停机条件,不能保证每个乘子满足约束和KKT条件,故具有准确率具有一定的随机性和波动,在此条件下,高斯核函数相比于线性核函数波动稍微小一点。在本实现中,矩阵相乘什么的都用...
2019-12-03 17:01:05
1330
1
原创 双数组tire树的笔记
参考https://github.com/komiya-atsushi/darts-java的源代码和http://www.hankcs.com/program/java/%E5%8F%8C%E6%95%B0%E7%BB%84trie%E6%A0%91doublearraytriejava%E5%AE%9E%E7%8E%B0.html对双数组trie树的解读核心!!!!:寻找转移至当前状态的状...
2019-11-07 21:39:48
248
原创 tensorflow实现skip gram
本文参考tensorflow自然语言处理书上的skip gram加以实现skip gram:word_list -> embedding -> softmax(embedding) -> optimize loss -> select the best embedding & weight & bias主要思路:1.给出一批数据,求出在给定win...
2019-11-02 15:52:49
561
原创 通过tensorflow实现神经网络
TensorFlow自然语言处理的例子:利用tensorflow实现神经网络进行手写数字识别。import structimport gzipimport osfrom six.moves.urllib.request import urlretrieveimport numpy as npimport tensorflow as tfimport matplotlib.pyp...
2019-11-02 09:39:44
294
原创 何晗自然语言处理入门学习(一)
分词的简单算法1.完全切分即在字典中查找到某个词 ,就切分2.正向切分从左到右开始匹配最大长度词,例如北京真好玩,i = 0 时:北、北京 (当前最大词)、北京真、北京真好、北京真好玩 i = i + length(longestWord) = 0 + 2 = 2i = 2时:真、真好、真好玩(最大词)i = 53.逆向切分从右到左开始匹配最大长度词,例如北京真好...
2019-10-30 10:23:29
4683
原创 通过parsing-chart实现句法分析
思路来源于宗成庆老师PPT第9章线图分析法。在这里仅把算法描述放到这里,宗成庆老师的PPT上的例子对于实现该算法非常有帮助,由于例子较长,在这里就不放了,若有需要,自行查看。PPT链接:http://www.nlpr.ia.ac.cn/cip/ZongReportandLecture/ReportandLectureIndex.htm该算法在第九章第一部分该算法需要三个容器:1.age...
2019-10-27 11:38:04
1118
原创 决策树树桩实现
西瓜书中决策树树桩的实现,即只分类一次,是弱分类器,效果极差。主要目的是作为adaboost等集成学习方法的基分类器,这里不给出adaboost代码,因为好久以前写的,当时有问题也懒得改了。。。。。。scala实现import org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.rdd.RDDimp...
2019-10-25 10:52:27
1654
原创 scala实现高斯混合聚类
scala实现的高斯混合聚类,效果还不错,原理参考西瓜书p206-210import breeze.linalg.{DenseMatrix, DenseVector, det, inv}import org.apache.spark.{SparkConf, SparkContext}import scala.collection.mutable.ArrayBufferobject...
2019-10-25 10:42:59
416
原创 一些爬虫的实现
1.淘宝爬虫(使用selenium、pyquery)模拟登录使用的微博的账号密码,请自行修改from selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui impor...
2019-10-25 10:29:25
481
原创 基于CRF的命名实体识别思路与实现
本文参考了https://github.com/liuhuanyong的CRF实现分词的思路CRF的实现思路类似于HMM,需要求解几个概率(词与词的转移概率,状态与状态的转移概率、发射概率、初始词概率),然后用verbiter方法求解,verbiter方法的原理简单来说就是给出当前状态,求解最有可能转移至该状态的上一个状态,这个原理和思路也是实现CRF的核心。首先给出宗成庆老师PPT的一个...
2019-10-25 10:00:15
1067
1
原创 python数据分析的学习总结(一)
本篇文章是作者对常国珍著的python数据科学的学习的干货总结。数据链接:链接:https://pan.baidu.com/s/1Qy9cc5-vTHkwQVDEd7x_dg 提取码:m0p9 本篇文章主要有以下四个部分:目录1.数理统计技术概论2.数据挖掘技术与方法3.预测类模型4.描述性分析 1.数理统计技术概论1.1 描述性分析描述性分析就是...
2018-12-19 21:42:20
5269
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人