- 博客(166)
- 资源 (5)
- 收藏
- 关注
原创 推荐系统的矩阵分解
推荐系统中基于内容的协调过滤算法通过用户之间的相似性或者物品之间的相似性,通过相似性来为用户做决策和推荐;基于内容的协调过滤算法在实际生产环境中,User或Item的数据量非常大(百万级别),存储用户相似度矩阵或者物品相似度矩阵比较大,而User跟Item之间有反馈的数量又比较少,导致存在着数据稀疏和信息冗余大的缺陷,对稀疏数据的处理比较弱,而且头部效应比较明显,推荐更多都是偏向于热门的推荐,泛化能力比较差
2022-12-28 18:28:47
841
原创 2022 CCF BDCI 返乡发展人群预测 [0.9117+]
返乡发展人群预测:基于中国联通的大数据能力,通过使用对联通的信令数据、通话数据、互联网行为等数据进行建模,对个人是否会返乡工作进行判断A榜的结果为0.91171720。
2022-09-15 17:35:45
13064
15
原创 Kaggle比赛 - Kannada MNIST
title: Kaggle | Kannada MNISTdate: 2019-07-13 12:43:33categories: [Kaggle]0 题目背景比赛地址:Kannada MNIST这是一个MNIST扩展的比赛,识别的不再是阿拉伯数字,而是Kannada数字,分类目标还是0-9,每个分类各有6000的样本,测试样本为5000的随机样本1 数据分析1.1 加载数据%%...
2019-12-17 22:31:23
1019
原创 win10安装tensorflow-gpu环境
1 安装环境系统:Window10 64bit企业版显卡:GeForce GTX1070Python: 3.7Anaconda: Anaconda3-2019.03-Windows-x86_64CUDA: cuda_10.1.168_425.25_win10cuDNN: cudnn-10.1-windows10-x64-v7.6.1.342 下载软件Anaconda: Anac...
2019-07-12 00:07:02
676
原创 AI challenger 2018图片分类比赛—农作物病害检测
1 赛题简介对近5万张按“物种-病害-程度”分成61类的植物叶片照片进行分类比赛地址:AI challenger比赛—农作物病害检测2 框架我使用的是Keras,以TensorFlow为后端,手动实现了DenseNet用于图片分类由于Kaggle现在可以免费使用GPU,所以采用将数据上传至Kaggle的私人Dataset上,在其上创建Kernel进行模型训练(上传需要翻墙,有梯子最好)...
2018-12-16 15:21:13
16481
33
原创 LeetCode 98. Validate Binary Search Tree
题意给定一个二叉树,判断其是否是一个有效的二叉搜索树。一个二叉搜索树具有如下特征: (1)节点的左子树只包含小于当前节点的数。 (2)节点的右子树只包含大于当前节点的数。 (3)所有左子树和右子树自身必须也是二叉搜索树。解题思路对于二叉搜索树,其中序遍历得到的是有序的序列。所以求二叉搜索树的中序遍历,判断序列是否有序就行了。参考代码/** * Definition ...
2018-07-05 22:02:54
368
原创 LeetCode 100. Same Tree
题意给定两个二叉树,编写一个函数来检验它们是否相同。 如果两个树在结构上相同,并且节点具有相同的值,则认为它们是相同的。解题思路对树进行前序遍历,并为每个空子树补充一个特殊字符,使得每个非叶子节点都有左右子树。参考代码/** * Definition for a binary tree node. * public class TreeNode { * int ...
2018-07-05 21:20:47
360
原创 LeetCode 12. Integer to Roman
题意罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000例如, 罗马数字 2 写做 II ,即为两个并列的 1。12 写做 XII ,即为 X + II 。 27 写做 XXVII,...
2018-06-28 23:13:02
348
原创 LeetCode 20.Valid Parentheses
题意给定一个只包括 ‘(‘,’)’,’{‘,’}’,’[‘,’]’ 的字符串,判断字符串是否有效。有效字符串需满足: 左括号必须用相同类型的右括号闭合。 左括号必须以正确的顺序闭合。 注意空字符串可被认为是有效字符串。解题思路使用栈,不匹配入栈,匹配出栈,最后栈为空则字符串有效。参考代码class Solution { public int getType(S...
2018-06-28 23:08:30
349
原创 LeetCode 198.House Robber
题意你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存放金额的非负整数数组,计算你在不触动警报装置的情况下,能够偷窃到的最高金额。解题思路动态规划,状态转移方程为dp[i]=max(dp[i-2]+dp[i-3])+a[...
2018-06-28 23:01:46
322
原创 LeetCode 4. Median of Two Sorted Arrays
1 题意给定两个大小为 m 和 n 的有序数组 nums1 和 nums2 ,找出这两个有序数组的中位数2 解题思路在nums1上的数通过二分找到这个数在nums2上的位置,两个位置相加即为合并数组的位置,同样nums2上的数也可以这样确定下来 不过注意数组上可能有同样的数存在,为了避免出现谁出现在谁之前的混乱情况,约定nums2上如果有nums1上相同的数,那么在合并数组时,num...
2018-05-23 19:48:57
374
原创 HiveQL装载数据
1 装载数据HiveQL装载数据其实就是向表里加载数据,但是这个装载是一次性操作,因为Hive没有行级别的数据插入、数据更新和删除操作。我们对Hive中的表一般是一次加载大量的数据或者自己将数据文件写入到Hive表中所在的存储位置下。 我们以管理表manage_table为例,建表语句如下CREATE TABLE IF NOT EXISTS manage_table( id ST...
2018-05-20 11:00:53
1234
原创 HiveQL表的基本概念
1 管理表管理表其实就是我们最常用的表,最普通的表,创建表的SQL语句与MySQL一致CREATE TABLE IF NOT EXISTS manage_table( id STRING, name STRING)ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'STORED AS TEXTFILE;通常会使用IF NOT E...
2018-05-19 22:23:44
504
原创 HiveQL数据库
Hive中数据库的概念本质上仅仅是表的一个目录或者命名空间,使用数据库可以表明表命名冲突。 如果用户没有显式指定数据库,那么将会使用默认的数据库default。1 创建数据库创建一个数据库与SQL语言一样CREATE DATABASE test; 有时候为了避免数据库已经存在,而又创建一个同名数据库引发错误,我们可以使用下面的语句CREATE DATABASE IF...
2018-05-08 23:21:47
486
原创 Hive数据类型和文件格式
Hive 支持关系型数据库中的大多数基本数据类型,同样也支持关系型数据库中很少出现的3中集合数据类型。1 基本数据类型 数据类型 描述 TINYINT 1byte有符合整数 SMALINT 2byte有符合整数 INT 4byte有符合整数 BIGINT 8byte有符合整数 BOOLEAN 布尔类型,true或...
2018-05-07 21:22:19
452
原创 CentOS中Hive1.2安装
1 安装Hive安装Hive之前必须先安装Hadoop 1、CentOS安装Hadoop 2、CentOS中Hadoop单机伪分布式配置1.1 下载Hive这里提供清华大学镜像下载链接hive-1.2.2 将其通过Xftp工具上传到云主机上,执行下面的命令解压tar -zxvf apache-hive-1.2.2-bin.tar.gzmv apache-hive-1.2...
2018-05-06 15:53:14
960
原创 LeetCode 6.Z字形变换
题意将字符串 “PAYPALISHIRING” 以Z字形排列成给定的行数:P A H NA P L S I I GY I R之后从左往右,逐行读取字符:"PAHNAPLSIIGYIR"实现一个将字符串进行指定行数变换的函数:string convert(string s, int numRows);示例 1:输入:s = "PAYPALISH...
2018-04-24 23:29:56
485
原创 云服务器CentOS6.4安装TensorFlow
1 安装Anaconda从官网下载Anaconda3-4.2.0-Linux-x86_64.sh,通过xftp上传至根目录下 执行下面命令安装bash Anaconda3-4.2.0-Linux-x86_64.sh安装过程中一直回车,遇到Do you approve the license terms?[yes|no]时输入yes,Do you wish the installe...
2018-03-18 09:32:10
845
原创 云服务器CentOS6.4搭建Java Web开发环境
0 前言为搭建Java Web开发环境,我们另创建一个用户用于搭建 首先以root用户登录云服务器,执行下面的命令创建新用户dongjinbao,并初始化dongjinbao用户的秘密useradd -m dongjinbao -s /bin/bashpasswd dongjinbao为了避免权限问题,我们为dongjinbao用户增加管理员权限visudo在第98...
2018-03-17 16:59:56
398
原创 Maven添加引入外部jar包
有时候你或许会想在你的项目中加入你自己开发的jar包,或者引入一些Maven库中没有的jar包,例如连接Oracle JDBC的ojdbc6,由于权限问题,现在Maven库中已经无法加载这个jar包Maven添加引入外部jar包,个人觉得比较好的一种方式是将外部jar打入本地Maven仓库 首先先确保安装有Maven,在cmd中运行mvn -v,如果显示了Maven的安装目录,则说明Mave...
2018-03-02 23:43:44
2296
原创 Python定期删除文件夹下的过期文件
有时候会产生很多一次性文件以及文件夹,访问一两次就不会再使用了,现需要定期进行清理过期的文件,并且删除空文件夹import osimport sysimport timedef delDir(dir,t=120): #获取文件夹下所有文件和文件夹 files = os.listdir(dir) for file in files: fileP...
2018-02-11 00:22:55
3391
原创 LeetCode 3. Longest Substring Without Repeating Characters
题意找出字符串中的最长不含有重复字符的子串解题思路用另一个变量pre记录每个满足条件子串的开头下标,用一个变量i扫过整个字符串,将扫过地字符逐个加入原子串中,当变量i扫过的字符在原子串中出现过了,使得原子串不满足条件时,让pre跳到原字符处,使得新加入的字符依旧可以使得新子串满足条件,一直计算子串长度,当大于最长的时候,就更新值。参考代码//javapublic ...
2018-02-07 23:55:00
442
原创 神经网络简介
神经网络的主要工作就是输入数据,处理数据,然后给出一个结果作为输出,我们先介绍一下神经元,了解神经网络的组成1 神经元神经元是组成神经网络的最基本单位,它起初来源于人体,模仿人体的神经元,功能也与人体的神经元一致,得到信号的输入,经过数据处理,然后给出一个结果作为输出或者作为下一个神经元的输入。它的结构如下: 1)x1,x2,...,xnx_1,x_2,...,x_n表示信号的输
2018-01-14 18:53:16
1026
原创 Java类和对象
1 定义类类是某一批对象的抽象,可以理解为某种概念,对象被称为实例,是一个具体存在的实体 Java语言中定义类的语法[修饰符] class 类名{ //零或者多个构造器 //零或者多个成员变量 //零或者多个方法}修饰符可以是public、final、abstract,或者完全省略这三个修饰符,类名只要是一个合法的标识符就行,不过为了程序的可读性,通常Java类名是由一
2017-12-20 22:35:23
350
原创 CentOS中Hadoop单机伪分布式配置
5 Hadoop单机配置首先我们需要为我们的主机名增加IP映射,那么我们需要知道我们的主机名是什么,执行下面命令查看主机名vi /etc/sysconfig/network查看一下HOSTNAME的值,你可以修改这个值,也可以直接将这个值拷贝出来 执行下面命令,增加IP映射sudo vi /etc/hosts在最后一行增加一行,输入主机的ip,以及上面的HOSTN
2017-12-03 23:48:36
776
原创 CentOS安装Hadoop
1 创建hadoop用户首先以root用户登录远程服务器,执行下面命令创建新用户hadoop,并修改hadoop用户的密码useradd -m hadoop -s /bin/bashpasswd hadoop 为了避免出现权限问题,我们为hadoop用户增加管理员权限visudo找到第98行,就是root ALL=(ALL) ALL这行,可以先按ESC键,然后输入:98,可以直接跳到第98行
2017-12-03 12:43:50
894
原创 使用京东云免费云主机搭建CentOS
进入京东云官网,注册登录后,进入免费专区,点击个人免费套餐,找到云服务器,点击申请使用 进入主机申请页面后,选择你想搭建的主机,有CentOS,Ubuntu以及Windows Server这些官方镜像,这里我是搭建CentOS,所以选择了CentOS6.4 64位 然后点击免费试用,进入支付页面后支付0元,5秒钟将跳转到控制台 在控制台中,找到云主机,点击进去 就能看到我们的
2017-12-02 14:44:34
5530
原创 Win8使用VirtualBox安装CentOS 6.4教程
1 安装工具VirtualBox 5.1.30虚拟机【下载】 64位CentOs 6.4 【下载】2 安装VirtualBox下载好后一直默认安装即可 3 使用VirtualBox安装CentOS1、打开VirtualBox,点击“创建”按钮,创建一个虚拟机 2、命名虚拟机,选择操作系统和版本,这里是64位的 3、设置内存大小,方便虚拟机使用,一般推荐设置1G,如
2017-11-29 23:32:37
522
原创 LeetCode 191. Number of 1 Bits
1 题意求一个32位的无符号整数在二进制下有多少个12 解题思路两种办法,一种是迭代求出整数的二进制,但是如果无符号整数的值大于有符号的整数,那么将得到-1public class Solution { // you need to treat n as an unsigned value public int hammingWeight(int n) { int a
2017-11-28 23:47:31
337
原创 Map遍历的两种方式keySet()和entrySet()
Map集合中虽然提供了get()获取元素的方法,但是只能取出其对应的值,而不能全部取出,所以在Map集合中提供了两种遍历方式:keySet()和entrySet()。keySet()和entrySet()在Map元素数量小于10510^5时,查询速度区别不大,但是当大于10510^5时,entrySet()的速度明显快于keySet(),所以尽量使用entrySet()方式来进行Map集合遍历1 K
2017-11-09 22:14:55
3881
原创 LeetCode 69. Sqrt(x)
题意求x的平方根解题思路调用Math.sqrt()参考代码// javaclass Solution { public int mySqrt(int x) { return (int)Math.sqrt(x); }}
2017-09-17 22:07:32
439
原创 LeetCode 204. Count Primes
题意求小于n的素数的个数解题思路素数的筛选法参考代码//javaclass Solution { public int countPrimes(int n) { if (n<2) return 0; boolean[] prime=new boolean[n+1]; prime[2]=true; for (int i=3;i<
2017-09-17 22:04:27
398
原创 LeetCode 121. Best Time to Buy and Sell Stock
题意给你一个股票的数组,你选择某天买入,某天卖出,问最大可以赚多少,注意买入时间必须小于卖出时间。你也可以选择既不买入,也不卖出。解题思路从头到尾计算,遇到小的数就假设买入,每一天都假设为卖出,计算最大利润。参考代码//javaclass Solution { public int maxProfit(int[] prices) { int ans=0; i
2017-09-12 22:56:37
480
原创 LeetCode 657. Judge Route Circle
题意机器人开始在(0,0)点,有一段指令,包括上下左右,判断它通过一段指令后是否回到了原点。解题思路模拟即可参考代码//javaclass Solution { public boolean judgeCircle(String moves) { int x=0,y=0; for (int i=0;i<moves.length();i++){
2017-09-12 22:44:41
862
原创 基于Spring boot的Spring data jpa连接MySQL数据库
1 创建项目以创建一个员工信息管理项目为例,创建一个Maven工程(需要提前配置好Maven环境)。 打开File->New->Other->Maven->Maven Project Next Next Finish,一个Maven工程就建好了。2 配置pom.xml配置pom.xml,pom.xml主要用来描述项目:配置文件、开发者需要遵循的规则、缺陷管理系统、组织和licen
2017-08-25 22:43:48
22318
2
原创 LeetCode 202. Happy Number
题意幸福的数字是由以下过程定义的数字:从任何正整数开始,将数字替换为数字的平方和,并重复该过程,直到数字等于1(将保留在哪里),或者循环 一个不包括在内的循环的循环中,这个过程以1结尾的数字是快乐的数字。例如19是幸运数字 12+92=8282+22=6862+82=10012+02+02=11^2 + 9^2 = 82 \\8^2 + 2^2 = 68 \\6^2 + 8^2 = 100
2017-08-22 22:47:01
688
原创 Keras实现小数量集图片分类——6类别Birds数据集分类
注:本文参考Keras官方文档以及素质云博客《keras系列︱图像多分类训练与利用bottleneck features进行微调(三)》1 开发环境开发平台:win8 开发框架:TensorFlow+Keras2 数据集 数据集来源:birds Birds数据库包含六个不同类别鸟类的600张图像(每个100个样本)。图像是可变分辨率的彩色JPEG。6个类别分别是:Egret、Mandarin
2017-08-20 23:04:46
12565
7
2012.李航.统计学习方法.
2017-04-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人