- 博客(91)
- 收藏
- 关注

原创 计算机基础
文章目录数据结构排序算法Java基础操作系统计网数据结构排序算法复杂度、稳定性外部排序在内存中进行的排序称为内部排序,而在许多实际应用中,经常需要对大文件进行排序,因为文件中的记录很多,信息量庞大,无法将整个文件拷贝进内存进行排序。因此,需要将带排序的记录存储在外存上,排序时再把数据一部分一部分的调入内存进行排序,在排序中需要多次进行内外存的交互,对外存文件中的记录进行排序后的结果仍然被放到原有文件中。这种排序方法就称外部排序。贪心算法和动态规划的区别Java基础ArrayList和L
2021-04-17 21:43:52
22767
23

原创 MySQL/Hive
牛客每个人最近的登录日期(二)统计一下牛客每个用户最近登录是哪一天,用的是什么设备两个join,连接三个表#1.先根据用户分组,查出每个用户登录的最新日期(一)select user_id,max(date) from logingroup by login.user_id;#2. 然后查出所有用户的名字,所有的登录设备,所有的登录日期(二)select user.name as u_n,client.name as c_n,login.datefrom loginjoin use
2021-04-09 14:16:19
979

原创 大数据相关
文章目录Hadoop介绍HDFS应用场景HDFS架构HDFS文件副本机制HDFS文件读写过程FsImage 和 Edits 详解MapReduce介绍MR编程实现Hive数据库与数据仓库的区别(OLTP与OLAP)Hive基本概念数据库表操作1. **创建表的语法**2. 内部表的操作Hadoop介绍三大组件HDFS: 解决分布式存储问题MR:解决分布式计算问题Yarn:负责整个集群资源的管理和调度HDFS应用场景适合的:存储非常大的文件不适合:大量小文件。(文件的元数据保存在N
2021-04-09 14:00:54
267

原创 力扣题分类
文章预览一、 数组第一个只出现一次的字符顺时针打印矩阵奇前偶后合并排序的数组两数之和三数之和两数相加无重复字符的最长子串(滑动窗口)最长回文子串下一个排列旋转数组旋转数组的最小数字搜索旋转排序数组(二分查找)在排序数组中查找元素的第一个和最后一个位置(二分)在排序数组中查找数字出现的次数(二分)**组合总和****全排列**最长公共子串~~字母异位词分组~~最大子序和(连续子数组的最大和)~~跳跃游戏~~合并区间爬楼梯编辑距离~~颜色分类~~子集买卖股票的最佳时机只出现一次的数字乘积最大子数组多数元素(摩尔
2021-04-08 22:27:04
715
原创 【框架】——Spring、SpringMVC、Mybatis
spring优势及开发步骤spring 的优势方便解耦,简化开发通过Spring提供的IoC容器,可以将对象间的依赖关系交由Spring进行控制,避免硬编码所造成的过度耦合。用户也不必再为单例模式类、属性文件解析等这些很底层的需求编写代码,可以更专注于上层的应用。AOP编程的支持通过Spring的AOP功能,方便进行面向切面编程,许多不容易用传统OOP实现的功能可以通过AOP轻松实现。声明式事务的支持可以将我们从单调烦闷的事务管理代码中解脱出来,通过声明式方式灵活的进行事务管理,提高开发效
2021-09-01 18:18:09
562
原创 【java】——多线程
线程是独立的执行路径在程序运行时,即使没有自己创建线程,后天也会有多个线程,如主线程,gc线程main()称之为主线程,为系统的入口,用于执行整个程序在一个进程中,如果开辟了多个线程,线程的运行有调度器安排调度,调度器是与操作系统紧密相关的,先后顺序是不能人为干预的。对同一份资源操作时,会存在资源抢夺的问题,需要加入并发控制。线程会带来额外开销,如cpu调度时间,并发控制开销。每个线程在自己的工作内存交互,内存控制不当会造成数据不一致线程的创建三种创建方式:Thread cla..
2021-05-07 16:14:57
265
2
原创 【Java】——集合
集合的理解和好处数组的不足:长度开始时必须制定,而且一旦制定,不能更改保存的必须为同一类型的元素使用数组进行增加 / 删除元素时 比较麻烦集合的好处:可以动态保存任意多个对象,使用比较方便提供了一系列方便的操作对象的方法:add、remove、get等使用集合添加、删除元素 简洁了Collection接口和常用方法Collection接口实现类的特点:public interface Collection<E> extends Iterable<.
2021-04-29 16:23:11
563
1
原创 【数据结构】——位图、布隆过滤器
一、位图1.位图原理4个字节本来只能存储一个int,而现在使用位图我们就存了(映射)32个数字,也就是存储的倍数为原来的32倍。2.位图应用给定100亿个整数,设计算法找到只出现一次的整数将100亿个数分拆成1000份文件,再将每份文件里使用位图,并用两位bit表示数字出现的次数,00存出现0次的数,01存放出现1次的数,10存放出现多次的数,11舍弃,再将1000份中出现一次的数全部合并到一个文件里存放即可。给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集
2021-04-21 21:22:07
306
原创 简历项目-
文章目录项目一:电商广告推荐系统一、数据集项目实现分析二、根据用户行为数据创建ALS模型并召回商品用户行为数据拆分(pv,fav,cart,buy)预处理behavior_log数据集根据用户对类目偏好打分训练ALS模型根据用户对品牌偏好打分训练ALS模型三. CTR预估数据准备分析并预处理raw_sample数据集分析并预处理ad_feature数据集(空值NULL->-1)分析并预处理user_profile数据集(null)——随机森林——困难四. LR实现CTR预估(12个特征)——改进五.
2021-04-14 20:44:55
1097
2
原创 数据库原理——主从复制
文章目录1. 主从复制延迟分析怎么解决延迟问题2. 主从复制延迟产生的原因3. 如何解决复制延迟问题4. 并行复制策略1. 主从复制箭头顺序依次从左到右注:slave端也有 binlog延迟分析读写:Data changes: 顺序的写操作,比较快,不太会发生延迟。一个大文件和多个小文件相比,大文件读取更快(顺序读写),因为小文件需要频繁多次寻址(随机读写)。kafka消息队列,数据放在磁盘上,只支持append操作(append的大多数是顺序读写),包括大数据分布式的也是,不支
2021-04-13 22:53:22
320
原创 MySQL——开窗函数
开窗函数格式:函数名(列) over (选项)SQL标准允许将所有聚合函数用作开窗函数,使用over关键字来区分这两种用法。PARTITION BY 子句与group by子句不同,partition by子句创建的分区是独立于结果集的,partition by创建的分区只是供进行聚合运算的。--显示每一个人员的信息以及所属城市的人员数select fname,fcity,fage,fsalary,count(*) over(partition by fcity) 所在城市人数 fro
2021-04-07 21:36:29
302
原创 MySQL——日期函数,时间函数
MySQL获得当前日期时间 函数获得当前日期+时间(date+time) 函数:now()获得当前时间戳函数:current_timestamp,current_timestamp()MySQL日期转换函数、时间转换函数MySQL Date/Time to Str(日期/时间转换为字符串)函数:date_format(date,format), time_format(time,format)MySQL 日期、时间转换函数:date_format(date,format), time_
2021-04-07 17:33:57
153
原创 数据库原理——事务、视图、存储过程
一、事务概念:事务指的是满足ACID特性的一组操作,可以通过commit提交一个事务,也使用rollback进行回滚。一个或一组语句组成一个执行单元,这个执行单元要么全部执行,要么全部不执行。事务的ACID属性:原子性(Atomicity): 原子性是指事务是一个不可分割的工作单位,事务中的操作要么发生,要么都不发生。一致性(Consistency):事务必须使数据库从一个一致性状态变换到另一个一致性状态。隔离性(Isolation):事务的隔离性是指一个事务的执行不能被其他事务干扰,即一个事务
2021-04-05 17:52:52
363
原创 非监督学习
想比于监督学习,非监督学习的输入数据没有标签信息,需要通过算法模型来挖掘数据内在的结构和模式。非监督学习主要包含两大类学习方法:数据聚类和特征变量关联。其中,聚类算法往往是通过多次迭代来找到数据的最优分割,而特征变量关联则是利用各种相关性分析来找到变量之间的关系。1 K均值聚类支持向量机、逻辑回归、决策树等经典的机器学习算法主要用于分类问题,即根据一些已给定类别的样本,训练某种分类器,使得它能够对类别未知的样本进行分类。与分类问题不同,聚类是在实现并不知道任何样本类别标签的情况下,通过数据之间的额内在
2020-10-21 10:27:37
1387
原创 降维
常见的降维方法有主成分分析、线性判别分析、等距映射、局部线性嵌入、拉普拉斯特征映射、局部保留投影。1 PCA最大方差理论PCA属于一种线性、非监督、全局的降维算法问题:如何定义主成分?从这种定义出发,如何设计目标函数使得降维达到提取主成分的目的?针对这个目标函数,如何对PCA问题进行求解?PCA旨在找到数据中的主成分,并利用这些主成分表征原始数据,从而达到降维的目的。在信号处理领域,认为信号具有较大方差,噪声具有较小方差,信号与噪声之比称为信噪比。信噪比越大意味着数据的质量越好,反之,信噪比越小意
2020-10-19 20:11:37
406
原创 经典算法
1 支持向量机知识点:SVM模型推导、核函数、SMO算法问题:在空间上线性可分的两类点,分别向SVM分类的超平面做投影,这些点在超平面上的投影仍然是线性可分的吗?(1)SVM直观推导:对于任意线性可分的两组点,它们在SVM分类的超平面上的投影都是线性不可分的。由于SVM的分类超平面仅由支持向量决定,可以考虑只含支持向量SVM模型场景。使用反证法举例。证明还不严谨,即假设了只有支持向量的情况,会不会在超平面的变换过程中支持向量发生改变,原先的非支持向量和支持向量发生了转化。要会证明SVM的分类结
2020-10-18 16:54:37
230
原创 模型评估
1 评估指标的局限性知识点:准确率(Accuracy),精确率(Precision),召回率(Recall),均方根误差(RMSE)问题:准确率的局限性当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以,当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素。为了解决这个问题,可以使用更有效的平均准确率(每个类别下的样本准确率的算术平均)作为模型评估的指标。问题:精确率与召回率的权衡精确率:预测为正样本的数据中,真实正样本的比例召回率:真实正
2020-10-15 21:11:58
401
原创 特征工程
1.特征工程特征归一化问:为什么需要对数值类型的特征做归一化?分析解答:为了消除数据特征之间的量纲影响,对特征进行归一化处理,使得不同指标之间具有可比性。常用方法:(1)线性函数归一化(Min-Max Scaling)对原始数据进行线性变换,使结果映射到【0,1】范围,实现对原始数据的等比缩放。(2)零均值归一化(Z-Score Normalization)将原始数据映射到均值为0、标准差为1的分布上。举例梯度下降实例说明归一化的重要性,若两个特征的取值范围不一样,则在学习速率相同的情况
2020-10-14 21:20:17
156
原创 Java Web_基础加强
Junit单元测试反射注解Junit单元测试测试分类:黑盒测试:不需要写代码,给输入值,看程序是否能够输出期望的值。白盒测试:需要写代码的。关注程序具体的执行流程。Junit属于白盒测试...
2020-03-29 16:11:28
154
原创 Stream流、方法引用
两种获取Stream流的方法package com.itheima.demo02.Stream;import java.util.*;import java.util.stream.Stream;/* java.util.stream.Stream<T>是Java 8新加入的最常用的流接口。(这并不是一个函数式接口。) 获取一个流非常简单,有以下几种常用的方...
2020-03-10 17:57:34
196
原创 函数式接口
函数式接口的概念&定义package com.itheima.demo1.FunctionalInterface;/* 函数式接口:有且只有一个抽象方法的接口,称之为函数式接口 当然接口中可以包含其他的方法(默认,静态,私有) @FunctionalInterface注解 作用:可以检测接口是否是一个函数式接口 是:编译成功 ...
2020-03-08 19:03:23
133
原创 File类、递归
File类File类的静态成员变量package com.itheima.demo01.File;import java.io.File;/* java.io.File类 文件和目录路径名的抽象表示形式。 java把电脑中的文件和文件夹(目录)封装为了一个File类,我们可以使用File类对文件和文件夹进行操作 我们可以使用File类的方法 ...
2020-03-03 21:29:26
126
原创 异常、线程
异常分类package com.itheima.demo01.Exception;import java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Date;/* java.lang.Throwable:类是Java语言中所有错误或异常的超类。 Exceptio...
2020-02-29 15:32:30
111
原创 Map、斗地主案例
Map集合package com.itheima.demo01.Map;import java.util.HashMap;import java.util.Map;/* java.util.Map<k,v>集合 Map集合的特点: 1.Map集合是一个双列集合,一个元素包含两个值(一个key,一个value) 2.Map集合中...
2020-02-27 20:37:21
142
原创 List、Set、数据结构、Collections
数据结构栈:先进后出队列:先进先出数组:查询快,增删慢链表:查询慢,增删快红黑树:趋近于平衡树,查询的速度非常快,查询叶子节点最大次数和最小次数不能超过2倍。List集合package com.itheima.demo01.List;import java.util.ArrayList;import java.util.Iterator;import java.util.Li...
2020-02-26 20:20:48
115
原创 Object类、常用API
Object类的toString方法package com.itheima.demo01;import java.util.ArrayList;import java.util.Random;import java.util.Scanner;/* java.lang.Object类 类 Object是类层次结构的根(最顶层)类。每个类都使用Object作为超(父)类。 ...
2020-02-24 16:27:50
140
原创 final、权限、内部类
finalfinal关键字概念与四种用法package cn.itcast.day11.demo01;/*final关键字代表最终、不可改变的。常见四种方法:1.可以用来修饰一个类2.可以用来修饰一个方法3.还可以用来修饰一个局部变量4.还可以用来修饰一个成员变量 */public class Demo01Final {}final关键字用于修饰类package...
2020-02-16 17:02:01
294
原创 接口、多态
接口就是多个类的公共规范。接口是一种引用数据类型,最重要的内容就是其中的方法:抽象方法。如何定义一个接口的格式:public interface 接口名称{//接口内容}备注:换成了关键字interface之后,编译生成的字节码文件仍然是:.java–>.class。如果是Java 7,那么接口中可以包含的内容有:1.常量2.抽象方法如果是Java 8,还可以额外包括:...
2020-02-14 09:45:20
106
原创 继承、super、this、抽象类
继承方法中的覆盖重写/*局部变量: 直接写成员变量名本类的成员变量 this.成员变量名父类的成员变量名 super.成员变量名在父子类的继承关系中,创建子类对象,访问成员方法的规则。 创建的对象是谁,就优先用谁,如果没有则向上找。 注意事项:无论是成员方法还是成员变量,如果没有都是向上找父类,绝对不会向下找子类。 重写(Override) 概念:...
2020-02-08 20:10:15
141
1
原创 day 08 String类、Random类、ArrayList类
package cn.itcast.day08.demo01;/*java.lang.String类代表字符串API当中说:Java程序中的所有字符串字面值(如:“abc")都作为此类的实例实现。其实就是说:程序当中所有的双引号字符串,都是String类的对象。(就算没有new,也照样是)字符串的特点:1.字符串的内容永不可变【重点】2.正是因为字符串不可改变,所以字符串是可以共...
2020-01-05 20:34:17
129
原创 day07_Scanner类,Random类,ArrayList类
Scanner类的功能:可以实现键盘输入数据到程序中引用类型的一般步骤:1.导包import 包路径.类名称;如果需要使用的目标类,和当前类位于同一个包中,则可以省略导入语句只有java.lang包下的内容不需要导包,其他的都需要import语句。2.创建类名称 对象名 = new 类名称();3.使用对象名.成员方法名()package cn.itcast.day07.dem...
2019-12-13 17:37:49
246
原创 复试--矩阵行列对角和
415 8 -2 631 24 18 71-3 -9 27 1317 21 38 69待解决#include <bits/stdc++.h>using namespace std;bool cmp(int a,int b){ return a>b;}int main(){ int m; cin>>m; int num[10][...
2019-03-09 16:28:33
213
原创 复试--完数
//完数#include<bits/stdc++.h>using namespace std;int main(){ int a,b; cin>>a>>b; int i,j; for(i=a;i<=b;i++){ int sum=0; for(j=1;j<i;j++){ ...
2019-03-09 15:33:20
83
原创 复试题--smith数
分解质因数以及各位相加//smith数#include<bits/stdc++.h>>using namespace std;int fenli(int n){ int a=n; int sum=0; while(a){ sum+=a%10; a/=10; } return sum;}in...
2019-03-09 15:18:33
253
原创 牛客网--day of week
题目描述We now use the Gregorian style of dating in Russia. The leap years are years with number divisible by 4 but not divisible by 100, or divisible by 400. For example, years 2004, 2180 and 2400 are l...
2019-03-07 16:13:41
201
原创 牛客网--2的幂次方
#include<iostream>#include<stdio.h>#include<string>#include<cmath>#include<vector>using namespace std;string dtob(int n){ int sum=0; vector<int> v; ...
2019-03-06 15:28:25
283
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人