2017清北学堂(提高组精英班)集训笔记——基础算法

本文详细介绍了倍增算法的应用,包括倍增ST表解决RMQ问题、树上倍增求LCA、快速幂运算;分治算法及其应用如二分查找、归并排序、快速排序;贪心算法原理及经典例题解析;搜索算法的不同类型与优化技巧。

我这更新笔记的顺序有点乱时间也很乱,见谅,(其实我是想偷懒什么简单先更什么O(∩_∩)O~)

一、倍增算法:

定义:用f[i][j]表示从i位置出发的2j个位置的信息综合(状态)

一个小小的问题:为什么是2j而不是3j,5j,…?因为,假设为kj,整个算法的时间复杂度为(k-1)logk,当k=2时,时间复杂度最小。

这个算法的三个应用:

1.倍增ST表:

应用:这个ST表是用来解决RMQ问题(给你n个数,m次询问,每次询问[l,r]这个区间的最大值),当然,解决RMQ问题是可以用线段树来做的,但是比较麻烦,NOIP 80%是不会用线段树来做,还是用ST表方便。

定义:f[i][j]表示:从i到i+2j-1这2j个位置的元素最大值

初始化:f[i][0]=z[i](第i个位置到第i+20-1个位置的最大值,对应只有一个元素的区间)

转移:f[i][j]=max(f[i][j-1],f[i+2(j-1)][j-1]) (把[i,i+2j-1]这个区间分治为两个区间,这两个区间拼在一起就成了原来一个大的区间,两个区间长度都为2j-1

 1 //建立ST表,引自P2O5 dalao的blog:https://zybuluo.com/P2Oileen/note/816892#应用1-st表
 2 for(int a=1;a<=n;a++) f[a][0]=z[a];//z[]为源数据区间数组 
 3 for(int j=1;j<=logn;j++)
 4 {
 5     for(int i=1;i+z^j-1<=n;i++)
 6         f[i][j]=max(f[i][j-1],f[i+2^(j-1)][j-1]);
 7         //乘方是伪代码!
 8 }
 9 //solve
10 ans=max(f[l][k],f[r-2^k+1][k]);

所以就有两种情况

①假如区间长度(r-l+1)正好是2k,那么就直接访问f[l][k]

②假如区间长度(r-l+1)是2k+p(p<2k),也就说明2k≤(r-l+1)<2k+1,我们可以慢慢地分治下去,利用前缀和,就形成了树状数组那样的东西,一段区间的最大值为 划分成两段区间最大值max1,max2相比取较大 ,但是这样太慢。

有一种更好的方法:其实我们可以用两个长度为2k的区间就一定能把这段[l,r]区间完美覆盖起来,会有重复,但是对求最大值这件事情没有影响,所以 这段区间的最大值=max(f[l][k],f[r-2k+1][k])。

限制:不能用来计算区间和,因为中间有重复部分,还有就是:不支持修改ST表!

2.树上倍增LCA(最近公共祖先):

一般是用线性Tarjan算法来求解(这个Tarjan算法和图论中求有向图强连通分量的Tarjan不同,都是一个人发明的),但是在ZHX十年的信息学奥赛生涯中没有用到这个算法,原因有俩:①没遇到这样的题目②不会!(笑哭脸),有兴趣可以了解一下。

下面介绍倍增的算法:

定义:f[i][j]表示:从树上编号为i的节点向上走2j步会走到哪个节点。

初始化:从j=0开始考虑,也就是从i号节点向上走1步到达的节点,就是i节点的父亲,所以:f[i][0]=father[i]。

转移:f[i][j]=f[f[i][j-1]][j-1],表示:从i节点往上走2j-1步后,再往上走2j-1步到达的点,等价于向上走2j步,因为2j-1+2j-1=2j。(j的范围大概[20,30)≈nlogn,只要保证2j>节点数目n即可

现在我们构造出来这个f数组,下面介绍如何求两个点的LCA:

定义数组depth[i]表示i这个节点的深度,有以下两种情况

①depth[p1]==depth[p2],具有一个重要的性质:两个节点同时向上走同样地步数,深度仍然相等,也就是说,我们让p1,p2一步一步地往上走,当走到同一个点时候,这个点一定是LCA!

 1 for(int x=19;x>=0;x--) 
 2 {
 3     if(f[p1][x]!=f[p2][x])//如果没有走到同一个点,继续往上走 
 4     {
 5         p1=f[p1][x];//p1往上跳 
 6         p2=f[p2][x];//p2往上跳 
 7     }     
 8 }    
 9 if(p1!=p2)//为什么要加这个判断?有可能p1=p2么?是有可能的!这个判断是防止一开始跳之前p1=p2这种情况 
10 {
11     p1=f[p1][0];//因为上面的循环p1,p2只是走到了LCA的下方,这个判断只是处理最后一步:把p1或p2往上跳到它的父亲,就是LCA,返回即可 
12 } 
13 return p1;//p1为LCA,返回 

②depth[p1]!=depth[p2],假如p1比较深,就让p1往上跳到和p2深度一样的地方。

利用倍增f数组p1往上跳的方法:定义往上走步数step=depth[p1]-depth[p2],再利用二进制转换!

举个栗子:假如step=13,转为二进制=1101,可以得出13=8+4+1,:先走8步,再走4步,再走1步就好了。

1 int get_lca(int p1,int p2)
2 {
3     if(dpeth[p1]<depth[p2]) swap(p1,p2);
4     for(int x=19;x>=0;x--)
5     {
6     if((2^x)<=depth[p1]-depth[p2]) p1=f[p1][x];
7     }
8 }

下面是另一种写法思路就不多讲,YY一下就可以出来的啦~

 1 int x=0;
 2 while (p1!=p2)
 3 {
 4     if(!x||f[p1][x]!=f[p2][x]) 
 5     {
 6         p1=f[p1][x];
 7         p2=f[p2][x];
 8         x++;        
 9     }
10     else x--;
11 }

3.快速幂:

按照一般思路,我们要计算ax的话,要写一个for循环,计算a×a×a×a…这样太™麻烦并且浪费时间!

这里运用倍增来实现快速幂,这也是运用到了分治的思想。

我们要求出x(x=2×k)个a的乘积,就可以分解为x/2个a的乘积的平方,这样就省去一半计算量,如果x是奇数,就在原先的基础上×a就可以了。

 1 int ksm(int a,int x)//求a^x的快速幂 时间复杂度:O(logx) 
 2 {
 3     int ans=1;
 4     while(x)
 5     {
 6         if(x&1) ans=(ans*a);//位运算:x&1==1则x为奇数
 7         a=a*a;
 8         x=x>>1;//位运算:右移一位,即将X除以2
 9     }
10     return ans;
11 }

二、分治算法

定义:将一个规模为N的问题分解为K个规模较小的子问题,这些子问题相互独立且与原问题性质相同。求出子问题的解,就可得到原问题的解。

这个算法的三个应用:

1.二分查找:

定义:给定排序数组,查询某个数是否在数组中

算法描述:在查找所要查找的元素时,首先与序列中间的元素进行比较,如果大于这个元素,就在当前序列的后半部分继续查找,如果小于这个元素,就在当前序列的前半部分继续查找,直到找到相同的元素,或者所查找的序列范围为空为止。

 1 bool find(int x)//二分查找x是否在序列z[]中 
 2 {
 3     left=0,right=n;
 4     while(left+1!=right)
 5     {
 6         middle=(left+right)>>1;
 7         if(z[middle]>=x) right=middle;
 8         else left=middle;
 9     }
10 }

还可以用lower_bound和upper_bound函数进行优化,用法详见下:

 1 #include <iostream>
 2 #include <algorithm>//必须包含的头文件,C++特有的库函数 
 3 using namespace std;
 4 int main()
 5 {
 6     int point[5]={1,3,7,7,9};
 7     int ans;
 8     /*两个函数传入的:(数组名,数组名+数组长度,要查找的数字),返回的是一个地址,减去数组名即可得到数字在数组中的下标*/
 9     ans=upper_bound(point,point+5,7)-point;//按从小到大,7最多能插入数组point的哪个位置
10     printf("%d ",ans);//输出数字在数组中的下标 
11     ans=lower_bound(point,point+5,7)-point;////按从小到大,7最少能插入数组point的哪个位置
12     printf("%d\n",ans);//输出数字在数组中的下标 
13     return 0;
14 }
15 /*
16 output:
17 4 2 
18 */

2.归并排序(nlogn):

分治法的典型应用

归并过程

比较a[i]和b[j]的大小,若a[i]≤b[j],则将第一个有序表中的元素a[i]复制到r[k]中,并令i和k分别加上1;

否则,将第二个有序表中的元素b[j]复制到r[k]中,并令j和k分别加上1。

如此循环下去,直到其中一个有序表取完,然后再将另一个有序表中剩余的元素复制到r中从下标k到下标t的单元

归并排序的算法我们通常用递归实现,先把待排序区间[s,t]以中点二分,接着把左边子区间排序,再把右边子区间排序,最后把左区间和右区间用一次归并操作合并成有序的区间[s,t]。

3.快速排序(nlogn):

一般在使用时候直接调用快排函数。

sort(快速排序,是C#特有的,不会退化为n2,比下面三个都要快,一般使用这个)

qsort(最坏情况下为n2,最好是n,期望为nlogn)

merge_sort(归并排序,稳定为nlongn)

heap_sort(堆排序,稳定为nlongn)

三、贪心算法:

算法思想在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。

贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。
经典例题:选最大(野题)
给你N个数,要求你选出K个数使他们的和最大。
思路:我们进行K次贪心,每次我们都“贪”剩下的所有数中最大的,选择后拿走,这样就能保证我选的K个数总和最大。做法就是把N个数从大到小排序选择前K个即可。
经典例题:国王游戏(Luogu 1080)

  恰逢 H 国国庆,国王邀请 n 位大臣来玩一个有奖游戏。首先,他让每个大臣在左、右手上面分别写下一个整数,国王自己也在左、右手上各写一个整数。然后,让这 n 位大臣排成一排,国王站在队伍的最前面。排好队后,所有的大臣都会获得国王奖赏的若干金币,每位大臣获得的金币数分别是:排在该大臣前面的所有人的左手上的数的乘积除以他自己右手上的数,然后向下取整得到的结果。

  国王不希望某一个大臣获得特别多的奖赏,所以他想请你帮他重新安排一下队伍的顺序,使得获得奖赏最多的大臣,所获奖赏尽可能的少。注意,国王的位置始终在队伍的最前面。

思路:此题要用到高精度,考虑最后一个大臣,显然他很可能是金币最多的人。我们要让他的金币尽量的少。之前的大臣左手的数肯定会乘起来,所以我们要使S/A/B尽量的大。(设S是左手所有数的乘积),即让A*B尽量的大。选完最后一个后,我们把他踢掉,然后再找一个最后的大臣。如此往复,相当于就是对A*B排序。

基于交换的证明:假设两个相邻的大臣i,j,而前面的人总乘积为S。

当i在j前面时,设ans1=max(s/i.b,s*i.a/j.b);

当j在i前面时,设ans2=max(s/j.b,s*j.a/i.b);

所以要使得i在j前面,必须要ans1<ans2,所以:按照ai*bi排序,条件为x.a*x.b<y.a*y.b才是正解!

ZHX给的一个小小的Tip

当我们做贪心时候不知道按照什么来排序,这时候就可以慢慢试,按照a×b、a+b、ab…这些条件来排序,看看哪个计算出来的结果最符合标答^_^,真。。。是个有用的Tip啊!

四、搜索算法:

1.三种不同的搜索问题:

①最优性问题:例如:有N个数,从中选出K个数满足和最大。

②计数问题:例如:有N个数,从中选出K个数的方案数目有多少。

③方案问题:例如:有N个数,从中选出K个数满足已知条件,输出其中M种方案,一般这第三类问题可以在第二类问题中解决

2.两种不同的搜索方法:

①BFS(广度优先搜索):目的是系统地展开并检查图中的所有节点,以找寻结果。换句话说,它并不考虑结果的可能位置,彻底地搜索整张图,直到找到结果为止。

②DFS(深度优先搜索):其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次。

3.搜索优化技巧:

①剪枝:当搜索到一个状态时候,发现当前状态不满足条件,就不继续往下搜,而不是等到搜索完毕才判断是否满足条件。

②BFS—meet in the middle:双向搜索(前提是要知道最终状态的样子)

举个栗子:我们有一个满三叉树,深度为k,我们搜索到最后一层的状态数为3k-1,这样要花费的时间非常多。

已知了起始状态和最终状态,要用BFS求出起始到最终所经过的那些状态,其实可以从起始状态往后走k/2个状态(k为初末总状态数),再从最终的N个状态往前走k/2个状态,一定会在中间某个节点相遇,这样联通起了整个状态。

时间、空间复杂度从O(X)变为O(sprt(X))

③重复结构利用(计数问题):这个我不会~

④卡时(最优化问题):我们在面对求最优值问题的时候,如果找到一个更优的值,更新一下ans的值,但是如果你还没搜索完毕,时间已经快要到达上限了,这时候就会爆0,意思就是要在程序运行时间快要到达题目限制时候,把当前我们找到的ans输出来!这样你就会从“得0分”变成“至少得0分”!超级有用啊啊!!

 1 #include <stdio.h>
 2 #include <stdlib.h>//exit()要用到的库函数
 3 #include <time.h>//clock()去官网看能不能用,否则就会变成至多零分了……
 4 int t;//程序开始运行时候当前系统时间 
 5 void dfs()
 6 {
 7     /*假如题目限制时间为2000ms*/
 8     if(clock()-t>=1995)//程序运行时间=程序执行到此当前系统时间-程序开始系统时间(以ms为单位) 
 9     {
10         shuchujie();//输出答案(保守一点可能需要5ms传入输出函数并输出) 
11         exit(0);//直接销毁程序! 
12     }
13     else
14     {
15         ;//继续往下搜 
16     }
17 }
18 int main()
19 {
20     t=clock();//记录一下当前时间
21     return 0; 
22 }

⑤数据结构优化:一般不会出到那么难(笑哭脸)

五、奇怪的东西:

越来越有用的东西——读入优化(可以加快读入int的速度):

我们平时从一个文件里面读入一百万个数数据,基本接近一秒了(那还玩个P啊!),读入优化基本思想就是:把读入的数据拆成一个字符一个字符的来读入,因为字符读入比int快~

下面给出了读入优化int的代码,直接调用就可以了噢~当然只限于读入非负整数,如果是负数、小数、科学计数法的话还要加上一些判断。

这个什么原理相信各位看官稍加思考便可看明白。

 1 #include <stdio.h>
 2 int getint()
 3 {
 4     char c=' '; 
 5     while(c<'0'||c>'9') c=getchar(); 
 6     int x=0;//x为这个数字的前缀 
 7     while(c>='0'&&c<='9') 
 8     {
 9         x=x*10+c-'0';
10         c=getchar();
11     }
12     return x;
13 } 
14 int main()
15 {
16     int a;
17     a=getint();//调用读入优化 
18     printf("%d\n",a);
19     return 0;
20 }

最近发现一些网站盗用我的blog,这实在不能忍(™把关于我的名字什么的全部删去只保留文本啥意思。。)!!希望各位转载引用时请注明出处,谢谢配合噢~

原博客唯一地址:http://www.cnblogs.com/geek-007/p/7296444.html

转载于:https://www.cnblogs.com/geek-007/p/7296444.html

标题SpringBoot智能在线预约挂号系统研究AI更换标题第1章引言介绍智能在线预约挂号系统的研究背景、意义、国内外研究现状及论文创新点。1.1研究背景与意义阐述智能在线预约挂号系统对提升医疗服务效率的重要性。1.2国内外研究现状分析国内外智能在线预约挂号系统的研究与应用情况。1.3研究方法及创新点概述本文采用的技术路线、研究方法及主要创新点。第2章相关理论总结智能在线预约挂号系统相关理论,包括系统架构、开发技术等。2.1系统架构设计理论介绍系统架构设计的基本原则和常用方法。2.2SpringBoot开发框架理论阐述SpringBoot框架的特点、优势及其在系统开发中的应用。2.3数据库设计与管理理论介绍数据库设计原则、数据模型及数据库管理系统。2.4网络安全与数据保护理论讨论网络安全威胁、数据保护技术及其在系统中的应用。第3章SpringBoot智能在线预约挂号系统设计详细介绍系统的设计方案,包括功能模块划分、数据库设计等。3.1系统功能模块设计划分系统功能模块,如用户管理、挂号管理、医生排等。3.2数据库设计与实现设计数据库表结构,确定字段类型、主键及外键关系。3.3用户界面设计设计用户友好的界面,提升用户体验。3.4系统安全设计阐述系统安全策略,包括用户认证、数据加密等。第4章系统实现与测试介绍系统的实现过程,包括编码、测试及优化等。4.1系统编码实现采用SpringBoot框架进行系统编码实现。4.2系统测试方法介绍系统测试的方法、步骤及测试用例设计。4.3系统性能测试与分析对系统进行性能测试,分析测试结果并提出优化建议。4.4系统优化与改进根据测试结果对系统进行优化和改进,提升系统性能。第5章研究结果呈现系统实现后的效果,包括功能实现、性能提升等。5.1系统功能实现效果展示系统各功能模块的实现效果,如挂号成功界面等。5.2系统性能提升效果对比优化前后的系统性能
在金融行业中,对信用风险的判断是核心环节之一,其结果对机构的信贷政策和风险控制策略有直接影响。本文将围绕如何借助机器学习方法,尤其是Sklearn工具包,建立用于判断信用状况的预测系统。文中将涵盖逻辑回归、支持向量机等常见方法,并通过实际操作流程进行说明。 一、机器学习基本概念 机器学习属于人工智能的子领域,其基本理念是通过数据自动学习规律,而非依赖人工设定规则。在信贷分析中,该技术可用于挖掘历史数据中的潜在规律,进而对未来的信用表现进行预测。 二、Sklearn工具包概述 Sklearn(Scikit-learn)是Python语言中广泛使用的机器学习模块,提供多种数据处理和建模功能。它简化了数据洗、特征提取、模型构建、验证与优化等流程,是数据科学项目中的常用工具。 三、逻辑回归模型 逻辑回归是一种常用于分类任务的线性模型,特别适用于二类问题。在信用评估中,该模型可用于判断借款人是否可能违约。其通过逻辑函数将输出映射为0到1之间的概率值,从而表示违约的可能性。 四、支持向量机模型 支持向量机是一种用于监督学习的算法,适用于数据维度高、样本量小的情况。在信用分析中,该方法能够通过寻找最佳分割面,区分违约与非违约客户。通过选用不同核函数,可应对复杂的非线性关系,提升预测精度。 五、数据预处理步骤 在建模前,需对原始数据进行理与转换,包括处理缺失值、识别异常点、标准化数值、筛选有效特征等。对于信用评分,常见的输入变量包括收入水平、负债比例、信用历史记录、职业稳定性等。预处理有助于减少噪声干扰,增强模型的适应性。 六、模型构建与验证 借助Sklearn,可以将数据集划分为训练集和测试集,并通过交叉验证调整参数以提升模型性能。常用评估指标包括准确率、召回率、F1值以及AUC-ROC曲线。在处理不平衡数据时,更应关注模型的召回率与特异性。 七、集成学习方法 为提升模型预测能力,可采用集成策略,如结合多个模型的预测结果。这有助于降低单一模型的偏差与方差,增强整体预测的稳定性与准确性。 综上,基于机器学习的信用评估系统可通过Sklearn中的多种算法,结合合理的数据处理与模型优化,实现对借款人信用状况的精准判断。在实际应用中,需持续调整模型以适应市场变化,保障预测结果的长期有效性。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值