自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 【驭风计划 算法训练营】周测5:考题10-5、8-5、12-5

平面固定有一些全等的圆角矩形,不同的圆角矩形具有不同的位置和倾斜角。这些圆角矩形都通过将以原本四个直角处距离两条直角边均为 rr 的位置为圆心,半径为 rr 且与两条直角边相切的四分之一圆弧以外的区域裁剪得到。希望使用一根非弹性绳将这些矩形从外面围住,求绳最短的长度。

2024-12-13 11:07:24 733

原创 【驭风计划 算法训练营】周测4:习题11-4、8-4、12-4

给出 nn 个非负整数 x1,x2,⋯,xnx1,x2,⋯,xn,有 qq 个询问,第 jj 个询问给出一个非负整数 yjyj,求其中,xor 表示按位异或运算。

2024-12-13 11:05:42 905

原创 【驭风计划 算法训练营】习题5-3:纸牌、青蛙

时间限制:1 sec空间限制:512 MB小明有 2n 张纸牌,点数依次从1 到 2n。小明要和你玩一个游戏,这个游戏中,每个人都会分到 n 张卡牌。游戏一共分为 n 轮,每轮你们都要出一张牌,获胜。游戏开始了,你拿到了你的牌。你现在想知道,你最多(也就是运气最好的情况下)能够获胜几轮?第一行 1 个正整数 n。第 2 行到第 n+1 行每行一个正整数 a[i],表示你的第 i 张牌的点数。一行一个整数表示你最多能够获胜的轮数。2141对于 31.25% 的数据,保证 1<=n<=100。

2024-12-13 11:02:52 378

原创 【驭风计划 算法训练营】习题5-2:最近点对

距离最近的点为7和8,距离为√(7−6)2+(5−6)2=√2≈1.41(7-6)2+(5-6)2=2≈1.41。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。对于100%的数据,2 ≤ n ≤ 3×10^5,每个点坐标的绝对值不超过10^9。给定n个二维平面上的点,求距离最近的一对点,输出他们的距离。输出距离最近的一对点的距离,保留两位小数。

2024-12-13 11:01:39 340

原创 【驭风计划 算法训练营】习题5-1:凸包、图

回忆一下求拓扑序列是如何做的:每一次都取一个入度为0的点,将这个点取出来放进拓扑序列里,然后将这个点连向的所有点的入度减去1。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。输出 T 行,若所给的图存在唯一的合法数列,输出 1,否则输出 0。

2024-12-13 11:00:39 928

原创 【驭风计划 算法训练营】周测3:考题11-3、8-3、12-3

你在玩一个游戏,你的游戏角色有两种属性值 E 和 H。游戏中会出现 nn 个道具,第 ii 个道具会在 titi 时刻出现,道具出现后可以使用一次,你可以选择增加 eiei 点 E 属性值或 hihi 点 H 属性值。当 H 值达到阈值 hh 时则游戏通关;此外,E 属性值每个单位时间会减少 11,若其值变为负数则游戏失败。游戏开始时(0 时刻)你的 E 属性值为 ss,H 属性值为 00,请求出通关游戏至少需要多少时间;若不可能通关,则求出游戏最多进行多长时间。

2024-12-13 10:58:58 460

原创 【驭风计划 算法训练营】习题4-3:最大间隙、基数排序、字符串匹配

另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。对于 100% 的数据,保证 n<=500,000,m<=100,000。

2024-12-13 10:57:06 729

原创 【驭风计划 算法训练营】习题4-2:邓老师数、子序列、前缀

参加了邓老师算法训练营的小 Z 突发奇想,定义了新的数:所有合数中,除了 1 与其本身外,其他因数均为质数的数,称作。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。对于编号为奇数的测试点,保证 k=1。

2024-12-13 10:54:43 714

原创 【驭风计划 算法训练营】习题4-1:矩阵、回文串

找一个比较好的质数pp,对于字符串A,BA,B,若A=BA=B则显然H(A)modp=H(B)modpH(A)modp=H(B)modp;若A≠BA≠B,H(A)modpH(A)modp有一定概率会和H(B)modpH(B)modp相同。字典序:对于两个位置(a,b),(c,d),若a<c则(a,b)比(c,d)小,若a>c则(a,b)比(c,d)大,若a=c则再像前边一样比较b和d。比如aba,倒序写出来也是aba,故aba是回文串。[对于不同的字符串A,BA,B,H(A)≠H(B)H(A)≠H(B)]

2024-12-13 10:53:07 496

原创 【驭风计划 算法训练营】周测2:习题8-2、11-2、9-2

一个无向图有 n 个点,m 条边。每个点 i 都有一个点权,记为 wiwi。询问给定两个点 s 和 t,求以 s 为起点 t 为终点的所有可能路径中,路径上的点权的最大值的最小值。如果不存在从 s 到 t 的通路,则输出 -1。第一行两个正整数 n,m。第二行 n 个正整数,代表 n 个点的点权,用空格隔开。接下来 m 行,每行两个整数u,v(1 ≤ u,v ≤ n),表示点 u 和点 v 之间有一条无向边。接下来一行两个整数s,t,意义同描述。输入保证无重边、自环。

2024-12-13 10:51:42 786

原创 【驭风计划 算法训练营】习题3-3:最长公共子序列、倒水问题、奶牛吃草

最长公共子序列1 sec256 MB给定两个 1 到 n 的排列 A,B (即长度为 n 的序列,其中 [1,n] 之间的所有数都出现了一次)。求它们的最长公共子序列长度。第一行一个整数 n ,意义见题目描述。第二行 n 个用空格隔开的正整数 A[1],…,A[n],描述排列 A。第三行 n 个用空格隔开的正整数 B[1],…,B[n],描述排列 B。一行一个整数,表示 A,B 的最长公共子序列的长度。2(2,3) 和 (2,4) 都可以是这两个序列的最长公共子序列。

2024-12-13 10:49:50 666

原创 【驭风计划 算法训练营】习题3-2:刷油漆、n皇后

有n辆车排成一排,还有m种不同颜色的油漆,其中第i种油漆够涂ai辆车,同时所有油漆恰好能涂完n辆车。n皇后问题:一个n×n的棋盘,在棋盘上摆n个皇后,满足任意两个皇后不能在同一行、同一列或同一斜线上的方案有多少种?另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。对于100%的数据,m ≤ 20,ai ≤ 5。一共10个测试点, 第i个测试点的n=i+4。

2024-12-12 09:52:50 383

原创 【驭风计划 算法训练营】习题3-1:数字三角形、背包问题1、2

数字三角形2 sec256 MB给定一个高度为 n 的“数字三角形”,其中第 i 行(1<=i<=n)有 i 个数。(例子如下图所示)初始时,你站在“数字三角形”的顶部,即第一行的唯一一个数上。每次移动,你可以选择移动到当前位置正下方或者当前位置右下方的位置上。即如果你在 (i,j)(表示你在第i行从左往右数第j个数上,下同),你可以选择移动到 (i+1,j) 或 (i+1,j+1)。你想让你经过的所有位置(包括起点和终点)的数字总和最大。求这个最大值。第一行一个正整数 n,表示数字三角形的大小。

2024-12-12 09:51:11 1560

原创 【驭风计划 算法训练营】周测1:考题11-1、8-1、6-1

每次操作后,求序列的众数的值。一个序列的众数定义为该数列中出现次数最多的数,若出现次数最多的数有多种,取其中数值最小的数。

2024-12-12 09:48:59 945

原创 【驭风计划 算法训练营】习题2-3:最小交换、楼尔邦德、最短路

另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。给定一个 1 到 n 的排列(即一个序列,其中 [1,n] 之间的正整数每个都出现了恰好 1 次)。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。

2024-12-12 09:45:59 898

原创 【驭风计划 算法训练营】习题2-2:象棋、序列计数

solve(l, r) = solve(l, mid) + solve(mid + 1, r) + cal(l, r, mid),当l≠r][其中cal(l, r, mid)表示在左端点在区间[l, mid]中、右端点在区间[mid + 1, r]中的符合要求的连续子序列数目][令函数solve(l, r)表示统计[l, r]中合法的连续子序列个数,mid为(l+r)/2(下取整),那么]你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。(右端点是有单调性的)]

2024-12-12 09:43:53 410

原创 【驭风计划 算法训练营】习题2-1:排序、分组、大转盘

对于大转盘上的一个指定位置,邓老师可以从它开始,取出顺时针方向的 n 个位置,并将它们按原顺序拼接起来,得到一个长度为 n 的 01 串,也就是一个 n 位二进制数。显然地,大转盘上共有 2^n 个位置可以获得幸运数,而巧合的是 n 位二进制数恰好也有 2^n 个,所以邓老师希望这些所有的幸运数包含了所有的 n 位二进制数。有n个正整数排成一排,你要将这些数分成m份(同一份中的数字都是连续的,不能隔开),同时数字之和最大的那一份的数字之和尽量小。对于第 i 个测试点(1<=i<=16),满足 n=i。

2024-12-12 09:42:25 1702

原创 【驭风计划 算法训练营】习题1-3:等式、道路升级

第 2 行到第 m+1 行,每行 2 个用空格隔开的整数 u,v 描述一条从 u 到 v 的双向道路,第 i+1 行的道路的编号为 i。对于100%的数据,1 ≤ n ≤ 300000, m ≤ 500000,1 ≤ a,b ≤ n,T ≤ 100。输出T行,第i行表示第i组数据的答案。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。另外,为了帮助大家完成题目,我们提供了只包含了输入输出功能的程序模板,也提供了含有算法的大部分实现细节的程序。

2024-12-12 09:39:37 657

原创 【驭风计划 算法训练营】习题1-2:数字盒子、重编码、成绩排序

现在,我们要用一个 2 进制串(即只包含 0 或 1 的串) sisi 来替换第 i 种单词,使其满足如下要求:对于任意的 1≤i,j≤n,i≠j1≤i,j≤n,i≠j,都有 sisi 不是 sjsj 的前缀。第 2 行到第 n+1 行,每行 2 个用空格隔开的非负整数,第 i+1 行的两个数依次表示学号为 i 的同学的算法训练营、数据结构训练营的总评成绩。前 n 行表示正确的排序结果,每行 4 个用空格隔开的整数,第 i 行的数依次表示排名为 i 的同学的学号、总分、算法训练营成绩、数据结构训练营成绩。

2024-12-12 09:38:04 713

原创 【驭风计划 算法训练营】习题1-1:栈、队列、二叉树

开一个大小为n的数组,记录队头和队尾的位置,入列出列就是将这两个位置改变一下,队列中某个位置Y在数组相应的下标为队头的位置+Y-1。[开一个大小为n的数组,记录栈顶的位置,入栈出栈就是将这栈顶加一减一,栈中某个位置Y在数组相应的下标就是Y。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。你可以根据自己的实际情况,在这些程序的基础上进行作答,或不参考这些程序,这将与你的得分无关。若为数字2,表示弹出栈顶(保证栈非空),并输出出栈的这个人。

2024-12-12 09:33:01 774

原创 【驭风计划 自然语言处理】实验6:面向新冠肺炎的社会计算应用

新冠肺炎疫情牵动着我们每一个人的心,在这个案例中,我们将尝试用社会计算的方法对疫情相关的新闻和谣言进行分析,助力疫情信息研究。本次作业为开放性作业,我们提供了疫情期间的社交数据,鼓励同学们从新闻、谣言以及法律文书中分析社会趋势。(提示:运用课上学到的方法,如情感分析、信息抽取、阅读理解等分析数据)

2024-12-12 09:27:29 890

原创 【驭风计划 自然语言处理】实验5:司法阅读理解

裁判文书中包含了丰富的案件信息,比如时间、地点、人物关系等等,通过机器智能化地阅读理解裁判文书,可以更快速、便捷地辅助法官、律师以及普通大众获取所需信息。本次任务覆盖多种法律文书类型,包括民事、刑事、行政,问题类型为多步推理,即对于给定问题,只通过单句文本很难得出正确回答,模型需要结合多句话通过推理得出答案。本任务数据集包括约5100个问答对,其中民事、刑事、行政各约1700个问答对,均为需要多步推理的问题类型。:问题的回答,包括片段、YES/NO、据答几种类型,对于拒答类,答案应该是"unknown"。

2024-12-12 09:26:26 308

原创 【驭风计划 自然语言处理】实验4:预训练语言模型实现与应用

以上代码是完整实现好的,我们需要同学对gen_data.py和config/Config.py中用# question标识的20余个问题进行回答,并运行模型,测试模型在有100% / 50% / 10% training data(通过随机sample原training set一部分的数据,10%代表低资源的设定)的情况下模型在dev set上的效果(如果服务器资源有限,也可以只测试10%的结果,并在报告中提及)对于模型进行改进,提升关系抽取的能力,这里可以参考一些DocRED最新工作,进行复现。

2024-12-12 09:25:16 680

原创 【驭风计划 自然语言处理】实验3:文本情感分析

Bag of Words得到句子的0-1向量(选做:用TFIDF计算句子向量) Word2Vec词向量求和/取平均(选做:实现Doc2Vec[1]) 使用BERT得到[CLS]向量/词的隐状态取平均(选做) 训练分类器 TODO:补全 learnPredictor 函数 我们提供的训练数据集中,每句话的标签在文本之前,其中+1表示这句话蕴涵了正面感情,-1表示这 句话蕴涵了负面感情。对实验结果的分析,请描述采用的模型结构、模型在训练集上的损失函数下降曲线和测试集的最终 结果,并对结果进行分析。

2024-12-12 09:23:58 292

原创 【驭风计划 自然语言处理】实验2:seq2seq模型——机器翻译

seq2seq是神经机器翻译的主流框架,如今的商用机器翻译系统大多都基于其构建,在本案例中,我们将使用由NIST提供的中英文本数据训练一个简单的中英翻译系统,在实践中学习seq2seq的具体细节,以及了解机器翻译的基本技术。seq2seq模型从根本上讲,机器翻译需要将输入序列(源语言中的单词)映射到输出序列(目标语言中的单词)。正如我们在课堂上讨论的那样,递归神经网络(RNN)可有效处理此类顺序数据。机器翻译中的一个重要难题是输入和输出序列之间没有一对一的对应关系。

2024-12-12 09:22:29 611

原创 【驭风计划 自然语言处理】实验1:Word2Vec&TranE的实现

Word2Vec是词嵌入的经典模型,它通过词之间的上下文信息来建模词的相似度。TransE是知识表示学习领域的经典模型,它借鉴了Word2Vec的思路,用“头实体+关系=尾实体”这一简单的训练目标取得了惊人的效果。本次任务要求在给定的框架中分别基于Text8和Wikidata数据集实现Word2Vec和TransE,并用具体实例体会词向量和实体/关系向量的含义。

2024-12-12 09:20:47 619

原创 【驭风计划 深度学习】实验7:图像超分辨

本次案例将使用生成对抗网络来实现4倍图像超分辨任务,输入一张低分辨率图像,生成器会生成一张4倍超分辨率的图像,如图1所示。生成对抗网络选用SRGAN结构[1]。测试集使用DIV2K验证集[2]、Set5、Set14、B100、Urban100五个数据集,分别包括高分辨率图像和对应的低分辨率图像。训练集和测试集中的所有低分辨图像都是由高分辨率图像下采样得到,下采样方法为使用Matlab中的resize函数,scale factor为0.25,其余为默认参数(双三次插值)...

2024-12-11 12:25:32 268

原创 【驭风计划 深度学习】实验6:图像自然语言描述生成

本次案例将使用深度学习技术来完成图像自然语言描述生成任务,输入一张图片,模型会给出关于图片内容的语言描述。本案例使用coco2014数据集[1],包含82,783张训练图片,40,504张验证图片,40,775张测试图片。案例使用Andrej Karpathy[2]提供的数据集划分方式和图片标注信息,案例已提供数据处理的脚本,只需下载数据集和划分方式即可...请阅读“源码框架与数据集”中的说明,将最终的实验报告以附件形式提交到此处!

2024-12-11 12:24:31 183

原创 【驭风计划 深度学习】实验5:滴滴出行-交通场景目标检测

关于数据的更多细节可参考D2-City文献[1].为了方便使用,数据集的标注信息已被预处理成MS-COCO格式,MS-COCO是通用物体检测领域最常用的数据集,如需深入理解数据集格式,请自行学习:MS-COCO数据集官网[2]、MS-COCO数据集文献[3]、MS-COCO标注格式[4]. 模型的评估指标也使用MS-COCO常用指标mAP(mean average precision),请自行学习其定义及计算方式(无需自己实现):mAP定义[5],mAP计算方式[6][7]。

2024-12-11 12:21:36 405 1

原创 【驭风计划 深度学习】实验4:脑部MRI图像分割

在参考程序的基础上,使用深度学习技术,尝试提升该模型在脑部MRI图像上的分割效果,以程序最终输出的validation mean DSC值作为评价标准(参考程序约为90%)。本次案例使用的数据集来自Kaggle[1],共包含110位病人的MRI数据,每位病人对应多张通道数为3的.tif格式图像,其对应的分割结果为单通道黑白图像(白色为病变区域),示例如下。本次案例提供了完整、可供运行的参考程序,来源于Kaggle[3]和GitHub[4],建议在参考程序的基础上进行修改来完成本案例。第一行: MRI图像;

2024-12-11 12:18:09 1853

原创 【驭风计划 深度学习】实训3:PyTorch实战: CIFAR图像分类

使用PyTorch分别实现多层感知机(MLP)和卷积网络(ConvNet),并完成CIFAR10数据集(http://www.cs.toronto.edu/~kriz/cifar.html)分类。本案例不提供初始代码,请自行配置网络和选取超参数,包括层数、卷积核数目、激活函数类型、损失函数类型、优化器等方面。l比较不同模型配置下的结果,至少从三个方面作比较和分析,例如层数、卷积核数目、激活函数类型、损失函数类型、优化器等。l详细介绍所使用的模型及其结果,至少包括超参数选取,损失函数、准确率及其曲线;

2024-12-11 12:16:55 337

原创 【驭风计划 深度学习】实训2:构建自己的多层感知机: MNIST手写数字识别

MNIST手写数字识别数据集是图像分类领域最常用的数据集之一,它包含60,000张训练图片,10,000张测试图片,图片中的数字均被缩放到同一尺寸且置于图像中央,图片大小为28×28。注意:此处的softmax损失层与案例1中有所差异,本次案例中的softmax层不包含可训练的参数,这些可训练的参数被独立成一个全连接层。l 本案例中给定的超参数可能表现不佳,请自行调整超参数尝试取得更好的结果,记录下每组超参数的结果,并作比较和分析。本案例提供了初始代码,可基于初始代码完成,配置环境要求与案例1相同。

2024-12-11 12:14:40 345

原创 【驭风计划 深度学习】实训1:Softmax实现手写数字识别

每个样本都是一个784×1的矩阵,是从原始的28×28灰度图像转换而来的。c) 调整其他超参数,如学习率,batch size等,观察这些超参数如何影响分类性能。写下观察结果,简单加以分析,并记录在报告中。本次案例中,你需要用python实现SoftMax回归方法,用于MNIST手写数字数据集分类任务。b) 比较使用和不使用momentum结果的不同,可以从训练时间,收敛性和准确率等方面讨论差异;在更新参数的过程中,你需要实现参数梯度的计算,并按照随机梯度下降法来更新参数。

2024-12-11 12:13:18 342

原创 【驭风计划 机器学习】毕业设计:某闯关类手游用户流失预测

手游在当下的日常娱乐中占据着主导性地位,成为人们生活中放松身心的一种有效途径。近年来,各种类型的手游,尤其是闯关类的休闲手游,由于其对碎片化时间的利用取得了非常广泛的市场。然而在此类手游中,新用户流失是一个非常严峻的问题,有相当多的新用户在短暂尝试后会选择放弃,而如果能在用户还没有完全卸载游戏的时候针对流失可能性较大的用户施以干预(例如奖励道具、暖心短信),就可能挽回用户从而提升游戏的活跃度和公司的潜在收益,因此用户的流失预测成为一个重要且挑战性的问题。

2024-12-11 11:29:54 217

原创 【驭风计划 机器学习】实验6 基于集成学习的 Amazon 用户评论质量预测

¶随着电商平台的兴起,以及疫情的持续影响,线上购物在我们的日常生活中扮演着越来越重要的角色。在进行线上商品挑选时,评论往往是我们十分关注的一个方面。然而目前电商网站的评论质量参差不齐,甚至有水军刷好评或者恶意差评的情况出现,严重影响了顾客的购物体验。因此,对于评论质量的预测成为电商平台越来越关注的话题,如果能自动对评论质量进行评估,就能根据预测结果避免展现低质量的评论。本案例中我们将基于集成学习的方法对 Amazon 现实场景中的评论质量进行预测。

2024-12-11 11:28:29 323

原创 【驭风计划 机器学习】实验5 AAAI 会议论文聚类分析

每年国际上召开的大大小小学术会议不计其数,发表了非常多的论文。在计算机领域的一些大型学术会议上,一次就可以发表涉及各个方向的几百篇论文。按论文的主题、内容进行聚类,有助于人们高效地查找和获得所需要的论文。本案例数据来源于AAAI 2014上发表的约400篇文章,由UCI公开提供,提供包括标题、作者、关键词、摘要在内的信息,希望大家能根据这些信息,合理地构造特征向量来表示这些论文,并设计实现或调用聚类算法对论文进行聚类。最后也可以对聚类结果进行观察,看每一类都是什么样的论文,是否有一些主题。

2024-12-11 11:26:55 377

原创 【驭风计划 机器学习】实验4 基于K-近邻的车牌号识别

图像的智能处理一直是人工智能领域广受关注的一类技术,代表性的如人脸识别与 CT 肿瘤识别,在人工智能落地的进程中发挥着重要作用。其中车牌号识别作为一个早期应用场景,已经融入日常生活中,为我们提供了诸多便利,在各地的停车场和出入口都能看到它的身影。车牌号识别往往分为字符划分和字符识别两个子任务,本案例我们将关注字符识别的任务,尝试用 K-NN 的方法对分割好的字符图像进行自动识别和转化。

2024-12-11 11:25:42 185

原创 【驭风计划 机器学习】实验3 贝叶斯垃圾邮件识别

电子邮件是互联网的一项重要服务,在大家的学习、工作和生活中会广泛使用。而朴素贝叶斯算法在垃圾邮件识别任务上一直表现非常好,至今仍然有很多系统在使用朴素贝叶斯算法作为基本的垃圾邮件识别算法。的中文垃圾邮件数据集,目录解压后包含三个文件夹,其中data目录下是所有的邮件(未分词),已分词好的邮件在data_cut目录下。使用朴素贝叶斯算法完成垃圾邮件的分类与预测,要求测试集准确率Accuracy、精准率Precision、召回率Recall均高于0.9(本次实验可以使用已有的一些工具包完成如sklearn);

2024-12-11 11:24:14 360

原创 【驭风计划 机器学习】实验2 基于回归分析的大学综合得分预测

大学排名是一个非常重要同时也极富挑战性与争议性的问题,一所大学的综合实力涉及科研、师资、学生等方方面面。目前全球有上百家评估机构会评估大学的综合得分进行排序,而这些机构的打分也往往并不一致。在这些评分机构中,世界大学排名中心(Center for World University Rankings,缩写CWUR)以评估教育质量、校友就业、研究成果和引用,而非依赖于调查和大学所提交的数据著称,是非常有影响力的一个。

2024-12-11 11:20:47 265

原创 【驭风计划 机器学习】实验1 基于决策树的英雄联盟游戏胜负预测

在游戏中,每位玩家控制一位有独特技能的英雄,红蓝两支队伍各有五位玩家进行对战,目标是摧毁对方的基地水晶。对战过程中一般没有己方单位在附近的地点是没有视野的,即无法看到对面单位,双方可以通过使用守卫来监视某个地点,洞察对面走向、制定战术。这些特征包括英雄击杀、死亡,金钱、经验、等级情况等等。作为最成功的电子竞技游戏之一,对局数据、选手数据的量化与研究具有重要意义,可以启发游戏将来的发展和改进。第一次作业也是一个机器学习小实验的例子,之后的作业可能不再提供预处理等流程代码,由同学们自己设计实验完成代码编写。

2024-12-11 11:11:58 180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除