
others
文章平均质量分 61
ac同学
快去学习!变得厉害一点鸭!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
seaborn画多条线如何修改颜色?默认的渐近色不清晰
在用seaborn画折线图时,一张图中的多条线颜色十分接近。如下图,根本看不清sns.lineplot有一个参数是palette,意思是“调色板????”。官网:https://seaborn.pydata.org/generated/seaborn.lineplot.html该参数可以为string、list、dict、或者是matplotlib.colors.Colormap举个例子:import pandas as pdimport matplotlib.pyplot as pltim原创 2021-07-22 17:22:47 · 9359 阅读 · 0 评论 -
Cramér’s V的公式、例子、SPSS
Cramér’s V – What and Why?https://www.spss-tutorials.com/cramers-v-what-and-why/#ref20Cramér’s V is a number between 0 and 1 that indicates how strongly two categorical variables are associated. Cramér’s V 是一个介于 0 和 1 之间的数字,表示两个分类变量的关联程度。If we’d like to翻译 2021-06-28 16:24:07 · 10465 阅读 · 2 评论 -
面经 阿里云算法工程师实习生(已拿offer)
先说一下本人的情况:本211硕985,有项目,论文在投在牛客网上找的和自己研究方向十分契合的岗位,内推下面列举了被问到的一部分问题,另一部分记不得了20210308:面试指导自我介绍简单问了和项目、个人亮点相关的几个问题20210309:技术一面(同事面)自我介绍介绍项目一你们的这一作品目前还在继续使用吗?介绍项目二这个项目的应用场景是什么?Pytorch和tensorflow两个框架的区别(同事做不是算法相关的,问的问题更多有关项目)20210310:技术二面(leader面)原创 2021-04-17 21:02:11 · 1647 阅读 · 5 评论 -
intra-class与inter-class的区别
“inter” means “between” or “among”.“intra” means “within”.从international(国际的)和intranational(国内的)的角度来思考。第一个是“跨多个国家”,第二个是“在一个国家内”。 在涉及尝试将样本分配给类别的许多问题中,目标是最大化类别间的差异,并最小化类别内的差异。也就是说,每个类别中的样本必须尽可能相似,而不同类别中的样本必须尽可能不同。参考:https://www.quora.com/Whats-the-differe原创 2021-04-17 11:40:06 · 6984 阅读 · 0 评论 -
面试相关 交叉验证
面试被问到交叉验证,今天花了点时间整理了一下交叉验证相关的知识交叉验证:N折交叉验证有两个用途:模型评估(周志华《机器学习》p24)和模型选择。模型评估可以看成是模型选择过程中的一个步骤:先对候选的每个模型进行评估,再选出评估表现最好的模型作为最终模型。把这种策略用于划分训练集和测试集,就可以进行模型评估;把这种策略用于划分训练集和验证集,就可以进行模型选择。交叉验证的核心思想:对数据集进行多次划分,对多次评估的结果取平均,从而消除单次划分时数据划分得不平衡而造成的不良影响。因为这种不良影响在小规模数原创 2021-03-31 16:03:47 · 1277 阅读 · 4 评论 -
面试相关 生成模型与判别模型的定义和优缺点
生成模型和判别模型**生成模型:**由数据学习联合概率分布 P(X,Y)P(X,Y)P(X,Y),然后利用贝叶斯定理 P(Y∣X)=P(X,Y)/P(X)P(Y|X)=P(X,Y)/P(X)P(Y∣X)=P(X,Y)/P(X),求出条件概率分布 P(Y∣X)P(Y|X)P(Y∣X) 作为预测的模型。基本思想是首先建立样本的联合概率密度模型 P(X,Y)P(X,Y)P(X,Y),然后再得到后验概率 P(Y∣X)P(Y|X)P(Y∣X),再利用它进行分类。这个过程中还得先求出 P(X)P(X)P(X),P(X原创 2021-03-28 14:44:17 · 1065 阅读 · 2 评论 -
TCP的拥塞控制方法
最近找实习发现面试官们很喜欢问这个问题,印象中本科大二时的计算机网络那本书写得很详细,找来看了看便有了如下的梳理:TCP进行拥塞控制的算法有四种:慢开始、拥塞避免、快重传和快恢复。1.慢开始和拥塞避免发送方维持一个叫做拥塞窗口cwnd(congestion window)的状态变量。拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口。慢开始:当主机开始发送数据时,由于并不清楚网络的负荷情况,所以如果立刻把大量数据字节注入到网络,就可能引起网络发生拥塞。先探测一下原创 2021-03-25 10:58:57 · 2187 阅读 · 0 评论 -
什么是张量?
张量的通俗理解:https://www.cnblogs.com/abella/p/10142935.html转载 2020-05-21 14:53:11 · 275 阅读 · 0 评论 -
特征工程(Feature Engineering)VS表示学习(Representation Learning)
特征工程(Feature Engineering)“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。从数学的角度来看,特征工程就是去设计输入变量X。在机器学习时代,如果需要对Input进行表...原创 2020-05-05 10:58:43 · 1344 阅读 · 0 评论 -
中山大学2019年研究生复试机试题目(数据科学与计算机学院)
\qquad本人在2019年9月参加了中山大学数据科学与计算机学院的推免面试,将模拟机试的题目记录如下。(正式机试时有原题出现)\qquad详细内容已放进网盘,需要的伙伴自取:\qquad链接:https://pan.baidu.com/s/1RH-BxwKf43ezAHQwgNY1fQ\qquad提取码:5u6h...原创 2020-03-13 23:31:41 · 2853 阅读 · 5 评论 -
信息熵、信息增益与信息增益率
信息熵、信息增益与信息增益率信息熵、信息增益与信息...转载 2020-03-10 20:57:15 · 517 阅读 · 0 评论 -
csdn中编写公式
Cmd Markdown 公式指导手册转载 2020-03-09 13:58:48 · 242 阅读 · 0 评论