欠自己的总结

   就像题目所说的,今天的这篇日志是我欠自己的。

从这学期刚开学开始,就一直想找个时间整理一下思绪,整理一下生活的秩序,可是都因为各种原因耽搁了,直到现在,收到腾讯二面被刷的通知,有些低落,然后联想到很多事情,想了半天,觉得自己现在的生活混乱的很,一点节奏都没有,想做的事情,在做的事情没有一件做好的,做完整的。突然就感觉不能再这样下去了,写此日志作为一个总结,告别那些混乱,见证我以后的努力。

先得从去年说起吧,因为国创。。。。还记得当时开始准备国创的情景,一直都觉得自己很幸运,完全没有任何的基础情况下,找到了优秀的队友,有了研究课题,指导老师。。。这一切得来不费功夫。也记得自己当时什么都不懂,不知道VMware,不知道html,不懂<a></a>,C语言忘的一塌糊涂,甚至都忘了怎么单步调试程序。。。。总之,很糟糕的自己,现在想想,好像过去的自己也不认为自己很糟糕,大概,人这类东西,就是要接触优秀的人,才会意识到自己有多差劲。

随后,自然而然的就暑假留校,开始干活,万事开头难不是白说的,那种茫然,那种不耐烦,那种没耐心,至今都记得特别清楚,在此,向队长说声对不起,要包容那时什么都不懂还又暴躁的我。大夏天的,西安的天气热的要死,没有洗澡的热水,导致大姨妈来的时候,肚子疼又加重了(在此插一句题外话,女程序员真的很苦逼,起码在身体上就比起男生差很多),疼的出了一身汗,脸色苍白,即使那样,中午回宿舍吃颗止疼药,背起电脑就又往实验室去了,是在忍不住了,就不去了,但是,是在床上裹着厚被子,疼的会昏睡过去,醒来继续疼。。。。宿舍就我一个人,想想都是很心酸的日子。暑假的磨难,也成就了日后的我,(当然不是说我现在有多么优秀,只是相比当时自己真的优秀了)虽有将近两个月的时间,我们的进度不是很大(当然也有另外一个队友的原因),但是开头难总算过去了,磕磕碰碰的摸索到了解决问题的方法,(暑假有时候一天调一个程序,调将近100遍),暑假结束后,我们就陆续的做出了东西。一直到现在,还有一个半月就结束课题了。项目完成的还剩一点,但是不耽误进度,能及时完成。其实还是有一定成就感的。

当然,写这篇日志的目的不是来炫耀自己的那些苦难,那些提升。。。。

是来谩骂,鞭策自己的。。。。。

说说那些自己半途而废的事情:

java——这学期开了java的课程,但是不喜欢老师纯理论的上课方式,决定自学,于是信心满满的开始边看书,边记笔记,边编程。。。。可是却没有持久下来,或许会因为一些东西耽误了,但是那不是借口,因为我自己知道,我是有时间去做这些的,只是因为懒而没去做。到现在,反倒不如跟着老师听,也不至于连作业也不会做。。。。

php——也是这学期开始学的,因为觉得对web前端开发感兴趣,觉得有必要也一定得学php,下了韩顺平老师的视频(插一句,讲的真心不错),看了多一半吧,但是还剩1/3,也就半路放下了,到现在,我都不敢声称自己会php编程。。。。

javascript——都不好意思提了,以前学过一些,但是并不系统。从寒假就想重新学了。。。。一直都没学。。。

再说说那些想做却没做的事:

从腾讯笔试回来,真心觉得自己的基础太差了,数据结构完全不会了,很多基础性的东西,都很模糊了,所以想找时间把数据结构的书再好好看看

编程之美——也是随大众,说程序员必看的书,,,,可是一直看这看那的,那本书还没翻开过。。。。

旅行——很久之前就想去某个安静的小镇玩几天。。。可是国创那边,学校这边假期还不停的安排实验,以至于欠自己一次心灵的旅行。。。


总是这样,想做的事情很多,但是时间根本不够,而且自己还不好好用功,总是花费很多时间在宿舍宅着看电视,,,,,求鞭策。。。


于是。。。。于是

我指定了一下的计划:

1.java的学习,两个星期内把书看完。。。。。先把上机作业交了,最后的大作业可以慢慢做

2.用电脑用累了,可以看会数据结构的书,把那些没懂的好好研究一下

3.php,剩的也不多了,闲着不想学习的时候就看php的视频

4.javascript也是

腾讯的招聘也给了我很大的触动。。。。

一面的时候看到了自己的笔试试卷,100分满分,我得了20分,我也不嫌丢人,因为基础差是事实。

一面的面试官,真的很好,和他之间的谈话让我一点紧张感都没有,聊的很愉快,也学到了一些东西

二面的面试官,虽然比较严厉一下,但是一下子就把我对一些原理,基础性东西理解的不够好给暴露出来了。。。。。让我看到了自己本身的不足

总而言之,这次的招聘还是让我学到了很多的东西。。。。。


该说的也差不多说完了。。。。

fighting,要开始逆袭了!!!!!

生活,我爱你。。。。。。。。。。


先展示下效果 https://pan.quark.cn/s/a4b39357ea24 遗传算法 - 简书 遗传算法的理论是根据达尔文进化论而设计出来的算法: 人类是朝着好的方向(最优解)进化,进化过程中,会自动选择优良基因,淘汰劣等基因。 遗传算法(英语:genetic algorithm (GA) )是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。 进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择、杂交等。 搜索算法的共同特征为: 首先组成一组候选解 依据某些适应性条件测算这些候选解的适应度 根据适应度保留某些候选解,放弃其他候选解 对保留的候选解进行某些操作,生成新的候选解 遗传算法流程 遗传算法的一般步骤 my_fitness函数 评估每条染色体所对应个体的适应度 升序排列适应度评估值,选出 前 parent_number 个 个体作为 待选 parent 种群(适应度函数的值越小越好) 从 待选 parent 种群 中随机选择 2 个个体作为父方和母方。 抽取父母双方的染色体,进行交叉,产生 2 个子代。 (交叉概率) 对子代(parent + 生成的 child)的染色体进行变异。 (变异概率) 重复3,4,5步骤,直到新种群(parentnumber + childnumber)的产生。 循环以上步骤直至找到满意的解。 名词解释 交叉概率:两个个体进行交配的概率。 例如,交配概率为0.8,则80%的“夫妻”会生育后代。 变异概率:所有的基因中发生变异的占总体的比例。 GA函数 适应度函数 适应度函数由解决的问题决定。 举一个平方和的例子。 简单的平方和问题 求函数的最小值,其中每个变量的取值区间都是 [-1, ...
<think>好的,我现在需要回答用户关于采样的概念及其在数据处理或机器学习中的应用的问题。首先,我需要明确采样的定义,确保自己理解正确。采样通常用于处理类别不平衡的数据集,通过减少多数类样本的数量来平衡类别分布。不过,我得确认这个定义是否准确,是否需要查阅相关资料。 接下来,应用场景方面,用户可能想知道采样在哪些具体情况下有效。例如,在二分类问题中,当正负样本比例悬殊时,采样可以帮助模型更好地学习少数类的特征。但需要注意,采样可能会导致信息丢失,因此需要结合其他方法,如过采样或生成合成数据。 然后,我需要考虑用户可能的后续问题,比如采样的优缺点,或者与其他采样技术的比较。但根据当前问题,重点应放在定义和应用场景上。同时,用户提到数据科学和机器学习,因此需要结合这两个领域的实际案例来说明。 另外,用户提供的引用资料中有关于模型开发、评估指标和GPU加速的内容。虽然这些引用可能与采样没有直接关联,但可以尝试寻找间接联系。例如,引用[2]提到模型评估指标的选择,这可能与处理不平衡数据时的评估方法有关,但采样本身属于数据预处理步骤,可能在模型开发阶段应用,如引用[1]中的流水线处理部分。 还需要注意回答的结构,确保清晰分点,使用中文,并正确应用LaTeX格式。例如,数学公式需要用$...$或$$...$$包裹。此外,生成的相关问题需要与采样紧密相关,帮助用户深入理解。 最后,检查是否存在误解或遗漏。例如,采样不仅仅是随机删除样本,还有其他方法如NearMiss、Tomek links等,是否需要提及?可能简要提到方法,但详细技术可能属于扩展问题。 总结回答的结构: 1. 定义:解释采样是什么,使用数学表达示例。 2. 应用场景:列举几个主要场景,如分类任务中的类别不平衡,具体领域如金融欺诈检测。 3. 注意事项:讨论潜在问题及解决方案,如结合过采样。 4. 生成相关问题:涉及优缺点、方法比较、实际案例等。 确保引用适当,例如在提到模型开发时引用[^1],评估指标引用[^2],应用场景引用[^3],技术实现如GPU加速引用[^4](如果相关的话,但采样可能不直接涉及GPU加速,可能不需要此引用)。 现在开始组织语言,确保符合用户给定的格式要求,使用正确的LaTeX语法,并自然插入引用。</think>### 采样技术定义及应用场景 #### 1. 采样定义 采样(Undersampling)是一种处理类别不平衡问题的数据预处理技术,**通过减少多数类样本数量**,使不同类别样本分布接近均衡。其核心数学目标可表示为: $$N_{\text{majority}} \approx N_{\text{minority}}$$ 其中$N_{\text{majority}}$为调整后的多数类样本数,$N_{\text{minority}}$为原始少数类样本数[^2]。 #### 2. 核心方法 - **随机采样**:随机删除多数类样本(可能丢失重要信息) - **NearMiss**:基于距离度量选择与少数类相似的多数类样本 - **Tomek Links**:移除类别边界附近的噪声样本 #### 3. 应用场景 | 场景类型 | 具体案例 | 技术优势 | |------------------|------------------------------------|-----------------------------------| | 金融风控 | 信用卡欺诈检测(正常交易占比99%+) | 提升模型对1%欺诈交易的识别能力 | | 医疗诊断 | 罕见疾病筛查 | 避免模型偏向常见病例预测 | | 工业质检 | 缺陷产品检测 | 解决良品率过高导致的数据倾斜问题 | #### 4. 注意事项 - **信息丢失风险**:随机采样可能丢失重要特征,建议结合**SMOTE过采样**(生成合成样本) - **评估指标选择**:需使用**F1-score、AUC-ROC**代替准确率(Accuracy) - **流水线集成**:在MLOps框架中将采样步骤嵌入特征工程流水线[^1]
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值