- 博客(65)
- 收藏
- 关注
原创 算法 (ALGORITHMS)----第一章:导读
其实非常好理解,算法无非就是一个计算过程。于是乎,算法分好坏,通过时间复杂度和空间复杂度来衡量。那么好的算法所带来的消耗则相对低,效率也就相对好,是不是很好理解呢。就好像一个输入X 要通过一个黑盒 输出Y,这个黑盒近似的来说可以看做一种算法,是不是对这个例子很熟悉呢,这不就是一个映射的关系吗?黑盒里面存在任意的操作,使得输入数据能够通过这些操作转化为期望输出的数据,这就是算法。
2025-03-22 01:55:28
189
原创 爬虫:爬取豆瓣电影
上篇我们将到如何利用xpath的规则,那么这一次,我们将通过案例来告诉读者如何使用Xpath来定位到我们需要的数据,就算你不懂H5代码是怎么个嵌套或者十分复杂的嵌套也没有关系,我们可以利用一些工具来帮助大家过渡这个艰难的过程。到这里基本就是拿下了可以看到这些电影对应的评分,赶快去尝试把,如果xpath记不住就多查资料巩固巩固。
2024-05-08 22:58:13
4167
原创 爬虫解析——Xpath
XPath是一种用于在XML文档中定位节点的语言,它可以用于从XML文档中提取数据,以及在XML文档中进行搜索和过滤操作。它是W3C标准的一部分,被广泛应用于XML文档的处理和分析。XPath使用路径表达式来描述节点的位置,这些路径表达式类似于文件系统中的路径。路径表达式由一个或多个步骤(step)组成,每个步骤描述了一个节点或一组节点。步骤可以使用关系运算符(如/和//)来连接,以便描述更复杂的节点位置。XPath还提供了一些内置函数和运算符,可以对XML文档中的数据进行操作和计算。
2024-04-18 00:09:45
481
原创 爬虫入门——Request请求
上一篇爬虫我们已经提及到了urllib库的使用,为了方便大家的使用过程,这里为大家介绍新的库来实现请求获取响应的库。以上就是今天要讲的内容,本文仅仅简单介绍了requests的使用,而提供了大量能使我们快速便捷地处理数据的函数和方法。大多数内容跟urllib是没太大区别的,甚至还精简很多,对于爬虫玩家来说是十分友好的,希望你能去尝试一下,巩固一下,这里再做一个预告,在下一次我们将介绍如何使用Xpath对爬到的源代码进行解析,来获取我们想要的内容,敬请期待吧。
2024-04-18 00:09:22
1159
原创 杂谈:关于机器学习
为了系统的学习机器学习,在之后的文章会推出有关机器学习的算法以及个人思路,先前在初探的时候已经粗略的解释了线性回归,后面我们从原理算法一并入手带给大家,至于讲过的数据分析和特征工程,有些地方确有粗糙,这是个人能力的不足请见谅,后面会引入案例更加清晰地通过方法解决问题。
2024-03-03 19:30:44
139
原创 Javascript:常量与数据类型
介绍完变量之后我们来对常量进行了解一番,关于常量我们需要知道些什么呢?希望对你能起到帮助,多多尝试,探索更多别有一番的天地。
2024-03-02 15:10:29
831
原创 Javascript:输入输出
Javascript作为运行浏览器的语言,对于学习前端的同学来说十分重要,那么从现在开始我们将开始介绍有关 Javascript。希望对您能有所帮助,坚持学习吧。
2024-02-29 21:16:27
525
原创 Linux shell : 梦开始的地方之Hello world
什么是shell脚本呢?简单来说就是将Linux系统的命令写入一个文件当中。而脚本文件的优势就是在于一旦编写完成,用户就可以自动完成脚本文件中的所有命令,而且,相同的脚本文件,可以多次反复的调用并执行,避免不必要的命令重复输入的工作。希望你能坚持下去学习,一些相关命令在下一篇展开。
2024-02-27 23:01:19
604
原创 牛客网:牛牛学数列
通过观察我们可以发现,每一项分母的变化有一个通式来决定,所以我们需要通过一个循环把每一项加起来之后被1除,而这只是其中的一项,然而每一项分母相加的个数是随着项数取决的,于是i要小于j,每一项的sum求和在新的一次循环当中要重置为0,以防被上一次的循环所影响。输入一个整数n,计算 1+1/(1-3)+1/(1-3+5)+...+1/(1-3+5-...((-1)^(n-1))*(2n-1))的值。输出一个浮点数,保留3位小数。更多精彩内容等你来来看。
2024-02-23 02:54:46
225
原创 Python进阶:函数式编程
函数式编程(Functional Programming)作为一种编程范式,近年来在软件开发领域备受关注。它强调将计算视为数学函数的评估,避免了可变状态和可变数据。本文将深入探讨函数式编程的核心概念、优势以及在现代软件开发中的应用。函数式编程是一种强大的编程范式,它通过纯函数、不可变性和高阶函数等核心概念为软件开发带来了许多优势。在当前软件工程日益复杂的环境下,函数式编程的理念为我们提供了一种更清晰、更健壮的编程方式。
2024-02-10 04:04:17
224
原创 特征工程:数据平衡
大多数情况下,使用的数据集是不完美的,会出现各种各样的问题,尤其针对分类问题的时候,会出现类别不平衡的问题。例如:在垃圾邮件分类时,垃圾邮件数据会有较少的样本量,从而导致两种类型的邮件数据量差别很大;在欺诈监测数据集中,往往包含的欺诈样本并没有那么多。处理这类数据集的分类的时候,需要对数据集的类不平衡问题进行处理。数据分析的整个过程的介绍就结束了,那接下来就是关于模型的选择与评估问题,只不过对数据分析着实重要,在之后的几篇当中,我们需要对数据分析有着更加细致的了解或者案例切入。
2024-02-10 03:57:58
589
原创 Python进阶:标准库
Python 的强大之处不仅在于其简洁易读的语法,还在于其丰富的标准库。标准库中包含了各种各样的模块和工具,涵盖了从文件操作到网络编程数据处理等各个方面的功能。本文将深入探讨 Python标准库的重要性、常用模块以及在实际开发中的应用场景。Python 标准库是 Python 编程中不可或缺的一部分,它为开发者提供了丰富的功能和工具,极大地提高了开发效率和代码质量。通过深入学习和灵活运用标准库中的各种模块,我们可以更加轻松地完成各种任务,实现各种功能,为 Python 开发增添更多的可能性。
2024-02-09 19:19:32
601
原创 Python进阶:迭代器生成器
在 Python 编程中,迭代器(Iterators)和生成器(Generators)是非常重要的概念,它们能够帮助我们处理大量数据、提高代码效率,并且在处理大型数据集时节省内存。本文将深入探讨迭代器和生成器的概念、用法以及在实际应用中的示例。迭代器和生成器是 Python 编程中非常强大和灵活的工具,它们可以帮助我们高效地处理大型数据集合,减少内存消耗,并且使代码更加简洁易懂。通过深入理解迭代器和生成器的概念和用法,我们可以写出更加优雅和高效的 Python 代码。
2024-02-09 19:15:32
156
原创 特征工程:特征提取和降维-下
通过上篇对线性与非线性的数据的特征提取和降维的学习之后,我们来介绍其他方法,分别有流行学习、多维尺度分析、t-SNE。
2024-02-08 00:33:34
881
原创 特征工程:特征提取和降维-上
前面介绍的特征选择方法获得的特征,是从原始数据中抽取出来的,并没有对数据进行变换。而特征提取和降维,则是对原始数据的特征进行相应的数据变换,并且通常会选择比原始特征数量少的特征,同时达到数据降维的目的。常用的数据特征提取和降维的方法有主成分分析,核成分分析,流行学习,t-SNE,多维尺度分析等方法。
2024-02-08 00:01:35
1144
原创 Python基础入门:标准输入输出
在Python编程中,标准输入(stdin)和标准输出(stdout)是至关重要的概念,它们提供了与程序外部环境进行交互的途径。本文将深入探讨Python中的标准输入输出,包括如何使用标准输入输出、标准流的工作原理以及一些高级技巧。标准输入输出是Python编程中不可或缺的部分,它们为程序提供了与用户和外部环境进行交互的接口。通过灵活运用标准输入输出,我们能够编写更加交互性强、功能丰富的Python程序。深入理解标准输入输出的原理和应用,对于提高程序的可读性、可维护性和可扩展性具有重要意义。
2024-02-07 00:57:09
756
原创 特征工程:特征选择
特征选择是使用某些特征统计的方法,从数据中选出有用的特征,把数据中无用的特征抛弃掉,该方法不会产生新的特征,常用的方法有基于统计方法的特征选择、利用地柜消除法选择有用的特征、利用机器学习算法选择重要的特征等。
2024-02-07 00:44:27
1476
原创 Python基础入门:异常处理
在Python编程中,异常处理是确保程序稳定性和可靠性的关键组成部分。异常是指在程序执行期间发生的意外事件,例如文件不存在、除零错误等。本文将深入探讨Python异常处理的机制、常见的异常类型、如何使用try和except语句以及一些高级的异常处理技巧。通过深入了解Python异常处理机制,开发者能够更好地应对不可预测的情况,提高程序的健壮性和可维护性。合理而灵活地运用异常处理是编写高质量Python代码的关键。
2024-02-06 15:55:43
417
原创 特征工程:特征构建
特征工程中的特征构建的主要目的是生成新的特征,而针对不同的特征,有多种方式可以形成新的特征,例如有针对分类特征、针对数值特征和针对文本特征对其进行生成新的特征。
2024-02-06 15:47:52
2206
原创 Python基础入门:文件操作
在Python这个强大而灵活的编程语言中,文件操作是一个至关重要的主题。无论是数据处理、配置管理还是日志记录,文件操作都扮演着至关重要的角色。本文将深入探讨Python中文件操作的各个方面,包括读取、写入、处理异常、以及一些高级的技术和最佳实践。通过全面而深入的探讨,读者将能够更好地理解Python中文件操作的方方面面,并能够在实际应用中更加灵活地使用这一重要的编程工具。文件操作不仅是编程的基础,更是构建各种应用的关键步骤,深入理解这一主题将使你能够更高效地处理数据、管理配置和记录日志。
2024-02-05 23:22:47
329
原创 特征工程:特征变换
特征工程作为机器学习数据准备的核心任务,我们应当重视这一部分的数据的处理工作,主要就是通过变换数据集的特征空间,从而提高数据集的预测模型性能。针对数据集的不同情况,我们可以有多种选择对数据集的特征工程进行处理,如:特征变换,特征构造,特征选择,特征提取或降维,又或者是数据平衡。那么接下来我们将对特征工程中的特征变换先做介绍。特征变换讲到这里就结束了,希望能够对你有帮助。
2024-02-05 16:22:28
1230
原创 数据探索与可视化:数据样本距离
接下来,我们进入数据探索与可视化的最后一个部分:数据样本距离。对于给定的数据样本,每个样本具有多个特征,因此每个样本均是高维空间的一个点,那么在高维空间当中如何比较样本之间的距离远近或相似程度是个重要的点。 距离在聚类分析,分类等多种应用中都有重要地位,不同的距离度量的方式可能会有不同的分析结果,那么接下来让我们来看看都有哪些: 欧式距离可解释为。欧式距离公式非常简单,使用勾股定理从这些点的计算距离。 缺点:尽管这是一种常用的距离度量,但欧式距离并的,这意味着所计算的距离可能会根据。通常,在使用欧式距离度量
2024-02-03 23:57:11
1036
原创 Python基础入门:模块和包
目录一.导读二.介绍 1.模块①创建和使用模块②命名空间和别名2.包①创建和使用包②包的嵌套三结尾 在Python中,模块(Module)和包(Package)是组织和管理代码的重要工具。它们使得代码更加模块化、可维护,同时也促进了代码的重用性和可扩展性。本文将深入探讨Python中模块和包的概念、用法以及它们在实际开发中的重要性。 在Python中,一个模块就是一个包含Python代码的文件,它可以包含变量、函数和类的定义。通过将相关功能组织在模块中,我们可以更好地管理和组织代码,使其更易读、易懂。 创
2024-02-03 13:45:00
293
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人