
Python
文章平均质量分 86
从0开始
岁月无声-往事随风
已疯,嘿嘿
展开
-
Python学习从0开始——Kaggle实践可视化001
使用数据集:“Top Ranked Anime Dataset 2024”,文件名称是:toprankedanime.csv。原创 2024-07-05 15:25:58 · 1249 阅读 · 0 评论 -
Python学习从0开始——Kaggle深度学习002
与所有机器学习任务一样,我们从一组训练数据开始。训练数据中的每个示例都由一些特征(输入)和预期目标(输出)组成。训练网络意味着调整其权重,使其能够将特征转化为目标。例如,在80种谷物的数据集中,我们想要一个网络,它可以获取每种谷物的“糖”、“纤维”和“蛋白质”含量,并对该谷物的“卡路里”进行预测。如果我们可以成功地训练一个网络来做到这一点,它的权重必须以某种方式表示这些特征和训练数据中表达的目标之间的关系。除了训练数据,我们还需要两个东西:一个衡量网络预测好坏的“损失函数”。原创 2024-06-14 15:00:00 · 911 阅读 · 2 评论 -
Python学习从0开始——Kaggle时间序列002
线性回归擅长推断趋势,但无法了解相互作用。XGBoost擅长学习互动,但不能推断趋势。接下来将学习如何创建“混合”预测器,将互补的学习算法结合起来,让一种算法的优点弥补另一种算法的缺点。进行预测时可用的信息(特征)需要预测值的时间段(目标)预测的原点是你进行预测的时间点。实际上,你可能将预测原点视为当前预测的最后一个时间点的训练数据。直到预测原点之前的所有数据都可以用来创建特征。预测期限是你进行预测的时间段。我们常用预测期限中的时间步数来描述一个预测,例如“1步”预测或“5步”预测。原创 2024-06-13 18:45:00 · 1099 阅读 · 0 评论 -
Python学习从0开始——Kaggle时间序列001
时间序列的趋势分量表示该序列均值的持续、长期变化。趋势是一个序列中移动最慢的部分,它代表了最重要的时间尺度。在产品销售的时间序列中,随着越来越多的人逐年了解该产品,市场扩张可能会产生增长趋势。我们将关注均值的趋势,更一般地说,序列中任何持续和缓慢的变化都可以构成趋势——例如,时间序列通常在其变化中具有趋势。当一个时间序列的均值有规律的、周期性的变化时,我们就说这个时间序列具有季节性。季节的变化通常遵循时钟和日历——一天、一周或一年的重复是很常见的。原创 2024-06-13 18:30:00 · 1074 阅读 · 0 评论 -
Python学习从0开始——Kaggle特征工程001
特征工程的目标仅仅是使你的数据更适合手头的问题。考虑“表观温度”测量,如热指数和风寒。这些量试图根据空气温度、湿度和风速来测量人类感知的温度,这些都是我们可以直接测量的。你可以把表面温度看作是一种特征工程的结果,它试图使观察到的数据与我们真正关心的东西更相关:外界的实际感觉。执行特征工程来:提高模型的预测性能,减少计算或数据需求,提高结果的可解释性。首次遇到新数据集时,的第一步是,根据特征效用度量(衡量特征与目标之间关联性的函数)构建一个排名。原创 2024-06-13 18:00:00 · 1086 阅读 · 0 评论 -
Python学习从0开始——Kaggle计算机视觉001
)在训练过程中,卷积神经网络学习到的权重主要包含在卷积层中。这些权重我们称之为“核”(kernels),可以将它们表示为小数组。内核通过扫描图像并产生像素值的加权和来操作。通过这种方式,内核就像一个偏光透镜,强调或弱化某些信息模式。核定义了卷积层如何连接到后面的层。上面的核将输出中的每个神经元连接到输入中的九个神经元。通过使用kernel_size设置内核的维度,可以设置convnet如何形成这些连接。原创 2024-06-12 08:57:28 · 1456 阅读 · 0 评论 -
Python学习从0开始——Kaggle机器学习004总结2
分类变量(Categorical Variables)或称为类别变量,是那些具有离散值(或类别)的变量,而不是连续值。这些变量通常用于描述对象的属性或特征,其值通常是预定义的、有限的集合。例如调查多久吃一次早餐,并提供四个选项:“从不”,“很少”,“大多数天”或“每天”,在这种情况下,数据是分类的,因为响应属于一组固定的类别。如果将这些变量直接插入Python中的大多数机器学习模型且不进行预处理,则会出现错误。在此将比较用于准备分类数据的三种方法。1)删除分类变量。原创 2024-06-05 21:00:00 · 909 阅读 · 0 评论 -
Python学习从0开始——Kaggle机器学习003总结
在机器学习和深度学习中,过拟合(Overfitting)和欠拟合(Underfitting)是两种常见的问题,它们都与模型在训练数据上的表现和在未见过的测试数据上的泛化能力之间的关系有关。作为参考,验证数据中的平均房屋价值为110万,所以新数据的误差大约是平均房屋价值的四分之一。由于我们关心新数据的准确性,这是我们从验证数据中估计的,我们希望找到欠拟合和过拟合之间的最佳点。样本内数据的平均绝对误差约为500,样本外超过25万,这就是一个几乎完全正确的模型和一个不能用于大多数实际目的的模型之间的区别。原创 2024-06-03 18:30:00 · 1824 阅读 · 0 评论 -
Python学习从0开始——Kaggle深度学习001代码参考
【代码】Python学习从0开始——Kaggle深度学习001代码参考。原创 2024-05-22 18:15:00 · 895 阅读 · 0 评论 -
Python学习从0开始——Kaggle机器学习002代码参考
【代码】Python学习从0开始——Kaggle机器学习002代码参考。原创 2024-05-21 20:30:00 · 766 阅读 · 0 评论 -
Python学习从0开始——Kaggle机器学习001
kaggle可以在线调试运行模型,不用配置环境,有大量的数据集可以使用。登录后进入首页,选择初级课程的机器学习。一共7节,从第2节开始可以练习。注册登录,注册时页面会显示人机验证,如果没显示是被拦截了,在第2节末尾,点击下图任一一处进入编程页面。补全的代码参照课程内容。原创 2024-05-21 18:30:00 · 465 阅读 · 0 评论 -
Python学习从0开始——项目一day02数据库连接
1.mysql-connector 是 MySQL 官方提供的驱动器, 它在Python中重新实现MySQL协议,它比较慢,但不需要C库,可移植性好。2.pymysql是由纯python实现的mysql模块。它相对于mysql.connector, MYSQLdb来说比较年轻。它的效率和可移植性和my-connector理论上是差不多的。3.MySQLdb是一个围绕_mysql简化的Python包装器,不支持Python 3,_mysql依赖C库,MYSQLdb也依赖C库,可移植性不太好。原创 2024-04-23 18:00:00 · 1256 阅读 · 2 评论 -
Python学习从0开始——项目一day01爬虫(二)
再来观察’\x22’,我们能发现它是一个转义序列,用于表示一个ASCII值为0x22的字符,即双引号,Python会通过转义序列将其解释为双引号,这就造成实际上是双引号替换双引号,故输出不变。这时,我们需要关注re.search(),其返回结果是一个捕获组,可以通过group()来获取每一组的数据,group(1) 表示获取第一个捕获组的内容。看上方的捕获组输出,我们能明显的识别出这些数据具有统一的属性,直接截取字符串需要经过多次split或者replace,如果通过属性去获取值,会很便于我们操作。原创 2024-04-12 14:34:33 · 950 阅读 · 0 评论 -
Python学习从0开始——项目一day01爬虫
由以上可推:根据元素的唯一id:‘bd-home-content-album’可以找到’<div>‘标签内的所有’<a>‘标签,当前复制的’<a>‘标签是其父元素的第一个子’<a>'元素。问题找到了,根本原因是该div内的元素是在运行时动态渲染和加载的,造成我们通过浏览器访问是能看到该元素的,但是爬虫爬不到。键盘F12调出控制台,切换到Element标签页,组合键Ctrl+Shift+C选中合辑的图片,然后审查元素。以上报错是正常的,切换爬取网站后,页面元素的解析肯定会发生改变,接下来一步步修改解析。原创 2024-04-11 08:28:17 · 1329 阅读 · 0 评论 -
Python学习从0开始——专栏汇总
这个列表包含了用Python编写的各种各样的东西,包括库、工具、框架等。- 这个项目列出了用Python实现的各种"Hello World"程序。- 这个列表是为Python初学者准备的资源,包括教程、书籍、电子书等。- 这个项目列出了许多可以进行的Python项目想法。- 这个项目提供了Python中的小技巧和代码片段。- 这个网站提供了Python全栈开发的教程和资源。- 这个项目包含了Python中的高级技巧和技术。- 这个项目包含了用Python编写的各种小游戏。原创 2024-04-08 19:15:00 · 620 阅读 · 0 评论 -
Python学习从0开始——009类
任何形式为 __spam 的标识符(至少带有两个前缀下划线,至多一个后缀下划线)的文本将被替换为 _classname__spam,其中 classname 为去除了前缀下划线的当前类名称。实例对象的有效方法名称依赖于其所属的类。根据定义,一个类中所有是函数对象的属性都是定义了其实例的相应方法。因为方法在调用同一对象的其他方法时没有特殊权限,所以基类方法在尝试调用调用同一基类中定义的另一方法时,可能实际上调用是该基类的派生类中定义的方法。() 方法时,类的实例化操作会自动为新创建的类实例发起调用。原创 2024-04-07 20:00:00 · 626 阅读 · 0 评论 -
Python学习从0开始——008错误和异常
程序可以通过创建新的异常类命名自己的异常(Python 类的内容详见 类)。不论是以直接还是间接的方式,异常都应从 Exception 类派生。异常类可以被定义成能做其他类所能做的任何事,但通常应当保持简单,它往往只提供一些属性,允许相应的异常处理程序提取有关错误的信息。大多数异常命名都以 “Error” 结尾,类似标准异常的命名。许多标准模块定义了自己的异常,以报告他们定义的函数中可能出现的错误。某些对象定义了不需要该对象时要执行的标准清理操作。无论使用该对象的操作是否成功,都会执行清理操作。原创 2024-04-07 20:00:00 · 814 阅读 · 0 评论 -
Python学习从0开始——007输入与输出
mode 的值包括 ‘r’ ,表示文件只能读取;‘a’ 表示打开文件并追加内容,任何写入的数据会自动添加到文件末尾。mode 实参是可选的,省略时的默认值为 ‘r’。优点是子句体结束后,文件会正确关闭,即便触发异常也可以。str() 函数返回供人阅读的值,repr() 则生成适于解释器读取的值(如果没有等效的语法,则强制执行 SyntaxError)。在字符串开头的引号/三引号前添加 f 或 F,在 { } 字符之间输入变量名称或表达式。'w’模式调用该函数后,文件无则新建,有则覆盖。原创 2024-04-07 19:00:00 · 373 阅读 · 0 评论 -
Python学习从0开始——006模块
Python 把各种定义存入一个文件,在脚本或解释器的交互式实例中使用。这个文件就是 模块;模块中的定义可以 导入 到其他模块或 主 模块(在顶层和计算器模式下,执行脚本中可访问的变量集)。模块是包含 Python 定义和语句的文件。其文件名是模块名加后缀名 .py。在模块内部,通过全局变量name可以获取模块名(即字符串)。#fibo.pyprint()#终端'fibo'原创 2024-04-07 18:45:00 · 1248 阅读 · 0 评论 -
Python学习从0开始——005数据结构
not 的优先级最高, or 的优先级最低,因此,A and not B or C 等价于 (A and (not B)) or C。当比较不同类型的对象时,只要待比较的对象提供了合适的比较方法,就可以使用 < 和 > 进行比较。例如,混合的数字类型通过数字值进行比较,所以,0 等于 0.0,等等。元组是 immutable (不可变的),一般可包含异质元素序列,通过解包或索引访问(如果是 namedtuples,可以属性访问)。注意,创建空集合只能用 set(),不能用 {},{} 创建的是空字典。原创 2024-04-07 18:30:00 · 987 阅读 · 0 评论 -
Python学习从0开始——004版本升级和定义函数
main.pyreturn L#终端输出#默认值只计算一次。默认值为列表、字典或类实例等可变对象时,会产生与该规则不同的结果。[1][1, 2][1, 2, 3]#若不想共享默认值L = []return L#为参数指定默认值是非常有用的方式。调用函数时,可以使用比定义时更少的参数'):')', 2)')#输出ynlno。原创 2024-04-02 18:00:00 · 933 阅读 · 0 评论 -
Python学习从0开始——003控制流
【代码】Python学习从0开始——003控制流。原创 2024-04-01 18:00:00 · 261 阅读 · 0 评论 -
Python学习从0开始——002
输入’python -v’会输出输出很多关于模块导入的详细信息,这对于调试模块导入问题或理解Python的内部导入机制非常有用。会显示目前已安装的python版本号,可以看到版本为3.9.16。首先打开终端,然后调整一下终端界面,查看python的版本,输入。进入InsCode,打开工作台,在IDE中编辑。原创 2024-03-26 12:22:14 · 455 阅读 · 0 评论 -
Python学习从0开始——001
在Python中,断言(Assertion)是一种调试手段,用于在代码中设置检查点,确保程序在某一特定点满足某些预期条件。断言通常用于在开发和测试阶段捕获程序中的错误,但在生产环境中,由于性能考虑,断言可能会被禁用。Java的断言是通过assert关键字实现的,但默认情况下,断言是禁用的。所以该语句的作用是:做出判断,如果当前文件是作为主程序运行,则执行下面的代码块。百度一下,使用文心一言提供一个demo,然后加了一些注释,可以将以下代码直接放进main.py运行。是一个内置变量,它表示当前模块的名字。原创 2024-03-20 21:30:00 · 663 阅读 · 1 评论