自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 详解Flink滑动窗口的本质,以及解决数据断流导致水位线不增长的问题。

在工作中遇到这个问题,处理了几天,尝试了几种解决方案,现分享一版可行的方法。需求:从kafka读取用户行为日志,经过flink计算后向redis写入数据,使得业务侧可以查询到每个uid在过去1小时内的访问次数,做到秒级延迟。

2024-08-11 19:45:43 969 1

原创 Spark大数据技术详解

Spark是一个分布式计算引擎(框架)。分布式:多进程,多节点。

2024-07-21 22:54:56 1044

原创 解决HADOOP_HOME and hadoop.home.dir are unset.异常问题

我在Windows环境下 运行MapReduce程序时遇到这个异常,其原因是windows下的环境与Linux环境不同,而Hadoop一般基于Linux系统运行,因此需要一系列辅助程序才能运行。下载对应版本号的文件(找不到对应版本建议找最近版本),解压到任意目录下。

2024-07-06 18:14:38 1685 1

原创 超越传统调参:贝叶斯优化Optuna指南与实战

'''以LightGBM模型为例param_ranges表示需要搜索的超参数及其搜索范围params为不需要优化的超参数'''params = {'''objective函数是优化的核心,其返回值决定了优化目标,这里的返回值是测试集的平均预测误差MAE此处建议把MAE_on_trian、MAE_on_test、adjusted_params编写为训练日志输出,便于之后观察参数变化与目标值之间的关系,明确调优的方向'''# 获取模型# 拟合模型。

2024-01-21 23:31:21 1729

原创 图解LightGBM直方图算法、单边梯度采样算法(GOSS)

我近期研究了各种树模型,在理解LightGBM的直方图、GOSS单边梯度采样环节时都有些困难。我在网上找了很多资料,但大部分以文字为主,且非常抽象,理解起来十分困难。因此我想通过画图、画表、举例子的方式,具体解释一下LightGBM的直方图算法和GOSS算法。本文旨在以图表化的方式展现直方图算法和GOSS算法的具体过程,因此不涉及任何数学推导和代码内容。如果有小伙伴对梯度提升树、xgboost、LightGBM的概念还比较陌生,建议先补充相关知识。

2023-11-15 07:04:27 1582

原创 从原理到实战详解K-means算法:手撕代码不再依赖sklearn、详解轮廓系数如何找到最佳k个质心数、压缩图像实战。

如何不依赖sklearn库实现k-means算法?如何使用sklearn实现k-means算法?如何确定k=?如何运用k-means算法压缩图像?

2023-11-01 06:43:23 895

原创 详解Softmax多分类算法及交叉熵(Cross-Entropy)成本函数(附代码实现、计算过程、公式)

Softmax 是一个用于多类别分类问题的激活函数,它通常用于神经网络的输出层。Softmax 函数将一个实数向量转换为概率分布,其中每个元素表示一个类别的概率。简单来说,Softmax的输出代表了一个样本属于某一类别的概率。:Softmax 将输入转换成一个概率分布,其中每个元素表示相应类别的概率。这意味着所有输出元素的总和将等于 1。:Softmax 常用于多类别分类问题,其中有多个互斥的类别需要被分配概率。图中,an代表了该y=n的概率预测。

2023-10-26 20:51:24 2765 1

原创 Python - 用递归实现遍历目录下的所有文件名

【代码】Python - 用递归实现遍历目录下的所有文件名。

2023-10-14 17:41:22 561 1

原创 R - 时间序列数据的预测——指数平滑法(一次、二次、三次)详解附代码与公式

指数平滑法(Exponential Smoothing)是一种时间序列分析方法,用于处理时间序列数据的平滑和预测。它的核心思想是基于过去的观测值来预测未来的值,同时对过去的数据赋予不同的权重,最近的观测值被赋予更大的权重,从而捕捉到时间序列的趋势和季节性模式。指数平滑法的参数有3个——alpha、beta、gamma,分别对应数据、趋势、季节性。注意:参数值可以手动设定,参数值越大则模型越看重近期数据。若不设定参数,则软件会根据最大似然法计算得出参数值。

2023-10-14 06:20:03 15074 1

原创 Python - 用C指针理解Python的可变类型与不可变类型的底层原理

先来看一段代码:如果不从指针的角度出发,上述代码的逻辑似乎正确:我先创建一个list,再拷贝一份副本list_copy,然后再对副本进行修改。但是结果却是对“副本”的修改导致了“主本”的原数据也发生了变化。这种错误常见于:当得到了某个对象,希望对其内部某个值进行操作,但又不想令其本身发生变化时,或许就会步入这种“临时拷贝副本”的语法错误中。这里先放结论:可变类型指内存内容可以被原地修改的数据类型,不可变类型指内存内容不可以被原地修改的数据类型。常见的可变类型:列表list, 字典dictionary,

2023-09-23 16:25:52 165 1

原创 如何解决datepicker时间选择器在模态框中错位的问题(同时应用了markdown编辑器时)

今天在遇到这么一个问题:我在模态框中同时应用了markdown编辑器与datepicker时间选择器,但是每次在点击时间输入框时,markdown编辑器总是会被重新加载,导致模态框跳转回最顶部,因此时间选择框与输入框就处在了分离的位置:我原本的方法是在button标签属性中实现与模态框的绑定,而在模态框显示时,使用回调函数来执行markdown的初始化函数(因为如果在加载页面时就初始化markdown,则会出现无法输入文字的情况)。代码如下:此处尝试过将datepicker初始化过程封装成函数,与in

2023-09-18 01:28:55 246

原创 jQuery & Django - 如何为ModelForm循环生成的button标签绑定同一点击事件

使用$('#button_id')的方法寻找id,只能实现为第一个button绑定点击事件,因为jQuery中通过$匹配标签id的方法默认仅寻找第一个。使用Django的ModelForm组件生成button按钮标签,需求是:点击每一个button按钮都绑定同一点击事件,并弹出模态框。通过$('.btnEdit')就可以寻找到所有class为btnEdit的button,为其绑定同一个点击事件。解决方法:通过寻找class的方式。

2023-09-06 23:15:54 215 1

原创 Django - 如何解决把图片加载到html中出现裂图的情况

第二步:确保django.contrib.staticfiles已经注册在setting.py文件中。将本地的静态文件写入html中,出现图片加载不出的情况(出现裂图的图标)第一步:确保static文件夹存在与templates同级的目录下。第三步:确认setting.py文件中定义了STATIC_URL。

2023-08-30 06:28:58 945 1

原创 Python - 5行代码实现递归计算斐波那契数列

递归计算斐波那契数列

2023-07-27 16:59:47 234 1

原创 初识Socket网络编程——用Python实现一个服务端与一个客户端之间的通信

【代码】初识Socket网络编程——用Python实现一个服务端与一个客户端之间的通信。

2023-07-25 21:54:28 212

原创 Python中定义类对象时 __str__ 的用法

定义类对象时__str__方法的使用

2023-07-25 16:43:27 215

原创 安装Pymysql时报错的解决方法

解决方法是通过pip install指令安装cryptography,注意不要在python内运行pip install指令。如果已经进入了python,应使用exit()指令以退出。此处原因是缺少sha256_password和caching_sha2_password这两种加密算法,导致连接数据库时无法验证密码。此处错误为调用创建Connection类对象conn时,传入参数password没有使用str格式。故此处注意密码要用" "引号。

2023-07-23 14:41:25 1213

原创 Python中的Bytes类型与Bytes()方法

当我们在Python中定义一个字符串时,通常使用的方法如下:通过这两个方法,我们得到2个类型为str的字符串对象>>> y = '甲乙丙'Bytes类型与str类型一样,都是Python内置的对象之一。Bytes类型以字节符的形式存储字符串,具体的构造方法就是在' '之前加上字母b:此时x1的类型就是bytes了>>> x1b'abc'但需要注意的是,以添加字母b的构造方法,仅支持ASCII码中对应的字符。>>> y1 = b'甲乙丙'那么如何构建类型为Bytes的中文字符串呢?

2023-07-19 17:11:29 1217 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除