自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

_Ronnie_的博客

博客等级

码龄6年

16
原创

25
点赞

135
收藏

5
粉丝

关注

私信

热门文章

分类专栏

机器学习 7篇
笔记 11篇
NLP 7篇
搜索
深度学习 2篇
Windows
Python 1篇
数据分析
Debug
刷题 2篇
Linux 1篇

最新评论

【笔记】Word2vec模型复现与PYTHONHASHSEED
杭州的平湖秋月: 补充一下：实际上是可以使用 os.environ 的，但是要在多进程中。下面例子中，就可以得到相同的 hash 结果： [code=python] import os import subprocess # 在多进程场景下，要先设置好 PYTHONHASHSEED，然后再启动多个 Python 进程。 os.environ["PYTHONHASHSEED"] = '2' proc = subprocess.call(['python', '-c', 'print(hash("foo"))']) proc = subprocess.call(['python', '-c', 'print(hash("foo"))']) [/code]
【笔记】Linux环境下使用tee记录python程序的标准错误输出stderr
桂花树下的猫: cmd |& tee log.txt 我这里为什么不行啊？报错sh: 1: Syntax error: "&" unexpected
数据归一化 MinMaxScaler
M_虚怀谷: 可以进行Z分数转换，进行归一化处理是为了在不同的特征之间能够进行比较，让数据具有可比性。
【笔记】logging in python/模板
北风之神c: 写得赞，博主用心了。此国产日志 https://github.com/ydf0509/nb_log 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。4、多进程日志切割安全，文件日志写入性能高 5、入参简单，能一键自动记录到多种地方. 相比 loguru 有10胜。 pip install nb_log 。
数据归一化 MinMaxScaler
_Ronnie_: 我是这么理解的：1）为了使得模型在测试集上有不错的泛化性，要保证你的测试集和训练集的数据分布（例如均值、方差）相近；2）如果两者数据分布一致，那么对于测试数据中的异常点，可以考虑将它的值压缩到范围之内；3）如果两者数据分布不一致，应该考虑的是调整你的数据（本文语境下就是调整你的scaler）并重新训练模型。：）

机器学习

关注

文章平均质量分 88

关注数：文章数：7 文章阅读量：20725 文章收藏量：111

作者: _Ronnie_

这个作者很懒，什么都没留下…

展开

专栏收录文章