- 博客(72)
- 收藏
- 关注
原创 fastapi实现文件下载链接
浏览器访问http://ip:8001/download/content1.pdf即可下载文件。假设文件夹D:/codes/files下有个content1.pdf。
2025-02-15 12:30:59
285
原创 Linux执行一条命令并自动重试直到成功,自动化脚本
方式二:保存日志到指定路径,退出终端时运行不中断。i 插入模式,编辑文件。esc 退出编辑模式。
2025-02-14 23:20:25
369
原创 Docker Compose安装milvus向量数据库单机版-milvus基本操作
下面演示如何使用PyMilvus库连接到Milvus数据库,创建数据表,插入数据,创建索引,进行搜索、查询、分页查询,以及删除数据表等操作。“params”: 这是一个包含搜索参数的字典,包括 “nprobe” 参数,它指定了搜索时的候选集数量,这里设置为10。“params”: 这是一个包含索引参数的字典,包括 “nlist” 参数,它指定了索引的列表数量,这里设置为128。指定了返回结果的最大数量,只返回满足条件的前4条数据,并指定了要返回的输出字段为 “random”。
2023-11-06 09:27:46
2483
原创 绘制核密度估计图
核密度估计图(Kernel Density Estimation,KDE)是一种用于估计数据分布的非参数方法,通常用于可视化和理解数据的分布情况。它通过平滑地估计数据的概率密度函数(PDF)来显示数据的分布特征,尤其在连续变量上非常有用。KDE图通常表现为一条平滑的曲线,描述了数据在特定值附近的密度。这条曲线称为核密度估计。核密度估计是通过将每个数据点视为一个小的概率分布(通常是高斯分布或其他核函数)并将它们叠加而得到的。这样,核密度估计提供了一个对数据分布的连续估计,而不仅仅是一个直方图或散点图。
2023-10-21 14:31:23
9275
3
原创 协同过滤推荐算法UserCF、ItemCF
cosine相似度计算简单方便,一般较为常用。但是,当用户的评分数据存在 bias 时,效果往往不那么好。
2023-10-20 18:18:23
444
原创 shap-An introduction to explainable AI with Shapley values
shap-An introduction to explainable AI with Shapley values
2023-09-24 17:06:26
567
2
原创 shap-Basic SHAP Interaction Value Example in XGBoost
`SHAP值`(Shapley Additive exPlanations)的主要思想就是Shapley值,Shapley值是一个来自合作博弈论(coalitional game theory)的方法,
2023-09-24 10:41:51
1222
原创 conda创建虚拟环境安装aix360
windows下在用户文件夹下.condarc,注意该文件是隐藏文件,pip文件夹下创建pip.ini配置文件。进入到用户文件夹,创建pip文件夹。
2023-09-23 10:20:28
431
1
翻译 Supported Model Frameworks/Formats - KServe
supported model frameworks/formats-kserve
2023-09-09 22:51:21
2221
原创 黑马大数据学习笔记5-案例
聊天平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对聊天数据的统计分析,可以更好的对用户构建精准的用户画像,为用户提供更好的服务以及实现=高ROI==的平台运营推广,给公司的发展决策提供精确的数据支撑。我们将基于一个社交平台App的用户数据,完成相关指标的统计分析并结合BI工具对指标进行可视化展现。FineBI 是帆软软件有限公司推出的一款商业智能(Business Intelligence)产品。
2023-08-06 23:47:18
1285
原创 大数据02-HDFS的使用和基本命令
HDFS(Hadoop Distribute File System)是大数据领域一种非常可靠的存储系统,它以分布式方式存储超大数据量文件,但它并不适合存储大量的小数据量文件。同时HDFS是Hadoop和其他组件的数据存储层,运行在由价格廉价的商用机器组成的集群上的,而价格低廉的机器发生故障的几率比较高,因此HDFS在设计上采取了多种机制,在硬件故障的情况下保障数据的完整性。兼容廉价的硬件设备: 实现在硬件故障的情况下也能保障数据的完整性流数据读写:不支持随机读写的操作大数据集。
2023-02-19 00:01:13
3222
原创 大数据01-Hadoop3.3.1伪分布式安装
Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce。
2023-02-14 16:01:23
1173
原创 计算机组成原理(第三版)唐朔飞-第六章计算机的运算方法-课后习题(17-32)
计算机组成原理(第三版)唐朔飞-第六章计算机的运算方法-课后习题(17-32)
2022-10-08 16:07:36
112299
30
原创 计算机组成原理(第三版)唐朔飞-第六章计算机的运算方法-课后习题(1-16)
计算机组成原理(第三版)唐朔飞-第六章计算机的运算方法-课后习题(1-16)
2022-10-07 13:03:25
75030
28
原创 计算机组成原理(第三版)唐朔飞-第七章指令系统-课后习题
机器字长是指CPU一次能处理数据的位数通常与CPU的寄存器位数有关。指令字长是指机器指令中二进制代码的总位数。存储字长是指存储单元中存放二进制代码的总位数。三者可以相等也可以不等视不同机器而定。答:OP(4位)A1(6位)A_1(6位)A1(6位)A2(6位)A_2(6位)A2(6位)设二地址指令格式为该指令系统的基本格式,4位操作码共有16种编码,其中13种用来定义二地址指令,还剩3种可用作扩展标志。一地址指令条数=3∗26=192。
2022-10-05 23:54:38
68090
25
原创 SQL学习笔记6-决胜秋招
数据倾斜就是:由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点,常见现象是:任务进度长时间维持在 99%或者 100%的附近,查看任务监控页面,发现只有少量 reduce 子任务未完成,因为其处理的数据量和其他的 reduce 差异过大。使用 map join 解决小表(记录数少)关联大表的数据倾斜问题,这个方法使用的频率非常 高,但如果小表很大,大到 map join 会出现 bug 或异常,这时就需要特别的处理。每位员工都有一个Id,并且还有一个对应主管的Id(ManagerId)。
2022-09-26 19:11:41
687
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人