蓝净云-优快云博客

下面演示如何使用PyMilvus库连接到Milvus数据库，创建数据表，插入数据，创建索引，进行搜索、查询、分页查询，以及删除数据表等操作。“params”: 这是一个包含搜索参数的字典，包括 “nprobe” 参数，它指定了搜索时的候选集数量，这里设置为10。“params”: 这是一个包含索引参数的字典，包括 “nlist” 参数，它指定了索引的列表数量，这里设置为128。指定了返回结果的最大数量，只返回满足条件的前4条数据，并指定了要返回的输出字段为 “random”。

2023-11-06 09:27:46 2483

原创计算文本相似度，输出相似度最高的n个

【代码】计算文本相似度，输出相似度最高的n个。

2023-10-26 17:25:05 925

原创 PCA降维可视化

【代码】PCA降维可视化。

2023-10-21 14:52:47 406

原创绘制核密度估计图

核密度估计图（Kernel Density Estimation，KDE）是一种用于估计数据分布的非参数方法，通常用于可视化和理解数据的分布情况。它通过平滑地估计数据的概率密度函数（PDF）来显示数据的分布特征，尤其在连续变量上非常有用。KDE图通常表现为一条平滑的曲线，描述了数据在特定值附近的密度。这条曲线称为核密度估计。核密度估计是通过将每个数据点视为一个小的概率分布（通常是高斯分布或其他核函数）并将它们叠加而得到的。这样，核密度估计提供了一个对数据分布的连续估计，而不仅仅是一个直方图或散点图。

2023-10-21 14:31:23 9275 3

原创协同过滤推荐算法UserCF、ItemCF

cosine相似度计算简单方便，一般较为常用。但是，当用户的评分数据存在 bias 时，效果往往不那么好。

2023-10-20 18:18:23 444

原创从零开始搭建第一个django项目

django

2023-10-18 11:27:57 952

原创 shap-An introduction to explainable AI with Shapley values

shap-An introduction to explainable AI with Shapley values

2023-09-24 17:06:26 567 2

原创 shap-Basic SHAP Interaction Value Example in XGBoost

`SHAP值`（Shapley Additive exPlanations）的主要思想就是Shapley值，Shapley值是一个来自合作博弈论（coalitional game theory）的方法，

2023-09-24 10:41:51 1222

原创 AIX360-CEMExplainer: MNIST Example

CEMBexplainer:MNIST示例官方代码在。

2023-09-23 19:06:35 290

原创 aix360-gec

记录一下学习过程，官方的代码在。

2023-09-23 14:58:01 239

原创 conda创建虚拟环境安装aix360

windows下在用户文件夹下.condarc，注意该文件是隐藏文件，pip文件夹下创建pip.ini配置文件。进入到用户文件夹，创建pip文件夹。

2023-09-23 10:20:28 431 1

翻译 Supported Model Frameworks/Formats - KServe

supported model frameworks/formats-kserve

2023-09-09 22:51:21 2221

原创黑马大数据学习笔记5-案例

聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对聊天数据的统计分析，可以更好的对用户构建精准的用户画像，为用户提供更好的服务以及实现=高ROI==的平台运营推广，给公司的发展决策提供精确的数据支撑。我们将基于一个社交平台App的用户数据，完成相关指标的统计分析并结合BI工具对指标进行可视化展现。FineBI 是帆软软件有限公司推出的一款商业智能（Business Intelligence）产品。

2023-08-06 23:47:18 1285

原创黑马大数据学习笔记4-Hive部署和基本操作

Hive部署和基本操作

2023-08-06 12:19:32 2970

原创黑马大数据学习笔记3-MapReduce配置和YARN部署以及基本命令

MapReduce配置和YARN部署以及基本命令

2023-07-30 23:21:35 5095 1

原创黑马大数据学习笔记2-HDFS基本操作

HDFS基本操作

2023-07-17 11:56:18 1522

原创黑马大数据学习笔记2-HDFS环境部署

HDFS环境部署

2023-07-11 15:09:02 2710

原创黑马大数据学习笔记0-环境配置

黑马

2023-07-09 16:58:33 1134

原创大数据02-HDFS的使用和基本命令

HDFS(Hadoop Distribute File System)是大数据领域一种非常可靠的存储系统，它以分布式方式存储超大数据量文件，但它并不适合存储大量的小数据量文件。同时HDFS是Hadoop和其他组件的数据存储层，运行在由价格廉价的商用机器组成的集群上的，而价格低廉的机器发生故障的几率比较高，因此HDFS在设计上采取了多种机制，在硬件故障的情况下保障数据的完整性。兼容廉价的硬件设备: 实现在硬件故障的情况下也能保障数据的完整性流数据读写：不支持随机读写的操作大数据集。

2023-02-19 00:01:13 3222

原创大数据01-Hadoop3.3.1伪分布式安装

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，为用户提供了系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的，具有很好的跨平台特性，并且可以部署在廉价的计算机集群中。Hadoop的核心是分布式文件系统HDFS（Hadoop Distributed File System）和MapReduce。

2023-02-14 16:01:23 1173

原创计算机组成原理（第三版）唐朔飞-课后习题（完整版）

计算机组成原理（第三版）唐朔飞-课后习题（完整版）

2022-10-15 22:15:12 279803 40

原创计算机组成原理（第三版）唐朔飞-第五章输入输出系统-课后习题

计算机组成原理（第三版）唐朔飞-第五章输入输出系统-课后习题

2022-10-15 22:14:14 57348 11

原创计算机组成原理（第三版）唐朔飞-第三章系统总线-课后习题

计算机组成原理（第三版）唐朔飞-第三章系统总线-课后习题

2022-10-15 18:46:22 59357 13

原创计算机组成原理（第三版）唐朔飞-第四章存储器-课后习题

计算机组成原理（第三版）唐朔飞-第四章存储器-课后习题

2022-10-14 16:45:55 151977 47

原创计算机组成原理（第三版）唐朔飞-第九章控制单元的功能-课后习题

计算机组成原理（第三版）唐朔飞-第九章控制单元的功能-课后习题

2022-10-13 22:53:20 38933 16

原创计算机组成原理（第三版）唐朔飞-第十章控制单元的设计-课后习题

计算机组成原理（第三版）唐朔飞-第十章控制单元的设计-课后习题

2022-10-13 18:15:21 27073 16

原创计算机组成原理（第三版）唐朔飞-第八章CPU的结构和功能-课后习题

8.1CPU有哪些功能?画出其结构框图并简要说明每个部件的作用。

2022-10-11 19:23:04 51643 5

原创计算机组成原理（第三版）唐朔飞-第一章第二章-课后习题

计算机组成原理

2022-10-10 22:45:10 65416 26

原创计算机组成原理（第三版）唐朔飞-第六章计算机的运算方法-课后习题(17-32)

计算机组成原理（第三版）唐朔飞-第六章计算机的运算方法-课后习题(17-32)

2022-10-08 16:07:36 112299 30

原创计算机组成原理（第三版）唐朔飞-第六章计算机的运算方法-课后习题(1-16)

计算机组成原理（第三版）唐朔飞-第六章计算机的运算方法-课后习题(1-16)

2022-10-07 13:03:25 75030 28

原创计算机组成原理（第三版）唐朔飞-第七章指令系统-课后习题

机器字长是指CPU一次能处理数据的位数通常与CPU的寄存器位数有关。指令字长是指机器指令中二进制代码的总位数。存储字长是指存储单元中存放二进制代码的总位数。三者可以相等也可以不等视不同机器而定。答：OP(4位)A1(6位)A_1(6位)A1(6位)A2(6位)A_2(6位)A2(6位)设二地址指令格式为该指令系统的基本格式，4位操作码共有16种编码，其中13种用来定义二地址指令，还剩3种可用作扩展标志。一地址指令条数=3∗26=192。

2022-10-05 23:54:38 68090 25

原创 SQL学习笔记6-决胜秋招

数据倾斜就是：由于数据分布不均匀，造成数据大量的集中到一点，造成数据热点，常见现象是：任务进度长时间维持在 99%或者 100%的附近，查看任务监控页面，发现只有少量 reduce 子任务未完成，因为其处理的数据量和其他的 reduce 差异过大。使用 map join 解决小表(记录数少)关联大表的数据倾斜问题，这个方法使用的频率非常高，但如果小表很大，大到 map join 会出现 bug 或异常，这时就需要特别的处理。每位员工都有一个Id，并且还有一个对应主管的Id（ManagerId）。

2022-09-26 19:11:41 687

空空如也

空空如也