- 博客(111)
- 资源 (18)
- 问答 (1)
- 收藏
- 关注
原创 Data Agent是什么?一文讲清楚
摘要: DataAgent是基于大模型的智能数据分析助手,通过自然语言交互降低使用门槛,实现"开口即得"的数据查询与洞察。其核心技术包括自然语言转SQL/代码/API,支持智能建模、预测分析和自动化报表生成。相比传统BI工具,DataAgent具备主动性(异常预警)、智能性(AI算法集成)和适应性(个性化分析)三大特性。典型应用覆盖经营看板、销售预测、设备监控等场景,技术架构涵盖数据接入、智能分析和多模态交互层。评测需关注业务价值、性能可靠性及效率指标,未来将推动企业从"工具使
2025-11-25 17:16:20
1022
原创 每日一题DEEP_ML-卡方分布(Chi-Squared Distribution)
卡方分布是一种重要的概率分布,常用于统计推断中的假设检验和方差分析。其定义为k个独立标准正态变量平方和的分布,形状由自由度k决定:k=1时偏态明显,k增大时逐渐接近正态分布。卡方分布具有非负性,期望为k,方差为2k。主要应用于方差检验、拟合优度检验、独立性检验等统计场景。计算其概率密度需使用伽马函数,可通过Python代码实现。随着自由度增加,卡方分布会趋近于N(k,2k)的正态分布。
2025-08-26 23:40:39
523
原创 faiss上的GPU流程,GPU与CPU之间的联系
GPU使用流程分为初始化、数据加载、计算和优化四个阶段。首先初始化GPU资源并创建索引类型(如GpuIndexFlatL2)。数据从CPU内存传输到GPU显存后,通过并行计算构建索引并执行近邻搜索。FAISS优化了数据传输效率,支持多GPU并行和分片处理。结果返回CPU后清理资源。FAISS的GPU索引与CPU兼容,支持自动数据转换和PyTorch张量直接输入,同时提供灵活的资源管理和临时内存优化。支持的索引类型包括GpuIndexFlat、GpuIndexIVFFlat等,适用于不同精度需求。
2025-06-12 15:51:39
1042
原创 使用cmake安装faiss-GPU.so(无网或者内网情况下)
GPU使用流程主要包括安装NVIDIA驱动、CUDA Toolkit并配置环境变量,最后编译安装FAISS-GPU版本。首先通过nvidia-smi和nvcc -v验证驱动和CUDA安装,然后安装必要的开发工具和依赖库。在编译FAISS时需开启GPU支持,指定CUDA路径和架构,并处理测试依赖项。最后通过修改构建配置完成安装,可使用nvidia-smi监控GPU使用情况。整个过程需确保硬件、驱动、CUDA和软件环境的正确配置与兼容性。
2025-06-12 15:50:05
687
原创 最大似然估计(Maximum Likelihood Estimation, MLE)详解
最大似然估计(MLE)通过最大化观测数据的概率来估计参数。经典例子包括正态分布的均值/方差估计($\mu^=\frac{1}{n}\sum x_i$)和二项分布参数估计($p^*=k/n$)。在大模型(如GPT、BERT)中,MLE是损失函数(如交叉熵)的基础,但需结合正则化、优化算法(如Adam)应对过拟合和高维问题,并扩展至生成模型(如GAN)。其局限性(过拟合、非凸优化)通过贝叶斯方法、数据增强等技术缓解,成为统计学习与深度学习的核心方法论
2025-05-24 15:59:45
4287
原创 win11安装Joplin Server私有化部署(docker)
win11安装Joplin Server私有化部署,并且进入到joplin里面创建新的用户
2025-05-15 12:56:43
1528
原创 理解 DuckDB 的逻辑计划(Logical Plan)、优化器(Optimizer)和物理执行计划模块的工作流程
理解duckdb中的逻辑计划,优化器和物理执行的工作流程
2025-04-08 17:01:34
1238
原创 端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
端侧设备(如路由器、家庭网关、边缘计算盒子、工业网关等)的典型系统、硬件配置和内存大小
2025-03-28 16:04:03
923
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-4
分析测试代码,并以测试代码整理各个函数的调用栈,为后续的调用分析打下基础。
2024-11-27 17:10:20
1273
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-6
分析里面add流程,查看ivfsq训练得到了vmin和vdiff之后,如何对库中的向量如何进行处理
2024-11-27 16:35:07
455
原创 faiss库中ivf-sq(ScalarQuantizer,标量量化)代码解读-1
分解faiss源代码,帮助大家理解ivf-sq的流程以及ivf-sq转移到pgsql上进行重写
2024-11-25 16:23:02
1604
投资分析,那么我该怎么去全面了解一个行业和一家公司呢?
2025-11-24
线性代数中奇异值分解与特征值分解的理论及其在大模型中的应用解析
2025-05-24
南京大学数理逻辑考试内容
2025-01-28
南京大学软件学院专硕论文编写模板
2024-09-02
南京大学软件学院学硕论文编写模板
2024-09-02
Off-chaining Models and Approaches to Off-chain Computations
2022-01-29
用来查看AIGC的数字标注产业的前景
2024-07-10
用于解决Matlab路径的问题
2023-10-14
利用VMWare来部署Hyperledger Fabric
2023-10-09
南京大学服务器上搭建UOJ系统的保姆级步骤
2023-09-30
leetcode动态规划算法详细讲解
2023-08-29
高级算法-nju-onlineJudge-master-java和python的答案
2022-06-15
操作系统+软件工程+计算机网络相关PPT资源
2022-05-26
飞机大战源码地址--用于帮助初学者理解Java--java练手项目
2022-05-16
走向后量子区块链:抗量子计算攻击的区块链加密综述
2022-03-11
简洁非交互式零知识证明参数(zk-SNARKS),本文系统介绍了zk-SNARKS的数学理论,需要有一定的数学功底的人进行阅读
2022-03-28
研究生面临着选择研究方向的困难
2022-03-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅