
ML
文章平均质量分 76
一个处女座的程序猿
2025年初博主2本新书(机器学习耗时5年/大模型耗时3年)即将开售!人工智能硕学历,拥有十多项发专利(6项)和软著(9项),包括国际期刊SCI内多篇论文,多个国家级证书(2个国三级、3个国四级),曾获国内外“人工智能算法”竞赛(包括国家级省市级等,一等奖5项、二等奖4项、三等奖2项)证书十多项,以上均第一作者身份,并拥有省市校级个人荣誉证书十多项。目前也是国内知名博主,连续3年获优快云十大博客之星,荣获达摩院评测官、阿里社区/优快云/华为社区等十多个开发者社区专家博主荣誉,曾受邀阿里/华为/谷歌等社区采访-评审-论坛几十次。截止2022年,AI领域粉丝超100万,文章阅读量超5000万
展开
-
ML之LIME:基于boston波士顿房价数据集回归预测利用LIME/SP-LIME局部解释图/权重图结合RF随机森林模型实现模型事后解释案例之详细攻略实现
ML之LIME:基于boston波士顿房价数据集回归预测利用LIME/SP-LIME局部解释图/权重图结合RF随机森林模型实现模型事后解释案例之详细攻略实现目录基于boston波士顿房价数据集回归预测利用LIME/SP-LIME局部解释图/权重图结合RF随机森林模型实现模型事后解释案例相关文章ML之LIME:基于boston波士顿房价数据集回归预测利用LIME/SP-LIME局部解释图/权重图结合RF随机森林模型实现模型事后解释案例之详细攻略ML之LIME:基于boston波士顿房价数原创 2022-06-24 19:54:45 · 84 阅读 · 0 评论 -
TC之FL:可信计算之纵向联邦学习三种不同框架实战场景及其代码案例—基于自定义框架+采用LightGBM算法实现纵向联邦学习、基于tensorflow_federated库+采用神经网络算法实现纵向联
TC之FL:可信计算之纵向联邦学习三种不同框架实战场景及其代码案例—基于自定义框架+采用LightGBM算法实现纵向联邦学习、基于tensorflow_federated库+采用神经网络算法实现纵向联邦学习、基于PySyft库+采用线性模型实现纵向联邦学习目录可信计算之纵向联邦学习三种不同框架实战场景及其代码案例—基于自定义框架+采用LightGBM算法实现纵向联邦学习、基于tensorflow_federated库+采用神经网络算法实现纵向联邦学习、基于PySyft库+采用线性模型实现纵向联邦原创 2024-10-30 23:23:41 · 1279 阅读 · 0 评论 -
TC之FL:可信计算之联邦学习实战场景及其代码案例—基于联邦学习框架构建分布式评分卡模型—定义数据集→数据预处理→构建训练并评估算法模型→联邦平台获取模型参数→构建评分卡模型打分规则→执行打分
TC之FL:可信计算之联邦学习实战场景及其代码案例—基于联邦学习框架构建分布式评分卡模型—定义数据集→数据预处理→构建训练并评估算法模型→联邦平台获取模型参数→构建评分卡模型打分规则→执行打分目录可信计算之联邦学习实战场景及其代码案例—基于联邦学习框架构建分布式评分卡模型—定义数据集→数据预处理→构建训练并评估算法模型→联邦平台获取模型参数→构建评分卡模型打分规则→执行打分可信计算之联邦学习实战场景及其代码案例—基于联邦学习框架构建分布式评分卡模型—定义数据集→数据预处理→构建训练并评原创 2024-10-30 23:22:48 · 1310 阅读 · 0 评论 -
ML之数据隐私:多种数据隐私技术对比—对客户数据集执行差分隐私计算(添加噪声到查询结果/允许对用户数据进行统计分析而不泄露具体信息)、AES加密(对称加密/相同密钥解密后才能进行计算/用于数据传输和存
ML之数据隐私:多种数据隐私技术对比—对客户数据集执行差分隐私计算(添加噪声到查询结果/允许对用户数据进行统计分析而不泄露具体信息)、AES加密(对称加密/相同密钥解密后才能进行计算/用于数据传输和存储的保护)、同态加密(可在加密数据上直接计算【加法和乘法】/计算结果在解密后与原始数据计算结果一致/适用于云计算和安全多方计算)目录对客户数据集执行差分隐私计算(添加噪声到查询结果/允许对用户数据进行统计分析而不泄露具体信息)、AES加密(对称加密/相同密钥解密后才能进行计算/用于数据传输和存储的保原创 2024-10-30 23:27:43 · 1272 阅读 · 0 评论 -
ML之CF:基于MovieLens电影评分数据集利用基于用户协同过滤算法(基于cosine的NNeighbors)实现对用户进行Top5电影推荐案例—加载数据集→数据预处理(将原始ratings评分数
ML之CF:基于MovieLens电影评分数据集利用基于用户协同过滤算法(基于cosine的NearestNeighbors)实现对用户进行Top5电影推荐案例—加载数据集→数据预处理(将原始ratings评分数据转化为用户-物品评分矩阵)→划分数据集并创建矩阵→模型训练(采用无监督的NNeighbors算法实现用户-用户的协同过滤算法)→模型评估(回归评估【RMSE/MAE】+分类评估【P/R/F1/AUC/覆盖率coverage_TestONTrain】/MAP_by_All/MAP_by_TopK原创 2024-06-25 01:35:59 · 457 阅读 · 0 评论 -
成功解决ValueError: could not convert string to float—深度刨析随森林模型RandomForestClassifier直接处理类别型特征报错原因及其解决方
成功解决ValueError: could not convert string to float—深度刨析随森林模型RandomForestClassifier直接处理类别型特征报错原因及其解决方案目录解决问题解决思路解决方法解决问题 File "E:\File_Python\Python_Books\Chapter_2\demo00001.py", line 111, in feature_importance_selector clf.fit(df原创 2024-05-29 01:56:00 · 1397 阅读 · 0 评论 -
DL之LSTM:基于正弦函数(输入)-余弦函数(目标输出)的数据集和TensorFlow框架利用LSTM算法预测时间序列数据(学习并拟合周期性模型)+动态实时真实值对比可视化
前缀调整通过在注意力机制的键和值部分添加可学习的权重,为模型提供了一种强大的微调手段,可以更好地捕捉任务特定的模式,并与提示调整等其他技术相辅相成,提供了一种灵活和强大的任务特定优化手段。原创 2024-05-03 00:27:01 · 895 阅读 · 0 评论 -
ML:《Data-driven advice for applying machine learning to bioinformatics problems应用机器学习到生物信息学问题的》翻译与解读
ML:《Data-driven advice for applying machine learning to bioinformatics problems应用机器学习到生物信息学问题的数据驱动建议》翻译与解读目录《Data-driven advice for applying machine learning to bioinformatics problems》翻译与解读Abstract摘要1.Introduction2.Methods3.Results原创 2018-07-13 12:51:11 · 12131 阅读 · 1 评论 -
Py之scikit-learn-extra:scikit-learn-extra的简介、安装、案例应用之详细攻略
Py之scikit-learn-extra:scikit-learn-extra的简介、安装、案例应用之详细攻略目录scikit-learn-extra的简介scikit-learn-extra的安装scikit-learn-extra的案例应用scikit-learn-extra的简介scikit-learn-extra - 与scikit-learn兼容的一组有用工具。scikit-learn-extra是一个用于机器学习的Python模块,它扩展了scikit-learn。原创 2024-03-24 23:33:51 · 2676 阅读 · 0 评论 -
ML之FE:基于MovieLens数据集利用二度关系图谱(用户和电影是节点+用户对电影的评分是边的权重)来构造特征(利用图论算法来提取特征信息【节点的中心性和聚类系数】)+采用RF算法训练和评估
ML之FE:基于MovieLens数据集利用二度关系图谱(用户和电影是节点+用户对电影的评分是边的权重)来构造特征(利用图论算法来提取特征信息【节点的中心性和聚类系数】)+采用RF算法训练和评估目录基于MovieLens数据集利用二度关系图谱(用户和电影是节点+用户对电影的评分是边的权重)来构造特征(利用图论算法来提取特征信息【节点的中心性和聚类系数】)+采用RF算法训练和评估基于MovieLens数据集利用二度关系图谱(用户和电影是节点+用户对电影的评分是边的权重)来构造特征(利用图论原创 2024-03-10 23:50:43 · 1317 阅读 · 0 评论 -
ML之LP:半监督学习应用—利用标签传递算法(Label Propagation)基于自定义社交网络图数据集实现对社交网络来预测未标记用户的类型实战代码
ML之LP:半监督学习应用—利用标签传递算法(Label Propagation)基于自定义社交网络图数据集实现对社交网络来预测未标记用户的类型实战代码目录半监督学习应用—利用标签传递算法(Label Propagation)实现对社交网络来预测未标记用户的类型实战代码半监督学习应用—利用标签传递算法(Label Propagation)基于自定义社交网络图数据集实现对社交网络来预测未标记用户的类型实战代码设计思路与输出结果假设我们有一个社交网络,其中一些用户被标记为“正常”或“垃圾原创 2023-12-16 00:25:37 · 1706 阅读 · 0 评论 -
ML之LP:标签传递算法(Label Propagation)的简介(半监督学习)、使用方法、案例应用之详细攻略
ML之LP:标签传递算法(Label Propagation)的简介(半监督学习)、使用方法、案例应用之详细攻略目录标签传递算法(Label Propagation)的简介标签传递算法(Label Propagation)的使用方法标签传递算法(Label Propagation)的案例应用标签传递算法(Label Propagation)的简介1、标签传递算法(Label Propagation)的概述背景标签传递算法(Label Propagation)起源于图论和原创 2019-07-03 20:36:48 · 11005 阅读 · 1 评论 -
Py之scikit-surprise:scikit-surprise的简介、安装、使用方法之详细攻略
Py之scikit-surprise:scikit-surprise的简介、安装、使用方法之详细攻略目录scikit-surprise的简介scikit-surprise的安装scikit-surprise的使用方法scikit-surprise的简介Surprise,Simple Python RecommendatIon System Engine,是一个用于构建和分析处理显式评分数据的Python scikit推荐系统工具。Surprise的设计目的包括:>> 为用原创 2023-12-13 22:57:57 · 2774 阅读 · 0 评论 -
ML之NB+CF:基于ml-100k数据集利用surprise的协同过滤算法CF和sklearn的朴素贝叶斯算法NB进行简单平均实现推荐任务实战代码
ML之NB+CF:基于ml-100k数据集利用surprise的协同过滤算法CF和sklearn的朴素贝叶斯算法NB进行简单平均实现推荐任务实战代码目录基于自定义数据集利用surprise的协同过滤算法CF和sklearn的朴素贝叶斯算法NB进行简单平均实现推荐任务实战代码基于ml-100k数据集利用surprise的协同过滤算法CF和sklearn的朴素贝叶斯算法NB进行简单平均实现推荐任务实战代码基于自定义数据集利用surprise的协同过滤算法CF和sklearn的朴素贝叶斯算法N原创 2023-12-13 22:56:26 · 850 阅读 · 0 评论 -
ML之FE:数据预处理/特征工程之构造特征—构造交互特征(四则运算/多项式)—将输入特征进行多项式映射,即根据两个特征来构造多项式组合特征的代码实战
ML之FE:特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战目录特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战输出结果degree = 3x1 x2 X1^1 * X2^0 X1^0 * X2^1 X1^2 * X2^0 X1^1 * X2^1 X1^0 * X2^2 X1^3 * X2^0 X1原创 2023-12-12 22:58:43 · 965 阅读 · 0 评论 -
ML之AdaBoost:利用简单的决策树(一个节点)作为弱学习器来手写AdaBoost代码的算法原理进而理解该算法是如何实现调整样本权重(通过fit的sample_weight参数)和弱学习器权重(预
ML之AdaBoost:利用简单的决策树(一个节点)作为弱学习器来手写AdaBoost代码的算法原理进而理解该算法是如何实现调整样本权重(通过fit的sample_weight参数)和弱学习器权重(预测时的加权组合)目录利用简单的决策树(一个节点)作为弱学习器来手写AdaBoost代码的算法原理进而理解该算法是如何实现调整样本权重(通过fit的sample_weight参数)和弱学习器权重(预测时的加权组合)利用简单的决策树(一个节点)作为弱学习器来手写AdaBoost代码的算法原理进原创 2023-12-07 00:42:48 · 1289 阅读 · 0 评论 -
GitHub之benchm-ml:benchm-ml的简介(基于二分类数据集来评估常用机器学习算法性能的基准测试项目)、评估指标(可扩展性/速度/准确性)、意义之详细攻略
GitHub之benchm-ml:benchm-ml的简介(基于二分类数据集来评估常用机器学习算法性能的基准测试项目)、评估指标(可扩展性/速度/准确性)、意义之详细攻略benchm-ml的简介:简单/有限/不完整的可扩展性、速度和准确性基准,用于分类机器学习库 所有benchmarks都是错误的,但有些是有用的。 该项目旨在针对一些常用的机器学习算法实现进行可扩展性、速度和准确性的最小基准。该研究的目标是具有数值和分类输入的二元分类(原创 2023-11-14 23:35:30 · 1090 阅读 · 0 评论 -
ML之DS:2015年7月16日《关于数据科学竞赛的Tips》32页PPT的翻译与解读、大牛们对AI相关概念的定义daiding
ML之DS:2015年7月16日《关于数据科学竞赛的Tips》32页PPT的翻译与解读、大牛们对AI相关概念的定义daiding目录2015年7月16日《关于数据科学竞赛的Tips》32页PPT的翻译与解读2015年7月16日《关于数据科学竞赛的Tips》32页PPT的翻译与解读地址PPT地址:https://www.slideshare.net/OwenZhang2/tips-for-data-science-competitions?from_action=save时间原创 2019-02-20 10:00:46 · 10352 阅读 · 1 评论 -
ML之LiR:机器学习经典算法之线性回归算法LiR的简介、使用方法、代码实现、经典案例之详细攻略
ML之LiR:机器学习经典算法之线性回归算法LiR的简介、使用方法、代码实现、经典案例之详细攻略目录线性回归算法LiR的简介线性回归算法LiR的使用方法线性回归算法LiR的经典案例线性回归算法LiR的简介 线性回归方程是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一。线性回归也是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。按自变量个数可分为一元线性回归分析方程和多元线性回归分析方程。原创 2018-01-25 22:09:19 · 9996 阅读 · 2 评论 -
ML之DT:基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集和测试集的学习曲线进而判断拟合状态(过拟合/欠拟合)
ML之DT:基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集和测试集的学习曲线进而判断拟合状态(过拟合/欠拟合)目录基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集和测试集的学习曲线进而判断拟合状态(过拟合/欠拟合)基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集和测试集的学习曲线进而判断拟合状态(过拟合/欠拟合)输出结果实现代码# ML之DT:基于决策树模型对iris鸢尾花数据集利用交叉验证训练并可视化的训练集原创 2023-12-02 00:06:37 · 1400 阅读 · 1 评论 -
NLP之TM:Topic Model(LDA等)的简介、使用方法、案例应用之详细攻略
NLP之TM:Topic Model(LDA等)的简介、使用方法、案例应用之详细攻略目录Topic Model的简介Topic Model的案例应用Topic Model的简介1、Topic Model的概述(两个假设)简介主题模型(Topic Model,TM)是一类用于从文本中抽取主题结构的统计模型。它的核心思想是,文档中的词汇可以由一组主题生成,而每个主题又由一组单词构成。通过对文档-主题和主题-单词分布进行建模,可以揭示文本背后的主题结构。TM是原创 2019-08-28 20:02:23 · 1125 阅读 · 1 评论 -
ML之DictVectorizer:利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不
ML之DictVectorizer:利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不经过任何处理)代码实战目录利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不经过任何处理)代码实战利用DictVectorizer函数对dataframe格式所有类型特征实现数据原创 2023-11-28 00:55:53 · 1066 阅读 · 0 评论 -
Py之PySyft:Syft的简介、安装、使用方法之详细攻略
Py之PySyft:Syft的简介、安装、使用方法之详细攻略目录PySyft的简介PySyft的安装PySyft的使用方法PySyft的简介PySyft是一个开源库,在Python中提供安全和私有的深度学习。文档:PySyft’s documentation — PySyft documentationPySyft的安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple syft更新了一大堆包,太多了也…原创 2023-11-17 01:38:14 · 1728 阅读 · 0 评论 -
MLOPS:最佳的机器学习模型监控工具的简介及其对比(Neptune/Arize AI/WhyLabs/Prometheus和Grafana/Evidently/Qualdo/Fiddler/Sage
MLOPS:最佳的机器学习模型监控工具的简介及其对比(Neptune/Arize AI/WhyLabs/Prometheus和Grafana/Evidently/Qualdo/Fiddler/SageMaker Model Monitor/Seldon Core/Censius)目录最佳的机器学习模型监控工具的简介及其对比如何比较机器学习模型监控工具结论最佳的机器学习模型监控工具的简介及其对比地址文章原始地址:Best T原创 2023-11-15 23:33:11 · 2458 阅读 · 0 评论 -
CI/CD之Jenkins:Jenkins的简介、安装、使用方法(比如在 Jenkins 中配置和使用机器学习项目)之详细攻略
在Jenkins中创建一个新的Job,配置源代码管理(如Git)、构建触发器、构建步骤等。>> 保护敏感信息: 在 Jenkins 中配置敏感信息时,使用 Jenkins 提供的凭据管理系统,不要将敏感信息直接硬编码在脚本中。Jenkins 是一个流行的开源持续集成和持续交付(CI/CD)工具,用于自动化构建、测试和部署项目。>> 构建环境隔离: 在构建环境中确保必要的依赖项被正确安装,可以考虑使用虚拟环境或 Docker 容器来隔离环境。执行构建脚本:在Jenkins构建步骤中,执行项目的构建脚本。原创 2019-01-20 11:43:44 · 13886 阅读 · 2 评论 -
AI:人工智能的简介之AI领域基础概念术语解释之《Google发布机器学习术语表 (中英对照)》、机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)
AI:人工智能的简介之AI领域基础概念术语解释之《Google发布机器学习术语表 (中英对照)》、机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)目录机器学习术语表原创 2018-04-22 10:55:07 · 14032 阅读 · 1 评论 -
IRC/ML:金融智能风控—信贷风控场景简介、两大场景(贷款场景+信用卡场景)、信用卡评分模型设计、反欺诈检测技术的简介、案例应用之详细攻略
IRC/ML:金融智能风控—信贷风控场景简介、两大场景(贷款场景+信用卡场景)、信用卡评分模型设计、反欺诈检测技术的简介、案例应用之详细攻略目录信贷风控简介信贷风控两大场景信用卡反欺诈检测的简介信贷风控简介简介银行的主要收入或者利润来源来自贷款和信用卡,简称信贷。贷款和信用卡,我们统称为信贷。他们都有着相似的风控逻辑。风控思路使用传统的评分卡模型、决策树、神经网络等算法,根据借款人的个人信息、信用记录、还款历史等因素,评估其信用风险和偿还能力。原创 2023-10-15 23:45:43 · 2181 阅读 · 0 评论 -
MLOPS:机器学习算法领域之工程化五大核心技术之模型监控的简介(2大原则/5+1监控内容)、模型稳定性(两大算法策略)、智能风控场景的模型监控、三大类监控工具(ML框架/ML专用/通用监控工具)之详
MLOPS:机器学习算法领域之工程化五大核心技术之模型监控的简介(2大原则/5+1监控内容)、模型稳定性(两大算法策略)、智能风控场景的模型监控、三大类监控工具(ML框架/ML专用/通用监控工具)之详细攻略目录模型监控的简介模型监控的具体场景实战三大类监控工具:ML框架/ML专用/通用监控工具模型监控的简介1、模型监控的概述(2大原则/5+1监控内容/三大类监控工具)背景当特征数据存在问题时,模型的预测结果会受到影响,甚至可能导致模型失效。模型迭原创 2023-10-15 23:41:28 · 1127 阅读 · 0 评论 -
MLOPS:大数据/服务器下的大规模机器学习技术—流水线处理技术的简介(标准化/自动化/可复用化)、常用框架(Pipeline/TFX、Airflow/Beam/Kubeflow/MLflow、Fli
MLOPS:大数据/服务器下的大规模机器学习技术—流水线处理技术的简介(标准化/自动化/可复用化)、常用框架(Pipeline/TFX、Airflow/Beam/Kubeflow/MLflow、Flink/Kafka)之详细攻略目录流水线处理技术的简介流水线处理技术的常用框架和工具流水线处理技术的实战案例流水线处理技术的简介1、流水线处理技术的概述(标准化/自动化/可复用化)简介流水线处理技术是指将一系列的数据处理操作组合成一个处理流程,以完成一个特定的任务原创 2023-10-08 23:58:01 · 1099 阅读 · 0 评论 -
NLP:利用spacy的en_core_web_sm预训练语言模型通过对文本数据的依存分析法(主谓宾/语法树结构)实现将大量的文本数据转化为结构化数据应用案例实现代码
NLP:利用spacy的en_core_web_sm预训练语言模型通过对文本数据的依存分析法(主谓宾/语法树结构)实现将大量的文本数据转化为结构化数据应用案例实现代码目录利用spacy的en_core_web_sm预训练语言模型通过对文本数据的依存分析法(主谓宾/语法树结构)实现将大量的文本数据转化为结构化数据应用案例# 1、定义文本数据# 2、基于进行依存分析实现代码利用spacy的en_core_web_sm预训练语言模型通过对文本数据的依存分析法(主谓宾/语法树结构原创 2023-09-17 23:37:33 · 1072 阅读 · 0 评论 -
NLP之NLTK:对文本进行预处理操作(利用jieba分词+合并+利用re去掉标点符号和空格+去重+利用nltk词性标注并转为字典、特征编码并存为字典、标签编码并存为字典)实现实际样本特征编码、实际样
NLP:对文本进行预处理操作(利用jieba分词+合并+利用re去掉标点符号和空格+去重+利用nltk词性标注并转为字典、特征编码并存为字典、标签编码并存为字典)实现实际样本特征编码、实际样本标签编码应用案例。原创 2023-09-17 23:34:54 · 1282 阅读 · 0 评论 -
ML之MetaCost:基于泰坦尼克号数据集(独热编码/标签编码)利用MetaCost算法(DT+LiR,基分类器训练→计算错误代价→训练元模型→预测与调整)实现二分类预测应用案例
ML之MetaCost:基于泰坦尼克号数据集(独热编码/标签编码)利用MetaCost算法(DT+LiR,基分类器训练→计算错误代价→训练元模型→预测与调整)实现二分类预测应用案例目录基于泰坦尼克号数据集(独热编码/标签编码)利用MetaCost算法(DT+LiR,基分类器训练→计算错误代价→训练元模型→预测与调整)实现二分类预测应用案例# 1、定义数据集# 2、数据预处理# 3、模型训练与评估# 4、基于base_classifier利用MetaCost算法实现原创 2023-09-17 23:31:22 · 742 阅读 · 0 评论 -
XAI之EBM:基于泰坦尼克数据集利用EBM算法(interpret库)实现可解释性(可视化EBM模型及其决策过程+局部解释+全局解释)之详细攻略
其中包括了每个特征的重要性和对模型预测的影响。原创 2023-09-17 23:29:34 · 1025 阅读 · 0 评论 -
ML+LLMs:利用LLMs大语言模型赋能或者结合ML机器学习算法进行具体应用的简介、具体案例之详细攻略
ML+LLMs:利用LLMs大语言模型赋能或者结合ML机器学习算法进行具体应用的简介、具体案例之详细攻略目录利用LLMs赋能或者结合ML算法进行具体应用的简介1、概述:数据增强/特征工程/过程优化/结果解释/聚类分析/信息检索利用LLMs赋能或者结合ML算法进行具体应用的具体案例利用LLMs赋能或者结合ML算法进行具体应用的简介1、概述:数据增强/特征工程/过程优化/结果解释/聚类分析/信息检索数据增强利用LLMs的文本生成能力,生成大规模的合成文本数据,用于原创 2023-09-05 20:16:36 · 1468 阅读 · 0 评论 -
ML之FE:机器学习算法建模中的特征穿越/数据泄露的简介、常见案例、解决方法之详细攻略
ML之FE:机器学习算法建模中的特征穿越/数据泄露的简介、常见案例、解决方法之详细攻略目录相关文章特征穿越/数据泄露的简介数据泄露常见案例特征穿越常见案例及其解决办法相关文章ML之FE:机器学习算法建模中的特征穿越/数据泄露的简介、常见案例、解决方法之详细攻略https://yunyaniu.blog.youkuaiyun.com/article/details/132633981MLOPS:数据科学/机器学习算法领域之工程化五大核心技术—模型部署与监原创 2023-09-02 07:09:44 · 1782 阅读 · 0 评论 -
ML:机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等
ML:机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等)目录机器学习中有监督学习算法的四种基础的模型形式(基于概率模型、线性模型、树类模型、神经网络模型)的简介多种模型算法分类并对比机器学习中有监督学习算法的四种基础的模型形式(基于概率模型、线性模型、树类模型、神经网络模型)的简介多种模型算法分类并对比1、两种最基础的模型原创 2023-09-02 07:04:39 · 1704 阅读 · 0 评论 -
LLMs:LLMs大语言模型评估的简介(两标+六性+九维,大模型排行榜多种),两类基准—通用任务的基准(单任务【BLEU/ROUGE-MT-Bench/Chatbot Arena】、多任务【Super
LLMs:LLMs大语言模型评估的简介(两标(NLUGR指标/REBT)+六性(理解性+生成性+多样性+泛化性+能耗性+可解释性)+九维(2大能力域【理解/生成】+3性【丰富性/多样性/适应性】+4大子任务【逻辑推理/问题解决/对和聊天/情感分析】),大模型排行榜多种),两类基准——通用任务的基准(单任务【BLEU/ROUGE-MT-Bench/Chatbot Arena】、多任务【SuperGLUE/MMLU/BIG-bench/HELM/AGIEval/C-EVAL/Xiezhi】、基于工具【API原创 2023-07-30 22:46:06 · 4885 阅读 · 0 评论 -
ML:结构化数据(文本/图像)计算相似度常用十类方法(余弦相似性、皮尔逊、闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离、马氏距离、汉明距离、编辑距离、杰卡德相似系数、相对熵/KL散度、Helli
ML:结构化数据(文本/图像)计算相似度常用十类方法(余弦相似性、皮尔逊、闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离、马氏距离、汉明距离、编辑距离、杰卡德相似系数、相对熵/KL散度、Hellinger距离、贝叶斯公式距离)简介、代码实现目录相似度相关文章ML之Hash_EditDistance&Hash_HammingDistance&Hog_HanMing&Cosin&SSIM:图片相似性判别—基于输入图片利用多种算法进行原创 2019-12-02 17:26:09 · 4410 阅读 · 1 评论 -
IRC/ML:金融智能风控领域相关术语解释(黑灰产群控、风控指标/字段、口径逻辑)、金融智能风控领域九大场景之详细攻略
IRC/ML:金融智能风控领域相关术语解释(黑灰产群控、风控指标/字段、口径逻辑)、金融智能风控领域九大场景之详细攻略目录金融智能风控领域的相关术语风控指标/字段相关概念、口径逻辑金融智能风控领域九大场景金融智能风控领域的相关术语1、如何判断黑灰产群控T1、手机电量判定:一般判断手机电量是否一直是100%,如果手机电量一直100%,那就是碰到了群控的。T2、手机定位判定:或者看是否设备的方位在动,如果设备长期不动,也是遇到了群控。T3、图算法关原创 2022-06-10 18:00:00 · 2581 阅读 · 0 评论 -
ML:LightGBM算法的原理讲解之六大技巧(速度和内存使用的优化、稀疏优化、精度优化、通信优化、分布式学习优化、GPU加速)、三大策略(节点分裂策略思路/构建直方图的思路/处理类别型特征的思路)
ML之LightGBM:LightGBM算法的原理讲解之六大技巧(速度和内存使用的优化、稀疏优化、精度优化、通信优化、分布式学习优化、GPU加速)、三大策略(节点分裂策略思路/构建直方图的思路/处理类别型特征的思路)目录相关文章一、LightGBM算法的原理讲解二、LightGBM算法的原理讲解之六大技巧—速度和内存使用的优化、稀疏优化、精度优化、通信优化、分布式学习优化、GPU加速三、LightGBM算法策略技巧的解答疑惑相关原创 2019-05-27 16:36:03 · 86 阅读 · 0 评论