
python-机器学习
文章平均质量分 53
小琳ai
300字以内
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
小琳AI课堂:使用ChatGPT API搭建系统(二)
🎉🎉大家好,欢迎回到小琳AI课堂!今天我们要探索的是如何在“使用ChatGPT API搭建系统”课程中,用Python代码与ChatGPT API进行有趣的互动。准备好了吗?让我们开始吧!🚀。原创 2024-08-26 22:22:15 · 924 阅读 · 0 评论 -
小琳AI课堂:使用ChatGPT API搭建系统(一)
大家好,这里是小琳AI课堂。今天我们来聊聊提示链的构建,这是一个非常有趣且实用的技术话题。提示链,简单来说,就是一系列逻辑上相互关联的提示,用于指导大型语言模型(如ChatGPT API)如何处理复杂交互和任务提示链的构建:学习者将学习如何建立与前面提示交互的提示链,这是实现复杂任务自动化的基础。下面,我们从多个角度来深入解析一下这个话题。原创 2024-08-26 22:16:01 · 513 阅读 · 0 评论 -
三分钟了解 注意力机制和自注意力机制
嗨!今天,我们要聊一聊两个在机器学习和深度学习领域超火的技术——注意力机制和自注意力机制。🔥。原创 2024-08-18 08:11:09 · 395 阅读 · 0 评论 -
看demo学算法之长短期记忆网络(LSTM)
嗨,大家好,今天我们来聊聊长短期记忆网络(LSTM)!🤖LSTM是个啥?它是种特别的循环神经网络(RNN),专门处理序列数据,比如时间序列分析和语言模型。LSTM强就强在能记住长期信息,这在很多任务里都特别重要。🧠。原创 2024-08-17 20:00:00 · 412 阅读 · 0 评论 -
看demo学算法之 Transformer模型
这个示例展示了Transformer模型的基本结构,但要构建一个完整的Transformer模型,还需要包括解码器、嵌入层、输出层等组件,以及完整的训练和推理过程。希望这个简化版的示例能帮助你更好地理解Transformer模型的工作原理!🌟 它通过自注意力机制,让处理序列数据变得游刃有余,尤其在自然语言处理(NLP)领域,表现超级出色!来来来,让我们一起探索Transformer的核心组件,用轻松的方式理解这个强大的模型。如果你觉得我讲的不够清楚,或者想要更深入地了解,欢迎在文章下方留言,与我交流!原创 2024-08-16 12:15:00 · 364 阅读 · 0 评论 -
你应当了解的大语言模型术语(5)
哇塞,下面这些都是大模型领域的高大上术语呢!原创 2024-08-16 12:00:00 · 283 阅读 · 0 评论 -
你应当了解的大语言模型术语(4)
哇哦,又是十个超级炫酷的大模型术语!让我用轻松有趣的方式来帮你理解它们吧!原创 2024-08-16 09:00:00 · 281 阅读 · 0 评论 -
你应当了解的大语言模型术语(2)
哇塞,大模型领域的关键术语真是一大堆呢!别担心,我来帮你把它们变得简单易懂。原创 2024-08-16 07:30:00 · 577 阅读 · 0 评论 -
你应当了解的大语言模型术语(1)
本期会用轻松活泼的方式帮你理解这些专业术语。让我们一起来探索大语言模型的奇妙世界吧!原创 2024-08-16 07:15:00 · 275 阅读 · 0 评论 -
主流的开源大型语言模型
本期我们来聊聊目前主流的开源大型语言模型。这些模型就像是AI界的超级英雄,各具特色,为我们的研究和开发提供了强大的力量。原创 2024-08-16 07:00:00 · 230 阅读 · 0 评论 -
看demo学算法之 循环神经网络(RNN)
今天我们来聊聊神经网络中的“记忆大师”——循环神经网络(RNN)。想象一下,你正在看电影,每一帧都连贯着前一帧的故事情节。RNN就像是这样一位观众,它能记住之前看到的内容,帮助理解当前的画面。是不是很酷?🎬。原创 2024-08-15 22:41:27 · 736 阅读 · 0 评论 -
看demo学算法之 卷积神经网络(CNN)
卷积神经网络是一种深度学习算法,主要用于处理具有类似网格结构的数据,如图像。它通过层次化的特征提取和转换来识别图像中的模式。CNN的主要组成部分包括卷积层、池化层、激活层、全连接层和归一化层。原创 2024-08-15 06:53:54 · 969 阅读 · 0 评论 -
看demo学算法之 线性回归模型
嗨!今天我们来聊聊如何用Python构建一个简单的线性回归模型。这个过程就像给数据配对舞一样,让它们在舞池里找到最佳位置。准备好了吗?让我们开始吧!🚀。原创 2024-08-14 22:29:06 · 555 阅读 · 0 评论 -
python处理换行符
当前我的场景是数据中存在大量样本,内容差异仅在于换行符,导致去重的时候,两者都被保留了下来,非我所愿。几经测试,对于pandas的dataframe,可以使用下面的方式去除换行符df = df.replace(’\n’,’’, regex=True)一般情况下的文本也是可以如此处理...原创 2021-08-31 17:28:17 · 865 阅读 · 0 评论 -
pandas 保持excel的null值原有输入
当我们在使用pandas读取excel的时候往往会碰到各种形式的null值,pandas往往默认会将null值(比如空字符串,null,NULL等等)读取为nan,这个符号在dataframe中就是专门用来表示null值的。那么要想保持excel的原有内容,我们在此需要设置下参数。keep_default_napd.read_excel(file, keep_default_na=False)将这个参数置为false之后,就能正常读取excel了,展示的内容就是你excel打开看到的内容。..原创 2021-08-30 14:43:09 · 1151 阅读 · 0 评论 -
anaconda 无法激活环境
**1.检查anaconda的版本**找不到 activate命令或者activate之后发现环境并没有激活建议下载最新的anaconda版本老的anaconda存在此种情形,复杂不好定位。主要适用于低于4.6版本的anaconda。**2.检查anaconda的环境配置**使用命令需要将script配置在环境变量中,检查path是否包含了此路径...原创 2021-05-14 17:38:59 · 2454 阅读 · 0 评论 -
pandas实现in和 not in
pandas中经常会需要对某列做一些筛选,比如筛选某列里的不包含某些值的行,类似sql里的in和not in功能,那么怎么实现呢。import pandas as pdcolumns = ['name','country']index = [1,2,3,4]row1 = ['a','China']row2 = ['b','UK']row3 = ['c','USA']row4 = ['...原创 2019-08-01 10:09:36 · 1646 阅读 · 0 评论 -
pandas数据处理之 标签列字符转数字
机器学习中,当我们在进行数据预处理的时候,对于标签列非字符的数据,我们往往需要将其转换成字符,因为有的算法可能不支持非数字类型来做特征。那么怎么快捷地来着这个转换呢,请看我的示例:1.构建测试数据import pandas as pdarray = ['good','bad','well','bad','good','good','well','good']2.数据转换下,并获取标签列...原创 2019-09-27 14:27:51 · 10100 阅读 · 0 评论 -
pycharm 破解
因为原来的破解补丁下载链接失效了,今天来更新下新的补丁。首先感那些无私制作并免费提供补丁的人,世界因他们而光明!!!同时,我也更新下教程,详细说明下激活前需要注意的一些细节,希望同学们少走弯路,有一个好的开始!!!激活前准备工作*激活前请先关闭pycharm*修改配置文件的时候你需要填写你的安装路径*如果出现修改配置文件后无法打开pycharm,那就移动补丁的位置,比如我从斌目录移...转载 2019-05-06 20:21:53 · 2445 阅读 · 3 评论 -
数据探索(1)数据质量分析
数据质量分析数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据一般是指不符合要求,以及不能直接进行相应分析的数据。在常见的数据挖掘工作中,脏数据包括如下内容:缺失值异常值不一致的值重复的值以及包含特殊符号的数据缺失值分析数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失。(1)缺失值产生的原因1)有些信息暂时无法获取,或者获取信息的代价太大2)有些信息被遗漏...原创 2018-11-27 10:02:25 · 2050 阅读 · 0 评论 -
机器学习入门
机器学习项目的流程 1.明确需求,将需求抽象成数学问题 2.获取数据 3.数据预处理 4.特征工程 5.选择模型 6.模型反馈原创 2019-07-12 18:12:39 · 172 阅读 · 0 评论 -
数据预处理 数据归一化之 sklearn.preprocessing
之所以要数据归一化是因为,不同评价指标往往具有不同的量纲,数值间的差距可能很大,不进行处理会影响到分析的结果,同时也不利于多个指标在同一图标内的展示。数据规范化对于基于距离的算法尤为重要。此处的数据归一化使用的是sklearn.preprocessing里实现的三种方案MaxAbsScaler 将数据规约到[-1,1] 也称小数定标规范化MinMaxScaler 将数据规约到[0,1] 也...原创 2019-06-21 15:16:56 · 1677 阅读 · 0 评论 -
数据预处理 Python主要数据预处理函数
interpolate包含了大量的插值函数unique去除数据中的重复元素isnull/notnull判断元素是否空值random用于生成服从特定分布的随机矩阵PCA对指标变量矩阵进行主成分分析...原创 2018-11-27 14:29:08 · 764 阅读 · 0 评论 -
数据预处理(2)数据集成 和 数据变换 数据规约
数据集成数据挖掘的过程中往往需要的数据分布在不同的数据库,数据集成就是将多个数据源合并存放在一个一致的数据存储(如数据仓库)中的过程。实体识别同名异义名字相同但实际代表的含义不同异名同义名字不同但代表的意思相同单位不统一冗余属性识别相同的属性出现多次同一属性命名不一致导致重复数据变换1. 简单函数变换2. 规范化最小最大规范化值与最小值的差 再除以极差得...原创 2018-11-27 14:24:44 · 6696 阅读 · 0 评论 -
数据预处理(1)数据清洗
数据预处理的内容主要包括数据清洗,数据集成,数据变换和数据规约。数据清洗数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,帅选掉与挖掘主题无关的数据,处理缺失值、异常值等。缺失值处理缺失值处理的方法可分为三类:删除记录、数据插补和不处理。常用的数据 插补方法有:均值中位数众数插补使用固定值插补使用最近临插补回归方法 建立拟合模型预测缺失的属性值插值法 利用已知...原创 2018-11-27 13:44:34 · 2618 阅读 · 0 评论 -
数据探索(3)Python主要数据探索函数
Python中用于数据探索的库主要是Pandas(数据分析)和Matplotlib(数据可视化)。数据探索函数可大致分为统计特征函数和统计作图函数。Pandas的主要统计特征函数。sum() 列总和mean() 平均数var() 方差std() 标准差corr()Spearman相关系数矩阵cov()协方差矩阵skew()偏度(3阶矩阵)Kurt()峰度(4阶矩阵)...原创 2018-11-27 10:47:24 · 387 阅读 · 0 评论 -
数据探索(2)数据特征分析
数据特征分析分布分析1.定量数据的分布分析对于定量变量而言,选择组数和组宽是做频率分布分析时最主要的问题,一般按照以下步骤进行。1)求极差2)决定组距和组数3)决定分店4)列出频率分布表5)绘制频率分布直方图遵循以下原则:1)各组之间必须相互排斥2)各组必须包含所有数据3)各组的组宽最好相等2.定性数据的分布分析对于定性变量,常常根据变量的分类类型来分组,可以采用饼图和...原创 2018-11-27 10:32:31 · 1124 阅读 · 0 评论 -
python数据分析工具
Numpy提供数组支持Scipy提供矩阵支持Matplotlib数据可视化工具、作图库pandas数据分析和探索工具Scikit-Learn支持回归、分类、聚类等的强大的机器学习库StatsModels统计建模和计量经济学,包括描述统计、统计模型估计和判断Keras深度学习库,用于建立神经网络以及深度学习模型...原创 2018-11-26 17:48:56 · 333 阅读 · 0 评论 -
Python使用入门
运行方式一般两种方式:客户端执行python3使用Jupyter编码建议安装anaconda,方便包管理使用#来添加注释使用‘’’‘’’来添加多行注释脚本中有中文还要在文件头注明字符编码# -*- coding: utf-8 -*python严格遵循缩进基本命令判断if 条件1: 语句2elseif 条件3: 语句4else: 语句5...原创 2018-11-26 17:41:58 · 200 阅读 · 0 评论 -
Python数据挖掘过程
数据挖掘的建模过程定义挖掘目标明确系统完成后想要达成什么样的效果。我们需要分析应用领域,了解相关领域的情况,熟悉背景知识,弄清用户需求。数据取样从业务系统中抽取一个与挖掘目标相关的样本数据子集。抽取数据的标准,一是相关性,二是可靠性,三是有效性。衡量取样数据质量的标准如下:1)资料完整无缺,各类指标项齐全。2)数据准确无误,反映的都是正常(而不是异常)状态下的水平。数据探索...原创 2018-11-26 16:51:19 · 1818 阅读 · 0 评论 -
Python3安装
第一步下载python3:wget http://www.python.org/ftp/python/3.6.0/Python-3.6.0.tgztar -zvxf Python-3.6.0.tgzcd Python-3.6.0./configure --prefix=/usr/local/python3yum -y install gccyum -y install zlib*make &...原创 2018-06-14 17:12:26 · 323 阅读 · 0 评论 -
设置python的启动文件
设置启动文件 PYTHONSTARTUP 类似于profile这个文件在交互会话期是只读的,当Python从脚本中解读文件或以终端/dev/tty 做为外部命令源时则不会如此,它与解释器中不受限制的使用。你也可以在这个文件中改变sys.psl和sys.ps2指令。如果想要在当前目录中执行附加的启动文件,可以在全局启动文件中加入类似以下的代码:if os.path.isfile('.py原创 2017-05-16 16:10:19 · 3171 阅读 · 0 评论 -
pycharm配置anaconda编译
pycharm安装完之后需要设置下,file>>settings>>general>>auto import>>python>>show import popup这样就会提示你自动导入包还要安装anaconda,方便包管理。安装了anaconda之后,File》settings>project>>project i...原创 2018-12-05 13:38:12 · 301 阅读 · 0 评论 -
pandas 遍历行和列
需求判断一个df中的各行各列是否包含某值,然后做出操作读取文件import pandas as pddf= pd.read_csv(‘file’)获取列columns_list = df.columns.tolist()columns_list定义行处理函数def row_process(row):for column in columns_list:if row[colu...原创 2019-04-26 11:17:35 · 6804 阅读 · 0 评论 -
时间序列预测法
预测是人们根据食物的发展鼓励、历史和现状,分析影响其变化的因素,对其发展前景和趋势进行的一种推测。时间序列分析法原创 2019-06-11 16:48:38 · 3712 阅读 · 1 评论 -
No numeric types to aggregate报错
pandas使用pivote_table时,报错报这个错多半是因为你指定的列里不能执行所对应的聚合操作,你所指定的数字列里包含着字符串或者其他的数据类型要想解决此报错主要就是检查你所指定的列内,此处我使用的是isinstance来判断目标列是否是我想要的列。def ensure_float(x): import numpy as np if isinstance(x,np.f...原创 2019-06-19 15:56:04 · 46195 阅读 · 1 评论 -
关联分析(1)
基本方法关联分析的目标包括两项:发现频繁项集和发现关联规则。首先需要找到频繁相机,然后才能获得关联规则。关联分析的主要目的是寻找频繁项集,如果通过暴力搜索,运算量会呈几何性增长。为了减少频繁项集的计算量,可以采用Apriori算法和FP-Growth算法。Apriori算法原理:如果某个项集是频繁的,那么它的所有子集也是频繁的。这个原理反过来看对实际操作更有作用,即如果一个项集是非频繁项...原创 2019-06-13 15:08:30 · 2531 阅读 · 1 评论 -
python动态调用函数
举例 文件 windows_params 包含两个方法,两个参数a = 1b = 2def count(): print('count')def get(): print('get')然后来调用啦import windows_params as lpdef invoke_method(method): value = eval('lp.'+met...原创 2019-05-10 18:05:02 · 1323 阅读 · 0 评论 -
python学习入门
python基础1.启动jupyter notebook2.在桌面上新建名为jupyter的文件夹,进入文件夹,新建python3文件,修改文件名为python_learning然后开始我们的编码3.python的基本内容数据类型:数字型 int,long,float,bool,complex(复数)例如:int 84 -680long 29979062458L -84140...原创 2019-05-06 21:30:27 · 192 阅读 · 0 评论 -
python开发环境安装
安装anacondaAnaconda下载 下载python 3.X版本之后一键安装即可。安装 jupyter notebookconda install jupyter运行cmd,运行jupyter notebook 启动浏览器 即可进入jupyter的客户端运行cmd ,运行python出现如图结果即ok.2.安装pycharm下载pycahrm pycharm下载...原创 2019-05-06 10:42:31 · 274 阅读 · 0 评论