
python及算法学习
文章平均质量分 72
SanFanCSgo
这个作者很懒,什么都没留下…
展开
-
算法导论:分治法,python实现合并排序MERGE-SORT
1. 简单合并排序法实现思想:两堆已排好的牌,牌面朝下,首先掀开最上面的两张,比较大小取出较小的牌,然后再掀开取出较小牌的那一堆最上面的牌和另一堆已面朝上的牌比较大小,取出较小值,依次类推......"""合并两个已经排好的子列表"""ListB = [2, 4, 5, 7, 1, 2, 3, 6]ListB_L = ListB[0: int((len(ListB))/2)]ListB_原创 2018-01-10 11:59:05 · 1230 阅读 · 0 评论 -
算法导论读书笔记:合并排序算法统计逆序数及其Python实现
思考题 2-4 逆序对问题设A[1,…n]是一个n元素数组。若在i< j 的情况下,有A[i]> A[j],则(i, j)就称为A中的一个逆序对(inversion)。例如:数组[2,3, 8, 6, 1]中有5个逆序对(1, 5)、(2,5)、(3,4)、(3,5)和(4,5)。一个极端的情况是数组A中元素按逆序大小排列,此时数组含有最多的逆序对,为\[\left( \begin{g...原创 2018-01-12 18:59:58 · 1228 阅读 · 5 评论 -
算法导论:python实现排序、插入排序Insertion-sort、选择排序Selection-sort、冒泡排序Bubble-sort
1. 用python实现一个十个数的数组(列表)的简单排序(无脑排序)思想:从列表第一个元素到最后一个元素,每个元素都执行与后面所有元素相比较大小,把最小的值调到最前面的位置。List_A = [7, 11, 16, 3, 28, 15, 36, 1, 49, 81]for i in range(0, len(List_A)): # 遍历列表中的每个数 for j in range(原创 2018-01-09 16:17:20 · 590 阅读 · 0 评论 -
数据挖掘习题选做--第六章:Apriori算法、FP-growth
数据挖掘概念与技术习题选做第六章习题(1) 用python简单实现Apriori算法# -*- coding: utf-8 -*-__author__ = "Yunfan Yang"def gen_L1(TID): """从事务集中产生频繁1项集""" initial_C1 = {} # 定义一个空字典用于统计初始项集信息,键值对形如{"M": ...原创 2018-04-09 15:28:07 · 6156 阅读 · 1 评论 -
数据挖掘读书笔记--第八章(上):分类:基本概念 、决策树
散记知识点——“分类是一种重要的数据分析形式”1. 基本概念1.1 分类的目的通过构建分类模型来预测一些数据元组的类标签。1.2 分类的过程(1) 构建训练集训练集由数据库中的元组和它们相关联的类标号组成。假设数据库DDD中的每个元组XXX有nnn个属性A1,A2,...,AnA1,A2,...,AnA_{1}, A_{2}, ..., A_{n},而每个属性...原创 2018-04-16 14:57:10 · 1239 阅读 · 0 评论 -
数据挖掘读书笔记--第八章(中):分类:贝叶斯分类法 、基于规则分类
散记知识点——“继续学习经典分类算法”3. 贝叶斯分类法(Naive Bayesian)贝叶斯分类法是统计学分类方法,基于贝叶斯定理。朴素贝叶斯分类法可以与决策树和经过挑选的神经网络分类器相媲美。用于大型数据库,贝叶斯分类法也表现出高准确率和高速度。3.1 贝叶斯定理设数据元组XXX有nnn个属性,给定XXX的nnn个属性值已知的条件下,XXX被认定为类别CCC的概率为P(...原创 2018-04-17 13:51:12 · 1571 阅读 · 0 评论 -
数据挖掘读书笔记--第九章:高级分类:BP神经网络、SVM支持向量机
散记知识点——“探索复杂高级的分类方法”1.神经网络1.1 神经网络的基本概念(1) 定义神经网络是一组连接的输入/输出单元,其中每个连接都与一个权重相关联。在学习阶段,通过调整这些权重,使得它能够预测输入元组的正确类标号来学习。(2) 前馈神经网络结构前馈神经网络,又称后向传播(BP, back propagation)神经网络。由一个输入层、一个或...原创 2018-04-24 15:16:06 · 3035 阅读 · 0 评论 -
机器学习:过拟合、神经网络Dropout
过拟合过拟合现象机器学习中,过拟合现象就是训练模型高度适用于训练集,而对测试集或未知数据集效果不好的情况。表现为训练集过度拟合具有高准确率,而测试集的准确率明显低于测试集。防止过拟合防止过拟合的方法有:增加数据集,正则化方法以及Dropout方法。1. 增加数据集数据挖掘中,数据量越多,对模型参数调整就越准确。多的数据往往比好的训练模型要重要,因此,增加数...原创 2018-04-26 13:48:22 · 1592 阅读 · 1 评论