- 博客(122)
- 收藏
- 关注
原创 python使用pyinstaller打包exe结果太大解决
本人pycharm中的Python均为Anaconda安装环境,待打包的文件import的库为numpy/pandas/xlwt,初始用pyinstaller打包程序后exe文件大约为380M,尝试了以下办法:1、新建了一个新的anaconda环境,仅安装相关库,打包后文件为240M2、使用pipenv创建虚拟环境,但是安装库文件时lock一直20多分钟都没结果3、不使用acnconda ,...
2019-11-01 12:38:08
8166
转载 二叉树创建、输出
# #-*- coding:utf-8 -*-# # @Author:zhangy# # @Time:2019-09-27 11:25# # reference:https://github.com/EchoLLLiu/DataStructure/tree/master/ch04tree#class TreeNode: '''二叉搜索树节点的定义''' def __ini...
2019-09-27 17:30:36
1033
转载 binary_search_tree
reference:https://github.com/EchoLLLiu/DataStructure/blob/master/ch04tree/BinarySearchTree.py#-*- coding:utf-8 -*-# @Author:zhangy# @Time:2019-09-27 16:16#reference:https://github.com/EchoLLLiu/Da...
2019-09-27 17:27:49
322
原创 编辑距离算法理解(动态规划的思想)
假设两个字符串长度分别为i、j,从简单的情况进行分析:一、当两个字符串都为空串,那么编辑距离为0;二、当其中一个字符串为空串时,那么编辑距离为另一个费控字符串的长度;三、当两个字符串均为非空时,取以下三种情况的最小值即可:1、长度分别为i-1和j的字符串的编辑距离已知,则加1即可2、长度分别为i和j-1的字符串编辑距离已知,则加1即可3、长度分别为i-1和j-1的字符串的编辑距离已知,...
2019-09-24 11:25:06
828
原创 conda channels 配置
1、在anaconda prompt查看已配置conda channelsconda config --get channels2、删除某条channelconda config --remove channels https://----------------------------------------3、增加channelconda config --add channel...
2019-07-17 09:18:28
6149
原创 基于TED(en-zh)数据集进行实现Seq2Seq模型
博客文章基于Google Tensorflow实战深度学习框架第九章部分内容,手写一遍代码加强模型理解。1、获取词汇表# -*- coding:utf-8 -*-'''@Author:zhangy@Modify:2019.7.5'''import codecsimport collectionsfrom operator import itemgetter#设置中英文类型,得...
2019-07-08 15:20:14
948
原创 Python数值运算各函数性能分析
数据分析中的常见任务是在大量数字上计算发杂的数学表达式,Python本身提供了所有必须的功能,不同库实现的效率差别很大:1、loops = 25000000from math import *a = range(1,loops)def f(x): return 3 * log(x) + cos(x) ** 2%timeit r = [f(x) for x in a]18....
2019-04-22 11:22:37
869
原创 整数转化为任意进制字符串-python
递归的方式:def toStr(n,base): convertString = '0123456789ABCDEF' if n < base: return convertString[n] else: return toStr(n//base,base) + convertString[n%base]测试:1、print(...
2019-04-08 17:50:41
861
原创 leetcode25--k个一组翻转链表 python
给出一个链表,每 k 个节点一组进行翻转,并返回翻转后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么将最后剩余节点保持原有顺序。示例 :给定这个链表:1->2->3->4->5当 k = 2 时,应当返回: 2->1->4->3->5当 k = 3 时,应当返回: 3->2->1-&g...
2019-01-15 16:10:26
536
原创 numpy.array 相关常用操作
1.np.array构造函数用法:np.array([1,2,3,4,5])1.1 numpy array 和 python list 有什么区别?标准Python的列表(list)中,元素本质是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费内存和CPU。因此,Numpy提供了ndarray(N-dimensional array object)对象:...
2019-01-15 10:35:40
620
转载 XGBoost参数说明
转自:https://blog.youkuaiyun.com/han_xiaoyang/article/details/52665396本文仅收集模型参数定义,具体代码示例请参考上述链接。1、简介XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这...
2018-12-30 10:42:23
2724
原创 二分查找_python
1、循环非递归方法:def binarySearch(c,k): l=0 r=len(c)-1 while l<=r: mid = (l+r)//2 if k < c[mid]: r = mid - 1 elif k > c[mid]: l = mid + 1...
2018-12-26 17:27:43
168
原创 推荐系统5---多目标排序
一、多目标排序1.1为什么要有多目标排序?⼯业界推荐系统多基于隐式反馈•Global bias:不同⽬标表达不同的偏好程度•Item bias:单个⽬标衡量不全⾯(标题党)•User bias:⽤户表达满意度的⽅式不同•综合⽬标收益最⼤化多⽬标排序的难点多⽬标 vs CTR预估**•**部分⽬标数据稀疏,模型准确率低**•**在线服务计算量⼤**•**多个⽬标间重要性难以量...
2018-12-21 15:49:10
4269
转载 Sklearn-GBDT(GradientBoostingDecisionTree)梯度提升树
https://blog.youkuaiyun.com/CherDW/article/details/54982805一、GBDT概念描述GBDT是集成学习Boosting家族的成员,但是却和传统的Adaboost有很大的不同。回顾下Adaboost,是利用前一轮迭代弱学习器的误差率来更新训练集的权重,这样一轮轮的迭代下去。GBDT也是迭代,使用了前向分布算法,但是弱学习器限定了只能使用CART回归树模型...
2018-12-17 09:17:03
11169
原创 推荐系统二---召回算法和业界最佳实践(一)
业界通用推荐系统框架结构如下:Match &amp;amp;amp; Rank定义:Match基于当前user(profile、history)和context,快速在全库里找到TopN最相关的item,给Rank来做小范围综合多目标最大化通常做法:用各种算法做召回,比如user/item/model-based CF,Content-based,Demographic-based,DNN-Embeddi...
2018-12-16 01:31:07
17335
1
转载 转:SKlarn-RandmForest 随机森林学习总结
本文转自:https://blog.youkuaiyun.com/cherdw/article/details/54971771scikit-learn中,RandomForest的分类类是RandomForestClassifier,回归类是RandomForestRegressor,需要调参的参数包括两部分,第一部分是Bagging框架的参数,第二部分是CART决策树的参数。sklearn随机森林官网...
2018-12-13 01:00:55
350
原创 推荐系统第四课(用户建模----召回排序都会用到)wide and deep Practice
1 learning to rank 回顾Learning to Rank for Information Retrieval,Tie-Yan :Liuhttps://www.cda.cn/uploadfile/image/20151220/20151220115436_46293.pdf2、点击预估模型模型:
2018-12-09 16:36:30
4693
原创 leetcde94 二叉树的中序遍历 python
给定一个二叉树,返回它的中序 遍历。示例:输入: [1,null,2,3]12/3输出: [1,3,2]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = No...
2018-12-09 15:46:53
177
1
原创 leetcode145二叉树的后序遍历
给定一个二叉树,返回它的 后序 遍历。示例:输入: [1,null,2,3]12/3输出: [3,2,1]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = N...
2018-12-09 15:23:34
190
原创 leetcode144 二叉树的前序遍历
给定一个二叉树,返回它的 前序 遍历。示例:输入: [1,null,2,3]12/3输出: [1,2,3]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = N...
2018-12-09 11:39:21
199
原创 leetcode102 层次遍历
给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。例如:给定二叉树: [3,9,20,null,null,15,7],3/ 9 20/ 15 7返回其层次遍历结果:[[3],[9,20],[15,7]]方法1:递归# Definition for a binary tree node.# class TreeNode:# ...
2018-12-09 11:10:16
248
转载 python实现二叉树和七种遍历
转载:https://blog.youkuaiyun.com/Bone_ACE/article/details/46718683介绍:树是数据结构中非常重要的一种,主要的用途是用来提高查找效率,对于要重复查找的情况效果更佳,如二叉排序树、FP-树。另外可以用来提高编码效率,如哈弗曼树。利用Python实现树的构造和几种遍历算法:>树的构造>递归实现先序遍历、中序遍历、后序遍历>...
2018-12-09 00:06:42
434
原创 机器学习分类器性能指标总结(附类别不平衡问题研究)
一、ROC曲线(1)定义ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specifici...
2018-12-08 16:59:46
2351
原创 练习总结 +sklearn参数选择调优
kaggle 自行车比赛相关部分练习总结df_train = pd.read_csv('C:/Users/zhangy/Desktop/kaggle_competition_feature_engineering/kaggle_bike_competition_train.csv')# print(train.shape)# print(train.apply(lambda x:sum(x....
2018-12-08 14:48:23
8719
原创 leetcode 78 子集python
给定一组不含重复元素的整数数组 nums,返回该数组所有可能的子集(幂集)。说明:解集不能包含重复的子集。示例:输入: nums = [1,2,3]输出:[[3],[1],[2],[1,2,3],[1,3],[2,3],[1,2],[]]class Solution: def subsets(self, nums): """ :...
2018-12-08 12:29:21
900
转载 letcode 322零钱兑换 python
给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,返回 -1。示例 1:输入: coins = [1, 2, 5], amount = 11输出: 3解释: 11 = 5 + 5 + 1示例 2:输入: coins = [2], amount = 3输出: -1解法1:DPcla...
2018-12-08 11:15:10
696
原创 leetcode198打家劫舍----python
class Solution:def rob(self, nums):“”":type nums: List[int]:rtype: int“”"n = len(nums)dp=[0]*len(nums)if n == 0:return 0if n == 1:return max(nums)dp[0] = nums[0]dp[1]= max(nums[0],nums[1]...
2018-12-07 13:00:33
274
1
原创 leetcode 64最小路径和 python
给定一个包含非负整数的 m x n 网格,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。说明:每次只能向下或者向右移动一步。示例:输入:[[1,3,1],[1,5,1],[4,2,1]]输出: 7解释: 因为路径 1→3→1→1→1 的总和最小。思路:使用动态规划方法1:class Solution: def minPathSum(self, gr...
2018-12-06 23:17:05
222
转载 Tensorflow官方文档word2vec_basic.py中文注释
# Copyright 2015 The TensorFlow Authors. All Rights Reserved.## Licensed under the Apache License, Version 2.0 (the &quot;License&quot;);# you may not use this file except in compliance with the License.# Y...
2018-12-04 00:25:36
611
转载 leetcode40组合总数 Python
给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。candidates 中的每个数字在每个组合中只能使用一次。说明:所有数字(包括目标数)都是正整数。解集不能包含重复的组合。示例 1:输入: candidates = [10,1,2,7,6,1,5], target = 8,所求解集为:[[1...
2018-12-03 23:34:08
818
转载 leetcode 39组合总数 python
给定一个无重复元素的数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。candidates 中的数字可以无限制重复被选取。说明:所有数字(包括 target)都是正整数。解集不能包含重复的组合。示例 1:输入: candidates = [2,3,6,7], target = 7,所求解集为:[[7]...
2018-12-03 23:25:37
677
1
原创 leetcoe 35 搜索插入位置
给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。你可以假设数组中无重复元素。示例 1:输入: [1,3,5,6], 5输出: 2示例 2:输入: [1,3,5,6], 2输出: 1示例 3:输入: [1,3,5,6], 7输出: 4示例 4:输入: [1,3,5,6], 0输出: 0class So...
2018-12-03 22:42:41
118
原创 leetcode 34在排序数组中查找元素的第一个和最后一个位置 python
给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。你的算法时间复杂度必须是 O(log n) 级别。如果数组中不存在目标值,返回 [-1, -1]。示例 1:输入: nums = [5,7,7,8,8,10], target = 8输出: [3,4]示例 2:输入: nums = [5,7,7,8,8,10], targ...
2018-12-03 00:18:54
200
原创 推荐系统第三课
1、导入库文件from __future__ import print_functionimport collectionsimport mathimport numpy as npimport osimport randomimport tensorflow as tfimport zipfilefrom matplotlib import pylabfrom six.mov...
2018-12-02 23:55:36
526
原创 推荐系统第一课---bandits
import numpy as npimport matplotlib.pyplot as pltimport math#老虎机个数number_of_bandits=10#老虎机的臂数number_of_arms=10#尝试数number_of_pulls=10000#epsepsilon=0.3#最小的decaymin_temp = 0.1#衰减率decay_rat...
2018-12-02 23:47:58
865
1
原创 leetcode 559 N叉树的最大深度 python
给定一个 N 叉树,找到其最大深度。最大深度是指从根节点到最远叶子节点的最长路径上的节点总数。例如,给定一个 3叉树 :我们应返回其最大深度,3。说明:树的深度不会超过 1000。树的节点总不会超过 5000。class Solution(object): def maxDepth(self, root): &quot;&quot;&quot; :type root: N...
2018-12-01 12:02:46
426
原创 leetcode111 二叉树的最大深度 python
给定一个二叉树,找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7],3/ 9 20/ 15 7返回它的最小深度 2.# Definition for a binary tree node.# class TreeNode:# de...
2018-12-01 11:37:48
227
原创 leetcode 33 搜索旋转排序数组 python
假设按照升序排序的数组在预先未知的某个点上进行了旋转。( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。你可以假设数组中不存在重复的元素。你的算法时间复杂度必须是 O(log n) 级别。示例 1:输入: nums = [4,5,6,7,0,1,2], targ...
2018-12-01 10:58:37
162
原创 leetcode28实现strStr() python
实现 strStr() 函数。给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。示例 1:输入: haystack = “hello”, needle = “ll”输出: 2示例 2:输入: haystack = “aaaaa”, needle = “bba...
2018-11-27 22:02:13
123
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人