
算法
文章平均质量分 68
Together_CZ
欲戴其冠,必承其重
展开
-
基于face_recognition构建的人脸识别系统以及相关应用
face_recognition是一个强大、简单、易上手的人脸识别开源项目,并且配备了完整的开发文档和应用案例,特别是兼容树莓派系统。face_recognition一经开源发布就得到的广泛的热捧,使用简单,功能强大成为其非常显著的标签,在我之前的文章《基于深度学习的人脸识别系统实战》中,详细介绍了从零开始搭建一个完整的人脸识别系统的详细过程以及完整的代码实现讲解,相信是能够快速...原创 2019-10-31 09:49:06 · 2244 阅读 · 4 评论 -
python求解重叠区域线段覆盖总长度
来源于网上的一道面试题目,看到后感觉挺新颖的,正好这一篇博客也有了实现,感觉思路很妙,作者给出来的是Java版本的,这里我简单给出来一下python版本的,先贴一下问题的描述:问题描述:现有一直线,从原点到无穷大。这条直线上有N个线段。线段可能相交。问,N个线段总共覆盖了多长?(重复覆盖的地区只计算一次)思路:依据线段的区间将线段的区间像素单位化,即将计原创 2017-07-31 21:42:09 · 8332 阅读 · 4 评论 -
20170910算法工程师在线笔试
今天三场笔试终于接近尾声了,接下来要歇歇工作了,晚上依旧很困,不过做题还是要提起精神,一共三道题,AC了2.4道,考完看到讨论区一堆大神再说只AC了2.9,哎,好心塞,感觉已经尽力了,也就这样了,趁着还有印象简单贴一下自己的方法,不过我的代码很low,写的时候只图过就行,莫笑。若有第三题平方串AC 的还希望不吝赐教,谢谢第一题:括号深度问题如:()()()深度为1,((()))深度为3原创 2017-09-10 21:14:41 · 3479 阅读 · 0 评论 -
python求解矩阵搜索问题,矩阵中每一行和第一列都是递增的 给定一个元素查找矩阵中是否存在该元素
矩阵搜索问题,给定一个矩阵,矩阵中的而每一行都是递增的,第一列也是递增的,其余信息未知,给定一个元素查找矩阵中是否存在该元素,乍眼一看跟矩阵中行列都是递增的题目一样,其实不然,这里只有第一列是递增的其余都是不知道的,所以就不能按照行列都是递增的方法来做了 这里简单说一下自己的思路,如下这个矩阵:1 3 15 17 192 4 16 17 223 4 21 4原创 2017-09-01 17:02:24 · 5861 阅读 · 0 评论 -
python求解最大子序列乘积问题,子序列可连续也可不连续
题目意思很简单,与之前博文中的最大子序列和问题其实是如出一辙的,只是这里需要考虑的问题会多一点,因为加法的话不会出现负负得正的情况,在这里要求最大子序列乘积就需要维持两个动态遍历,一个保存上一次乘积留下的最大值,一个保存上一次乘积留下的最小值,这里如果接下来的数字为正的话最大值的结果发挥作用,如果接下来的值为负数的话最小值发挥作用,有了这个考虑接下来就可以按照这个思路来做了。1.对于子序列可以原创 2017-09-02 15:23:48 · 4907 阅读 · 0 评论 -
python实现从二维矩阵左上角到右下角的出路数寻找
问题: 给定一个二微矩阵,从左上角出发到右下角,每一次只能往下和往右走,求一共有多少种走法 具体实现如下: #!usr/bin/env python#encoding:utf-8'''__Author__:沂水寒城功能:在二维矩阵中向下和向右走,实现从左上角走到右下角'''def count_dp(x,y): ''' 动态规划原创 2017-09-29 10:36:38 · 7112 阅读 · 4 评论 -
20171017在线编程题
筛选出对称的字符串,按指定规则排序输出 下面是具体实现:def is_huiwen(one_str_list): if len(one_str_list)==1: return True else: half=len(one_str_list)/2 if len(one_str_list)%原创 2017-10-17 21:12:42 · 3444 阅读 · 0 评论 -
中文分词项目(开源/API接口)总结
转自:http://blog.youkuaiyun.com/wwjiang_ustc/article/details/50383423转自:新浪SAE中文分词接口官网说明:http://sae.sina.com.cn/?m=apistore&a=detail&service_code=AA,SAE分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。转载 2017-11-17 10:39:40 · 4772 阅读 · 0 评论 -
Python获取sklearn库中iris数据写入本地csv文件,可视化展示数据并进行分类、聚类实验以及结果可视化
今天有点时间就找来了iris数据实验了一下,就是可视化绘图感觉很好玩,就拿这个数据集做了一个实验,下面是简单的实验流程1.获取iris数据写入本地csv文件,实现如下:def write_iris_data2csv(csvpath='result/show/iris_data.csv'): ''' 读取sklearn库中的iris数据写入到csv文件中原创 2017-12-02 19:39:08 · 12032 阅读 · 2 评论 -
使用Sklearn模型做分类并绘制机器学习模型的ROC曲线
简单的实验,主要是使用sklearn库中的RFR模型来进行回归分析并绘制相应的ROC曲线,主要是熟悉流程,下面是具体的实现:#!usr/bin/env python#encoding:utf-8'''__Author__:沂水寒城功能:使用RFR模型'''import csvfrom sklearn.metrics import roc_curve, aucfrom原创 2017-11-24 22:24:15 · 8547 阅读 · 4 评论 -
pandasql库学习使用之在Python中执行SQL语句
pandas是一个很不错的框架,对于格式化的数据处理极为便利,最近比较频繁的使用到SQL语句,由于开发语言使用的是Python自然想找一下是否有这方面的库,于是乎还真的被我给找到了,pandasql就是这样的一个库,当然Python从来不缺乏第三方的库,比如进行SQL处理的时候有Mysql相关的,有sqlite相关的等等,就不一一枚举了,pandasql好在是可以与pandas完美的结合,会减少很原创 2017-12-06 19:59:51 · 7314 阅读 · 0 评论 -
20170910算法工程师在线笔试之求第n个丑数
今天好晕,不过又是幸运的,因为编程我先做的是第二题,果然第一题跪了,暴力法破解通过了20% 简单说一下丑数是什么 因数只有2,3,5这三种的数就是丑数,在这里认为1是第一个丑数 下面是具体实现:#!usr/bin/env python#encoding:utf-8'''__Author__:沂水寒城功能:求第n个丑数'''def fi原创 2017-09-10 17:20:49 · 3425 阅读 · 0 评论 -
python求解给定一个整数N,求N!末尾有多少个0,求N!的二进制中最低位1的位置
之前做的银联题目有一道题目就是1000的阶乘尾部有多少个0,记得这样的题目之前是做过的,但是当时就是时间太紧了没想起来,今天又遇到这个题目,索性查查看看是怎么算的,然后程序计算一下,加深理解,对于这样的题目网上也有很多的解法,核心的思想就是找规律看问题的本质是什么的,因为不可能让你求一下n!的阶乘然后自己去数一下一共末尾有多少个0,会溢出的。 思路: 如果想要尾部出现0必然离不开原创 2017-09-01 14:02:15 · 6646 阅读 · 0 评论 -
拼多多算法工程师笔试题之求解一维无序数组中三个数字乘积最大值(正负零均存在)
题目:给定一个包含正负数和零的一维无序数组,找到三个数字使得乘积最大思路:这道题目是个坑啊,我上来都没看直接当做之前一篇博文中求解矩阵中最大子数组和的问题了,采用动态规划的思想来解决,结果呢,只通过了10%左右,感觉很不可思议,于是重新读题发现不对了,人家说的是三个数字的乘积我这里动态规划的是两个数字的乘积,改成了三个数字的成绩也不对,瞬间郁闷了,不知道问题出现在了哪里,就只好自己在草原创 2017-08-01 22:46:07 · 6274 阅读 · 11 评论 -
拼多多算法工程师笔试题之分配巧克力
问题:给定n个孩子以及每个孩子需要的巧克力,给定m个巧克力以及巧克力的重量输出:最多可以分给几个人思路:一块巧克力不能分给多人,多人也不能同分一块巧克力,那么符合条件的就是一块巧克力分给一个人指定最低的重量后巧克力剩余量大于0即可下面是具体的实现:#!usr/bin/env python #encoding:utf-8 '''__Author__原创 2017-08-02 10:32:19 · 6079 阅读 · 0 评论 -
2017.8.12在线笔试编程真题总结
昨天参加了一个笔试,说实在做的很烂,自己主要刚遇上烦心事,心思也根本不在题目上,草草写了就交卷了,今天重新打开习题做一次,有几道题目思路可能不是很对或者是没有什么思路,结果没有AC,如果有通过的朋友还望可以指点一下,在这里简单贴一下8道题目的代码,我全都是使用python写的,有一个缺点就是会出现运行超时的问题,其中有两道题目都是运行超市只能AC50%,但是其中一道题目修改了策略之后就通过了,但是原创 2017-08-13 09:14:49 · 3813 阅读 · 0 评论 -
20170826滴滴算法工程师笔试
今天有点坑的就是,本以为题目还是一如既往的套路,编程会卡在那里走不下去,结果是选择题好多知识点都忘了,一心想着快点做完好去做编程题,换来的结果就是选择题一顿瞎写,编程题不到十分钟AC了,只能说有点另类,主要也是由于今天的题目搭配颠覆了之前的套路,好了 ,就当做是一个教训吧,下面简单写一下编程部分:题目一 题意很好理解就是给定一个数组求其中子序列的最大和 思路:原创 2017-08-26 16:15:58 · 5242 阅读 · 0 评论 -
python实现求解列表中元素的排列和组合问题
求解列表中元素的排列和组合问题这个问题之前就遇到过几次没有太留意,最近在做题的时候遇上挺多的排列组合问题的,想来有必要温习一下了,今天花点时间写一下,之前都是手工写的,后来知道可以直接使用python的内置模块就可以完成这个工作了,今天就使用python的itertools模块来完成这个工作,一共解决四个问题:1.生成排列,列表中元素不允许重复出现2.生成排列,列表中元素可以重复出现3原创 2017-08-28 10:46:13 · 12021 阅读 · 7 评论 -
python求解在给定递减数组中寻找两个数和等于定值,乘积最小
问题很简单直接看实现即可#!usr/bin/env python#encoding:utf-8'''__Author__:沂水寒城功能:在给定递减数组中寻找两个数和等于定值,乘积最小'''def test_func(num_list, num): ''' ''' tmp=num_list[0]*num_list[1] length=le原创 2017-08-29 20:27:55 · 4177 阅读 · 0 评论 -
20170917软件工程师在线笔试之员工幸福感问题
这个题目很简单,但是不知道怎么回事从代码提交到现在一直都是40%的AC率,从来就没有变化过,很是郁闷,真的是做题都要睡着了就不做了提交睡觉了,下面是我的代码实现,还望指点一下:题目输入:第一行是数据组数n接下来每行都有两个整数,第一个表示员工希望这个事多长时间完成,第二个数表示完成的截止时间如果按时完成幸福度为100,否则减去超时的数量import operatorn原创 2017-09-17 01:32:04 · 3315 阅读 · 0 评论 -
20170917软件工程师在线笔试之员工点外卖问题
问题很简单就是有n种饭,随便选m种,一共有多少种选法,即求解C(n,m)问题 之前一直不能全部AC,问题出在特殊情况上面,如n,m为0的情况等等 下面是AC的代码:def jiecheng(n): res=1 for i in range(1,n+1): res*=i return res n=int(raw_inp原创 2017-09-17 01:36:16 · 3310 阅读 · 0 评论 -
python求解最大子序列问题,子序列可连续或不连续
最大子序列问题在笔试中已经遇上过很多次了,今天只是想简单的总结一下,最大子序列主要分为两种类型:一种是子序列可以不连续的最大子序列和(这个比较简单,思路就是累加非负数即可)、另一种是子序列必须连续的最大子序列和(这个稍微复杂是一个动态规划问题),下面就简单就这两种问题做一下总结,具体看如下实现:#!usr/bin/env python#encoding:utf-8'''__Au原创 2017-08-31 11:28:41 · 6761 阅读 · 1 评论 -
python找出数组中第2大的数字
首先感谢提出问题的博友,程序是去年找工作的时候写的,整理的比较粗心,错误已经纠正了。 题目比较简单直接看实现即可,具体的注释在代码中都有: #!usr/bin/env python#encoding:utf-8 '''__Author__:沂水寒城功能:找出数组中第2大的数字''' def find_Second_large_num(num_list): ...原创 2017-09-01 11:36:48 · 20121 阅读 · 10 评论 -
one_hot编码学习与实践
one_hot编码之前也接触过但是并没有真正去了解过,正好现在遇上一个问题就是我有一堆人的职业,我需要将这些职业向量化处理,最简单粗暴没理由的做法就是按照顺序对所有的职业进行数值的编码,数值编码的值就是对应职业的特征值,这样其实是很不合理的,因为职业并不是一个连续的变量,赋予其连续的数值本身就是没有意义的,比如:我有三个职业:司机、营养师、教练,如果采用连续数值的方式编码的话就会是:司机:1原创 2018-01-03 20:34:55 · 3446 阅读 · 0 评论 -
常用数据科学方法总结梳理笔记
常用数据科学方法 【未经允许,不得转载】 ...原创 2019-05-10 16:27:06 · 9425 阅读 · 0 评论 -
Python使用hashlib模块生成给定文本数据的签名摘要信息(包括各种哈希函数)
今天晚上遇上一个需要使用签名摘要的问题,想到了研究生期间使用hashlib模块曾经产生了需要的签名,这里就重操旧业,找出来了原来的项目文件,梳理了一下,就完成了这个需求了,这里只是为了简单地记录一下,也是希望能帮到需要的朋友,实现很简单,下面是具体的实现,里面有相应的注释,就不多解释了。hash_func.py#!usr/bin/env python#encoding:utf...原创 2018-08-21 20:54:53 · 4195 阅读 · 0 评论 -
Python基于wordnet实现词语相似度计算分析
这里从百度百科里面拿来关于“wordnet”的定义和介绍:WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。它是一个覆盖范围宽广的英语词汇语义网。名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合...原创 2019-08-08 11:39:12 · 4693 阅读 · 9 评论 -
Python实现对给定的列表中连续数字的寻找
列表中连续数字寻找的问题并不是什么很新鲜的问题,在现实生活中的很多场合中都有应用,比如:给你一支股票的涨跌数据,让你找出来它上升期有哪些,下降期有哪些;给你一堆大气因子的监测数据,让你找出来连续的污染期。。。。。。等等,诸如此类的应用还有很多。 把实际业务场景里面的需求抽象出来就是本文的标题内容了,今天简单地实现了这个需求,具体如下:#!usr/bin/env py...原创 2019-08-13 14:27:07 · 5799 阅读 · 10 评论 -
堆叠式神经网络模型stackingKeras【Stacking+Keras】+GUI可视化应用,原理讲解+代码详细实现说明【超强的模型神器,支持自定义】
声明: 本博客中的VIP系列博客内容严禁转载,未经允许不得以任何形式进行传播,违者追究侵权责任! 堆叠式神经网络模型【Stacking+Keras】+GUI可视化应用 ...原创 2019-08-10 12:22:32 · 2860 阅读 · 1 评论 -
基于词典和弱标注信息的电影评论情感分析系统
声明: 本博客中的VIP系列博客内容严禁转载,未经允许不得以任何形式进行传播,违者追究侵权责任! 基于词典和弱标注信息的电影评论情感分析系统 ...原创 2019-08-10 17:46:39 · 1516 阅读 · 0 评论 -
Python实现四种方法求解计算阶乘和(1!+2!+3!+...+n!)
求解给定数字的阶乘是非常简单的一件事,用Python来实现也是非常简单的,这里的问题是给你一堆连续数字,求解他们的阶乘总和,这里我一共想到了4种不同的实现方法来解决上述问题,并对其做了扩充,上面是连续数字的阶乘和,我给的方法只需要稍加修改同样可以求解不连续数字的阶乘和,下面是具体的实现:#!usr/bin/env python#encoding:utf-8from __fut...原创 2019-09-03 19:14:56 · 35339 阅读 · 0 评论 -
燃情动作——《速度与激情:特别行动》影评数据分析可视化
在八月底迎来了预热已久的《速度与激情:特别行动》火爆动作大片,之前看到的一个预报片段就是巨石强森单臂拉着直升机,感觉真的是美国人好喜欢营造英雄主义的感觉,虽然我也就是喜欢看这种无脑的火爆动作大片的人,所以也就是算是认同了这种情节的设计吧,看完感觉还可以吧,没有非常突出的感觉但是也有令人感到惊艳的地方,比如:剧中肖的妹妹等女配角的表现,个人觉得还是很不错的。 闲话就说到这里...原创 2019-09-03 19:50:56 · 711 阅读 · 2 评论 -
Python实现【指数函数+对数函数】复杂组合函数曲线的拟合
在实际的应用中,我们经常会遇到一些曲线拟合得需求,尽管,实际上点对之间可能是没有绝对意义上的函数关系的,但是为了更好地量化表示和计算,我们往往期望于从原始的数据集中尽可能地挖掘出来可能的函数关系,今天我遇上了一个问题就是如何去拟合指数函数+对数函数这种组合型函数曲线,简单看一下具体的实现内容:def logExpFunc(): ''' 【指数+对数】混合函数拟合...原创 2019-09-04 14:58:06 · 9406 阅读 · 11 评论 -
基于深度学习的人脸识别系统实战【从零开始搭建你的人脸识别系统】
人脸识别如今已经是家喻户晓了,几乎每天都要跟他打交道,我们上班的考勤机就是一个人脸识别系统,我们俗称“刷脸机”。进入火车站或者机场的时候也会有人脸识别的需要,这里面都是深度学习的计算力在支撑,今天主要的内容是自己动手完整地去实践整个人脸识别系统,虽说人脸识别已经不是很新鲜的东西了,但是对于一个数据挖掘从业者或者初学者来说想要完整地做出来一个属于自己的人脸识别项目还是需要花费一定的时...原创 2019-09-20 14:46:06 · 7391 阅读 · 7 评论 -
优质书籍资源仓库推荐【欢迎推送书籍】
今天给大家分享一个书籍资源目录,主要是一位博主整理收藏的各种领域的学习资料,这是一个需要持续积累的过程,大家需要的话可以下载使用,仅用作学习用途,同时呢,如果大家有好的书籍也可以发送给博主或者是提供下载的链接,由博主下载后提交至GitHub仓库中。 书籍仓库截图如下: 看到上面还有程序员健康养身的书籍,这个我还是比较喜欢的。 仓库在这里。...原创 2019-08-05 14:45:47 · 932 阅读 · 0 评论 -
python基于scipy拟合构建所需统计分析模型,可视化分析展示
最近的工作中有一个需求就是,给我一批历史的数据,需要我基于统计分布模型来去拟合一下原始的数据,挖掘出来数据最有可能的统计分布是怎么样的,为后面的参数区间计算或者是概率值计算提供一个指导。 下面是我手中数据的概率分布情况: 从上面的概率分布函数曲线来看并不是一个正态分布的模型,所以我们就需要来去找别的统计模型来进行拟合分析了,标准模型比如:正态分布模型、...原创 2019-07-22 19:55:19 · 2240 阅读 · 0 评论 -
python生成指定年份所有的天,并计算每天属于一年的第几周和周几
今天有一个功能点是需要按照日历上面的日期来进行一些数据的计算工作,在计算之前我需要将每一天属于一年52周里面的第几周和周几计算出来,在计算之前我还需要有一年内的所有天的日期,整体的思路是十分清晰的,实现流程也没有特别复杂的地方,主要就是要细致一点,好了,不多说了,具体实现如下:#!usr/bin/env python# encoding:utf-8from __future...原创 2019-07-23 20:07:21 · 2171 阅读 · 0 评论 -
超大规模文本数据清洗、查找、匹配神器之python模块flashtext学习使用
今天在找资料的时候无意间查找一个跟眼下工作不太相关但是一眼看到就很感兴趣的内容,讲解的是文本中数据的查找替换等的一个操作工具。之前做了比较多的相关的工作是网页html处理的工作,这里经常替换或者查找指定文本字符串的时候我们都是采用正则表达式的方法来完成的,书写相对来说也是比较灵活的,直到今天发现了flashtext,我才意识到原来同样的事情可以用不一样的方式提高很多的效率也更加便捷了。...原创 2018-09-13 19:07:54 · 7237 阅读 · 0 评论 -
感知器分类模型回顾与python实现
今天有一个任务需求就是要使用感知器分类模型来对我们手里面的数据集进行简单的分类实验,我们都知道感知器是一种比较简单的线性分类器,只能够处理线性可分的样本数据,为了再回顾一下上学时候的内容,我特意翻出来以前的文档,下面是感知器算法的简单介绍: 简单看过原理后,我们看下下面这一个简单的算法实例: ...原创 2019-03-30 15:09:10 · 4065 阅读 · 2 评论 -
书接上文——python实现感知分类器模型分类过程动态可视化
上一篇博文中我们学习和回归了一下感知器分类模型,今天还是在上文的基础上做了一点扩展,上文中的感知器分类一方面是分类的效果有时候不太好,另一方面是没有实现分类过程的动态可视化,我们都知道感知器分类模型本质上就是在每一次迭代过程中进行权重动态调整的过程,今天我们基于这个出发点来实现每一轮迭代权重更新值得输出与分类的结果的动态绘制,内容很简单,具体如下:#!usr/bin/env pyt...原创 2019-03-31 11:17:16 · 2368 阅读 · 0 评论