
其他技术
ljtyxl
大数据,智能算法研究,包括机器学习,深度学习,强化学习nlp等在推荐领域的应用和智能算法研究,比赛之类的合作联系qq:1329331182,wx:ljt1761
展开
-
Python中的yield
通常的for...in...循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。 它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。 生成器是可以迭代的,但只可以读取它一次。因为用的时候才生成。比如 mygenerator = ...转载 2019-04-03 11:37:31 · 108 阅读 · 0 评论 -
jupyter notebook使用
三、主面板(Notebook Dashboard)打开Notebook,可以看到主面板。在菜单栏中有Files、Running、Clusters、Conda四个选项。用到最多的是Files,我们可以在这里完成notebook的新建、重命名、复制等操作。具体功能如下:在Running中,可以看到正在运行的notebook,我们可以选择结束正在运行的程序。至于Clusters、Conda一般...原创 2019-03-22 21:45:16 · 761 阅读 · 0 评论 -
斯坦福大学stanford
https://www.stanford.edu/斯坦福大学(Stanford University),全名小利兰·斯坦福大学(Leland Stanford Junior University),简称“斯坦福(Stanford)”,位于美国加州旧金山湾区南部的帕罗奥多市(Palo Alto)境内[1],临近世界著名高科技园区硅谷,是世界著名的私立研究型大学[1]。斯坦福大学占地约...原创 2019-03-13 09:45:52 · 934 阅读 · 0 评论 -
url去重:布隆过滤器-python实现
布隆过滤器是什么?在爬虫爬取网页的时候,我们会做的一件事情是判断这个网页是否之前已经爬取过。这个检验步骤在之前的文章里我是用了一个#集合#来保存已经爬取过的网页,而在计算机当中,使用hash表来保存。Hash表的好处就是能够快速定位,而它的缺点也众所皆知,就是存储空间的浪费。为什么会浪费存储空间呢?哈希表方法需要把实实在在的具有特定长度的元素的信息指纹存储在内存或硬盘中的哈希表中(比如每...转载 2019-03-08 10:19:40 · 1548 阅读 · 0 评论 -
2018年,20大Python数据科学库都做了哪些更新
作者:呆鸟 Python爱好者社区专栏作者,未经容许,禁止转载简书专栏:https://www.jianshu.com/u/be48b04ecc3e坚持学习Python和English两门语言,致力于让读译文就像读中文的呆鸟标签:Bokeh,Data Science,Keras,Matplotlib,NLTK,numpy,Pandas,Plotly,Python,PyT...翻译 2019-03-07 22:41:40 · 278 阅读 · 0 评论 -
Python高性能计算库—Numba
Python高性能计算库—Numba摘要: 在计算能力为王的时代,具有高性能计算的库正在被大家应用于深度学习。例如:Numpy,本文介绍了一个新的Python库——Numba, 在计算性能方面,它比Numpy表现的更好。 最近我在观看一些SciPy2017会议的视频,偶然发现关于Numba的来历--讲述了那些C++ 横行者因为对Gil Forsyth和Lorena Barba失去信心而编写的一...原创 2019-03-07 11:19:56 · 1031 阅读 · 0 评论 -
英文字母发音
英文字母发音48个英语音标英语国际音标表(48个)元音(20个)长元音/ɑ:/ /ɔ:/ / ɜ:/ /i:/ /U:/短元音/ʌ/ /ɒ/ /ə/ /ɪ/ /ʊ//e/ /æ/ /eɪ/ /aɪ/ /ɔɪ/双元音/ɪə/ /eə/ /ʊə/ /əʊ/ /aʊ/ 辅音p b t d k ɡ ʧʤ tr dr ʦ ʣ f vθ ð s z ...原创 2019-02-15 11:33:13 · 2931 阅读 · 1 评论 -
敏捷思维- 架构设计中的方法学(1)
1.从方法论看架构设计方法论对软件开发而言意味着什么?我们如何看待软件开发中的方法论?方法论能够成为软件开发的救命稻草吗?在读过此文后,这些疑惑就会得到解答。在第一篇文章中,我们来了解标题中的一些词的含义。方法学是什么? 敏捷是什么? 为什么讨论架构?方法论方法论的英文为Methodology,词典中的解释为"A series of related methods or tec...翻译 2019-01-23 09:48:16 · 273 阅读 · 0 评论 -
Refactoring
Refactoring当架构模型进行迭代的过程中,必然伴随着对模型进行修改和改进。我们如何防止对模型的修改,又如何保证对模型进行正确的改进?Context架构模型通过精化、合并等活动之后,将会直接用于指导代码。而这个时候,往往就会暴露出一些问题出来,通常在实际编码中,发现架构存在或大或小的问题和错误,导致编码活动无法继续。这时候我们就需要对架构模型进行修改了。而架构设计的过程本身是一个...原创 2019-01-24 20:01:28 · 722 阅读 · 0 评论 -
分层
分层 (上)在定义了架构愿景之后,团队中的所有人员应该对待开发的软件有一定的了解了。但是,面对一个庞大的软件系统,接下来要做些什么呢?分而治之的思想是计算机领域非常重要的思想,因此我们也从这里开始入手。要进行应用软件的设计,分层是非常重要的思想,掌握好分层的思想,设计出的软件是可以令人赏心悦目的。由于这一章的重要性和特殊性,本章的内容分为上下两节,并不采取模式描述语言的方式。分层只是将系...翻译 2019-01-24 20:00:40 · 485 阅读 · 0 评论 -
设计与愿景
4.团队设计团队设计是敏捷方法论中很重要的一项实践。我们这里说的团队,指的并不是复数的人。一群人就是一群人,并没有办法构成团队。要想成为团队,有很多的工作要做。我们之所以考虑以团队为单位来考虑架构设计,是因为软件开发本身就不是一件个人的事情,架构设计更是如此。单个人的思维不免有考虑欠妥之处,单个人的学识也不可能覆盖所有的学科。而组织有效的团队却能够弥补这些缺憾。Context谁来负...转载 2019-01-24 19:58:59 · 3497 阅读 · 0 评论 -
源自需求 3
我们说,和重型方法偏重于计划、过程和中间产物不同,敏捷方法更加看重人和沟通。人和沟通永远是第一位的,而计划、过程和中间产物,那只是保证沟通、实现目标的手段。这并不是说计划、过程、中间产物不重要,只是不能够本末倒置注:我们把中间产物定义为为了实现跨边界的沟通而制定的文档、模型、代码。例如设计文档、数据模型等。参考RUP的Artifact。评判软件成功的标准有很多,对于敏捷方法论来说,成功的标准...转载 2019-01-24 19:57:27 · 232 阅读 · 0 评论 -
设计模式 - 模版方法
设计模式 - 模版方法场景小张的团队最近接受一个需求,实现实现一家咖啡店的冲泡咖啡和茶的冲泡自动化。之前这家咖啡店都是由咖啡师傅手动进行调制咖啡和茶。现在咖啡店需要引入自动化的点单和调制饮料的系统,小张负责实现调制饮料的功能。咖啡师傅手工冲泡咖啡和茶的流程:冲泡咖啡:把水煮沸用沸水冲泡咖啡把咖啡倒入杯子加糖和牛奶冲泡茶:把水煮沸用沸水冲泡茶叶把茶倒入杯子加柠檬小张先简单...转载 2019-01-18 17:22:42 · 144 阅读 · 0 评论 -
JupyterHub与OpenLDAP集成
原文1.文档编写目的Fayson在前面文章《如何在非安全的CDH集群中部署Jupyter并集成Spark2》及《如何在非安全的CDH集群中部署多用户JupyterHub服务并集成Spark2》中介绍了Jupyter与JupyterHub的部署与Spark2集成。JupyterHub的用户默认是基于OS系统用户,对于用户的管理和维护都需要在服务器上进行操作不便于管理。本篇文章Fayson主要...转载 2019-05-28 19:42:05 · 1371 阅读 · 0 评论