- 博客(138)
- 收藏
- 关注
转载 Redis学习笔记-2019.02,07更新
https://pan.baidu.com/s/1l2-aPnJiq9k9zd7dUFHGbg转载于:https://www.cnblogs.com/yongfuxue/p/10355552.html
2019-02-07 21:15:00
310
转载 数据结构与算法学习笔记-2019.02.07更新
https://pan.baidu.com/s/1utMhMfqoh8mCUVJ9f3QY-w转载于:https://www.cnblogs.com/yongfuxue/p/10355551.html
2019-02-07 21:14:00
219
转载 SQL学习笔记-2019.02.07更新
https://pan.baidu.com/s/1nQrbNpkURDpr16pvtqT67A转载于:https://www.cnblogs.com/yongfuxue/p/10355550.html
2019-02-07 21:13:00
208
转载 爬虫-2019.02.07更新
https://pan.baidu.com/s/1nEUnHD8x9XptiDkOqwhxYw转载于:https://www.cnblogs.com/yongfuxue/p/10355549.html
2019-02-07 21:11:00
174
转载 数据挖掘项目学习笔记-2019.02.07更新
https://pan.baidu.com/s/1UglOpHC-iDC8FC22QIRFmg转载于:https://www.cnblogs.com/yongfuxue/p/10355546.html
2019-02-07 21:08:00
118
转载 spark-core学习笔记-2019.02.07更新
https://pan.baidu.com/s/16LhTth959qJn_LAJGUD_Kg转载于:https://www.cnblogs.com/yongfuxue/p/10355539.html
2019-02-07 21:03:00
147
转载 spark-GraphX学习笔记-2019.02.07更新
https://pan.baidu.com/s/1GPvIAgriNUSGvV3W3tFLWg转载于:https://www.cnblogs.com/yongfuxue/p/10355537.html
2019-02-07 21:02:00
121
转载 spark-streaming学习笔记-2019.02.07学习笔记
https://pan.baidu.com/s/1bOId4n_DsSn05ehrT5LjUQ转载于:https://www.cnblogs.com/yongfuxue/p/10355534.html
2019-02-07 21:00:00
138
转载 spark-SQL学习笔记-2019.02.07更新
https://pan.baidu.com/s/1UPp1JxNlXcwx7P1-fN11aw转载于:https://www.cnblogs.com/yongfuxue/p/10355530.html
2019-02-07 20:59:00
137
转载 Storm学习笔记-2019.02.07更新
https://pan.baidu.com/s/1TCgw3PiIywxIVk90zEVZYQ转载于:https://www.cnblogs.com/yongfuxue/p/10355516.html
2019-02-07 20:51:00
90
转载 Hbase学习笔记-2019.02.07更新
https://pan.baidu.com/s/1pl-z7qEHaDl8mQi7XcGw2g转载于:https://www.cnblogs.com/yongfuxue/p/10355509.html
2019-02-07 20:46:00
107
转载 ZooKeeper,Hive,Flume,Oozie等学习笔记-2019.02.07更新
https://pan.baidu.com/s/1TN88phKJKN9yxbmrUBZ2JA转载于:https://www.cnblogs.com/yongfuxue/p/10355504.html
2019-02-07 20:41:00
134
转载 hdfs, mapreduce学习笔记-2019.02.07更新
https://pan.baidu.com/s/1OZyegORI3CYhHYdHrWTSiw转载于:https://www.cnblogs.com/yongfuxue/p/10355499.html
2019-02-07 20:39:00
103
转载 Scala学习笔记-2019.02.07更新
https://pan.baidu.com/s/10Ff672zBhCo9XLdPys4DCA转载于:https://www.cnblogs.com/yongfuxue/p/10355485.html
2019-02-07 20:30:00
116
转载 Java学习笔记-2019.02.07更新
https://pan.baidu.com/s/1GuPHFK3a6NMzJJOu5pW4jQ转载于:https://www.cnblogs.com/yongfuxue/p/10355481.html
2019-02-07 20:29:00
96
转载 C语言学习笔记-2019.02.07更新
https://pan.baidu.com/s/1_feehVS_Eo1p_dt-hDMWog转载于:https://www.cnblogs.com/yongfuxue/p/10355476.html
2019-02-07 20:28:00
90
转载 C++学习笔记
https://pan.baidu.com/s/1i_NtMaKUFHDOnTDsS7dq1g转载于:https://www.cnblogs.com/yongfuxue/p/10355475.html
2019-02-07 20:27:00
115
转载 机器学习数学基础-2019.02.07更新
https://pan.baidu.com/s/1M0FKUZz-1MsJ_6yW1VvMqQ转载于:https://www.cnblogs.com/yongfuxue/p/10355470.html
2019-02-07 20:25:00
110
转载 python与常用模块pandas,numpy,matplotlib等库学习笔记-2019.02.07更新
https://pan.baidu.com/s/11uJpgGjZgqDU6Q00YMH-7w转载于:https://www.cnblogs.com/yongfuxue/p/10355453.html
2019-02-07 20:14:00
202
转载 Linux学习笔记-2019.02.07更新
https://pan.baidu.com/s/1ORX6OFUJlkgF8SohCYD7wg转载于:https://www.cnblogs.com/yongfuxue/p/10355452.html
2019-02-07 20:10:00
98
转载 机器学习理论与应用完整学习笔记-2019.02.07更新
https://pan.baidu.com/s/1PhwOfSXXCAKPdpTW4CQdJw转载于:https://www.cnblogs.com/yongfuxue/p/10355447.html
2019-02-07 20:07:00
170
转载 协同过滤、word2vec、LFM
https://pan.baidu.com/s/19BLI4Z2inDCEe2Mm9xq82A转载于:https://www.cnblogs.com/yongfuxue/p/10119079.html
2018-12-14 14:01:00
258
转载 文本摘要生成(seq2seq)
https://pan.baidu.com/s/1Qgyx_2vJirKAcX2HxYuCwA转载于:https://www.cnblogs.com/yongfuxue/p/10119067.html
2018-12-14 13:59:00
1488
转载 文本生成
https://pan.baidu.com/s/1E-V4Y0mNwdoqbKmmo61wdw转载于:https://www.cnblogs.com/yongfuxue/p/10119059.html
2018-12-14 13:58:00
147
转载 文本分类(词袋、tf-idf)
https://pan.baidu.com/s/1Ex0qncu5EwfEIb_BPHX7ZA转载于:https://www.cnblogs.com/yongfuxue/p/10119049.html
2018-12-14 13:57:00
251
转载 文本分类(word2vec)
https://pan.baidu.com/s/1p-p7WrVLUAJl6HB54naBQA转载于:https://www.cnblogs.com/yongfuxue/p/10119048.html
2018-12-14 13:56:00
752
转载 文本分类(CNN)
https://pan.baidu.com/s/1PwCdJtymfzcH451vBJH1aw转载于:https://www.cnblogs.com/yongfuxue/p/10119042.html
2018-12-14 13:55:00
110
转载 词云制作、关键词提取
https://pan.baidu.com/s/1knhSueaRDEE5GpyC_7nWCA转载于:https://www.cnblogs.com/yongfuxue/p/10119034.html
2018-12-14 13:54:00
1350
转载 Fasttext
1、fasttext是facebook开源的一个词向量与文本分类工具,在学术上没有太多创新点,好处是模型简单,训练速度非常快。简单尝试可以发现,做出来的结果也不错,可以达到上线使用的标准。2、简单说来,fastText做的事情,就是把文档中所有词通过lookup table变成向量(word2vec),取平均后直接用线性分类器得到分类结果。fastText和deep av...
2018-12-14 13:50:00
93
转载 tf.contrib.learn.preprocessing.VocabularyProcessor
tflearn的VocabularyProcessor用法:建立中文词汇表和把文本转为词ID序列tf.contrib.learn.preprocessing.VocabularyProcessor(max_document_length, min_frequency=0, vocabulary=None, tokenizer_fn=None)max_document_len...
2018-12-14 13:48:00
329
转载 对文本抽取词袋模型特征
from sklearn.feature_extraction.text import CountVectorizervec = CountVectorizer( analyzer='word', # tokenise by character ngrams max_features=4000, # keep the mo...
2018-12-14 13:47:00
257
转载 jieba分词
分词算法1.基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG)2.采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合3.对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法分词分词功能主要有两个方法 jieba.cut 和 jieba.cut_for_sea...
2018-12-14 13:46:00
133
转载 家用电器用户行为分析与事件识别
目标1、根据热水器采集到的数据,划分一次完整用水数据。2、在划分好的一次完整用水事件中,识别出洗浴事件。数据预处理1、原始数据集太大,进行数据抽取2、由于热水器采集的用水数据属性较多,我们只选择与分析目标相关的属性。3、如何划分一次完整的用水事件呢?如果水流量为0的状态记录之间的时间间隔超过一个阈值T,则从该段水流量为...
2018-12-13 19:42:00
1221
转载 基于水色图像的水质评价
目标利用图像处理技术,通过水色图像实现水质的自动评价分析方法与过程需要对图像提取特征,图像特征提取的效果直接影响到图像的识别和分类的好坏。图像特征主要包括颜色特征,纹理特征,形状特征和空间关系特征。与几何特征相比,颜色特征更为稳健,对于物体的大小和方向均不敏感,表现出较强的鲁棒性。本案例中水色图像是均匀的,故主要关注颜色特征。利用图...
2018-12-13 19:40:00
1440
转载 中医证型关联规则挖掘
挖掘目标1、借助三阴乳腺癌患者的病理信息,挖掘患者的症状与中医证型之间的关联关系(关联规则算法)2、对截断治疗提供依据,挖掘潜性证素数据预处理1、属性规约本案例收集的数据共73个属性,我们只选择6中证型得分、TNM分期的属性值构造数据集2、数据变换1)属性构造为了更好的反映出中医证素分布的性质,使用证型系数来...
2018-12-13 19:39:00
763
转载 航空公司客户价值分析
实现目标1)借助航空公司客户数据,对客户进行分类2)对不同的客户类别进行特征分析,比较不同类客户的客户价值。3)对不同价值的客户类别提供个性化服务,制定相应的营销策略。分析方法和过程传统的客户价值识别的3个指标:时间间隔,消费频率,消费金额。而相同消费金额的客户对航空公司来说可能是有不同价值的,如长航线低等级舱和短航线高等舱。因此我们选择客户在一...
2018-12-13 19:38:00
341
转载 电力窃漏电用户自动识别
目标系统中的用电负荷不能直接体现出用户的窃漏电行为,终端报警存在很多误报和漏报的情况,因此需要进行数据探索和预处理。总结窃漏电用户的行为规律,再从数据中提炼出描述窃漏电用户的特征指标,最后结合历史窃漏电用户信息,整理出识别模型的专家样本数据集。数据探索分析1、分布分析根据用户类别查看窃漏电用户数的分布情况,一些类别不会出现窃漏电情况,那么直接将这个类别的用户从...
2018-12-13 19:37:00
466
转载 信息论基础
信息论基础信息i(x) = -log(p(x))如果说概率p是对确定性的度量那么信息就是对不确定性的度量独立事件的信息如果两个事件X和Y独立,即p(xy)=p(x)p(y) ,假定X和y的信息量分别为i(x)和i(y),则二者同时发生的信息量应该为i(x^y)=i(x)+i(y)熵:自信息的期望熵是对平均不确定性的度量对熵的理解...
2018-12-12 13:18:00
341
转载 Xgboost
Xgboost优势1、正则化标准GBM的实现没有像XGBoost这样的正则化步骤。正则化对减少过拟合也是有帮助的。2、并行处理XGBoost可以实现并行处理,相比GBM有了速度的飞跃。3、缺失值处理XGBoost内置处理缺失值的规则。用户需要提供一个和其它样本不同的值,然后把它作为一个参数传进去,以此来作为缺失值的取值。XGBoos...
2018-12-12 13:08:00
166
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人