- 博客(36)
- 资源 (1)
- 收藏
- 关注
原创 【开发杂记】如何用pyintaller打包出体积较小的exe文件
用程序解决一些业务上的重复劳动,由于内网环境且没有开发环境,常常需要做成.exe文件到其他电脑上执行。因为本人接触python多些,就用python解决,流程总结如下。
2022-09-07 10:13:18
1119
原创 【开发杂记】基于Python和TK的exe应用程序开发
0 前言 一开始也没想到要做这个,人力的领导嫌用Excel太烦了想把一些机械重复劳动以程序替换,所以产生了这个需求。由于是面向个人需求开发的产品,所以做成单机的,一套做下来感觉事倍功半,以后还是B/S架构做成网页好点,这里避免工作浪费在这里总结一下全过程。目录0 前言1 数据2 需求3 GUI工具TK(tkinter)4 功能实现4.1 整体框架4.11主界面4.12 主界面配件4.2 上传功能实现4.3 查询功能实现4.31 查询条件交互功能实现4.32 查询算法实现4.33 查询结果展示功能实现
2022-01-16 15:49:29
1050
原创 【经验总结】“投”——如何寻找适合投递的期刊或者会议
前言 文章写好了就要投稿,对于大部分的投稿,一般是由导师替你把握。但若没有了前人经验,靠自己如何去挑选哪些期刊或者会议适合自己呢?本期的经验总结就是讨论这一点。 本系列主要总结一些工具和方法论,感兴趣可继续阅读以下文章:【经验总结】“找”——如何找相关领域的文献【经验总结】“读”——如何阅读外文文献【经验总结】“投”——如何寻找适合投递的期刊或者会议1. 国内——小木虫 这是一个功能非常多的网站,我们在这里主要使用它的社区板块。期刊会议评价 其优点在于它的社交论坛是“
2020-10-24 09:57:03
3748
1
原创 【文献阅读】2020-SIGIR-Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group
说明1.原文链接。2.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:面向序列组推荐的群感知长、短期图表示学习 Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group Recommendation2.作者: 华东师范大学、微信搜索应用部门、乔治亚理工学院摘要 顺序推荐和群推荐是推荐系统中的两个重要分支。虽然我们已经对这两个分支进行了大量独立的研究,
2020-09-20 17:05:13
1126
原创 【数据处理】数据集划分、打乱(shuffle)、以及keras里K-折交叉验证
前言 在进行机器学习的时候,本质上都是在训练模型,而训练模型都离不开对数据集的处理。往往在模型表现不佳或难以再提升的情况下,进行一定的处理,科学的训练会使模型再更进一步。目录前言1 数据集划分1.1 常规理解1.2 自己理解2 打乱(shuffle)2.1 numpy里的shuffle2.2 keras里的shuffle2.3 sklearn里的shuffle ★2.4 代码(2.1和2.3两种)3 keras里进行K-折交叉验证3.1 K-折交叉验证3.2 keras模型实现K折交叉验证3.3 完整
2020-06-27 16:11:16
21745
4
原创 【深度学习】卷积神经网络CNN以及池化层的理解与运用
前言目录前言1 卷积神经网络 CNN1.1 理论理解1.2 实践理解1.2.1 tensorflow 上CNN使用样例1.2.2 keras 上CNN使用样例2 池化层2.1 理论理解2.2 实践理解2.2.1 tensorflow 上池化层使用样例2.2.2 keras 上池化层使用样例3 基于Keras的分类问题实践3.1 数据集及问题描述3.2 核心代码3.3 实验结果3.4 完整代码1 卷积神经网络 CNN1.1 理论理解 CNN出现已有非常长的历史了,直接拿已有的解释性文章来进行参考,这
2020-06-24 16:47:57
1864
原创 【深度学习】 Attention机制的几种实现方法总结(基于Keras框架)
说明 在讲解了Dense+Attention以及LSTM+Attention时,还是使用了别人的代码,因此很多同学对一些地方仍有不够清晰的认识,在这里分享下自己的经验,并基于实践重新设计了实验。这是本人在Attention实践后的经验之谈,所讲不一定完全正确,欢迎讨论。目录说明1 前情提要1.1 参数设定1.2 数据集生成2 模型构建2.1 总体构建2.1.1 搭建模型2.1.2 获取注意力2.1.3 训练模型并可视化注意力3 注意力机制实现3.1 Baseline3.2 第一种Attention机制
2020-06-09 18:27:43
12023
13
原创 【文献阅读】 Fair Sequential Group Recommendations
说明1.原文链接。2.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:公平的群组序列推荐 Fair Sequential Group Recommendations2.作者:摘要 推荐系统已经融入到我们的日常生活中,从音乐到健康推荐,推荐系统提升了用户的体验。与此同时,随着社交媒体的扩张,现在比以往任何时候都更容易形成群体。因此,团体推荐人变得更受欢迎。通常,我们认为组和推荐系统之间的交互是一个独立的过程;组向系统请求一些建议,系统回答,而不考虑过去的交互。更现实的情况
2020-06-09 08:19:08
579
原创 【文献阅读】 2020-WWW-Attentive Sequential Models of Latent Intent for Next Item Recommendation
说明1.原文链接。2.WWW2020其他推荐系统文章。3.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:基于潜在意图的注意力序列模型给下一个项目推荐 Attentive Sequential Models of Latent Intent for Next Item Recommendation2.作者:摘要 用户在电子商务服务中表现出不同的意图(如发现商品、购买礼品等),这促使他们以多种方式(如单击、添加到购物车、添加到收藏夹、购买)与各种商品进行交互。
2020-06-01 11:41:00
1578
2
原创 【推荐算法】从零开始做推荐(六)——贝叶斯性化排序 (BPRMF) 的Tensorflow版
前言 之前我们已经介绍了贝叶斯个性化排序(Bayesian Personalized Ranking, BPR),并基于BPR矩阵分解进行推荐实战。同传统矩阵分解一样,BPRMF也有神经网络的版本。此方法在刘建平老师的博客上已有介绍,但其评价指标和数据集划分与本系列不同。因此,本文在其基础上进行修改,方便与本系列方法一同进行比较。目录前言核心算法损失函数求解算法实验结果完整代码 如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门: 【推荐算法】从零开始做推荐(一)——认识推荐、认识数
2020-05-31 09:40:46
2159
1
原创 【推荐算法】从零开始做推荐(五)——贝叶斯个性化排序矩阵分解 (BPRMF) 推荐实战
前言 之前我们已经陆续完成了数据集、评价指标和经典算法MF推荐的实战,接下来本章将介绍另一种应用也非常广泛的推荐技术:贝叶斯个性化排序(Bayesian Personalized Ranking, BPR)。将基于BPR矩阵分解进行推荐实战。目录前言什么是BPR? 如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门: 【推荐算法】从零开始做推荐(一)——认识推荐、认识数据 【推荐算法】从零开始做推荐(二)——推荐系统的评价指标,计算原理与实现样例 【推荐算法】从零开始做推荐(
2020-05-18 17:17:21
5367
3
原创 【推荐算法】从零开始做推荐(三)——传统矩阵分解的TopK推荐实战
前言 在前两章,我们已对本系列的数据集、评价指标做了相应的介绍,从本章开始将进行推荐实战,算法上从最经典的矩阵分解讲起。目录前言矩阵分解核心算法ML100K实现完整的矩阵分解TopK推荐构造矩阵训练测试结果分析进阶!灵魂拷问完整代码 如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门: 【推荐算法】从零开始做推荐(一)——认识推荐、认识数据 【推荐算法】从零开始做推荐(二...
2020-04-10 21:03:35
3993
13
原创 【推荐算法】从零开始做推荐(二)——TopK推荐的评价指标,计算原理与样例
前言 推荐系统挺有趣的,但对做研究的人来讲上手有很多坑。相比于图像领域数据集、代码公开透明,评价指标高度统一,推荐系统仍处在整合阶段,龙蛇混杂。 在撰写论文的时候,难点不仅在于自己的方法,还在于实现他人的算法进行对比。如果代码不公开,自己实现他人的方法一方面费时费力,另一方面还不知道有没有复现准确。 本系列打算在推荐系统公开数据集上一步步实现完整推荐,并实现多个经典的推荐算法。由于本人...
2020-03-25 20:15:27
13765
11
原创 【推荐算法】从零开始做推荐(一)——认识推荐,认识数据
前言 推荐系统挺有趣的,但对做研究的人来讲上手有很多坑。相比于图像领域数据集、评价指标等高度统一,代码公开透明,推荐系统仍处在整合阶段,龙蛇混杂。在撰写论文的时候,难点不仅在于自己的方法,还在于实现他人的算法进行对比。如果代码不公开,自己实现他人的方法一方面费时费力,另一方面还不知道有没有复现准确。 本系列打算在推荐系统公开数据集上一步步实现完整推荐,实现多个经典算法(这一章是矩阵分解)并...
2020-03-19 19:00:45
2878
2
原创 【经验总结】“读”——如何阅读外文文献
前言 已经下载好了一篇文献,通常是英文的,接下来的难点在于如何读懂它。这里假设论文内容是没有看过的,不能确定是否是真正所需要的文章。 此时你有几个选项: 1. 快速获得全文翻译——文档翻译 2. 快速获得指定区域内的翻译——知云翻译 3. 精读精翻——手动翻译1. 文档翻译适用推荐: 准确度:★★★☆☆ 费时度:★★☆☆☆ 是否免费:预览前4...
2020-03-09 16:56:56
756
原创 【经验总结】“找”——如何找相关领域的文献
前言 本人专业计算机科学与技术,方向是推荐系统,故总结以我方向的为例。有通用方法和非通用方法,皆可一试。 所有领域通用方法包括: 1. 谷歌学术(GIGOO) 2. 百度学术 3. sci-hub 计算机领域方法包括: 1. CCF推荐期刊、会议 2. DBLP通用方法1. 谷歌学术(GIGOO)适用推荐: 外文文献:★★★...
2020-03-08 17:27:08
7146
3
原创 【数据处理】 python 极速极简画图——折线图
说明 画图总结,同系列其他文章请浏览:【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图【数据处理】 python 极速极简画图——频数(率)分布直方图【数据处理】 python 极速极简画图——二维连线、散点图代码from matplotlib import pyplotimport matplotlib.pyplot as pltfrom py...
2020-01-13 16:19:33
1157
原创 【深度学习】用Keras实现word2vec的CBOW模型
前言 尽管gensim里的word2vec已经非常好用,但用别人的模型始终难以直接解决自己的问题,于是去搜有没有直接能用的Keras版,找到了两版,分别为:版本1:keras训练word2vec代码版本2:【不可思议的Word2Vec】6. Keras版的Word2Vec 两位写的都很好,版本1代码上可以直接上手,版本2框架更清晰,但两位大佬的数据集都是基于多篇文章的,版本1是从微...
2020-01-04 17:26:29
2948
1
原创 【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图
说明 一般做完实验就是画图,实验结果多采用条形图,这里整理下自己的画图模板。图是否丰富是由数据的维度来支撑的,这里按数据维度的大小画出简单条形图与多维并列条形图,注释很详细,直接上代码。 论文画图一般要求:全英,标题首字母大写,实词大写一般不为彩印,因此要以黑白填充为主简单条形图 此模板X和Y都是1维的,适用于在横坐标的数据集下,单个方法在单个问题上的表现。import n...
2019-12-25 12:16:01
2673
1
原创 【数据处理】 python 极速极简画图——频数(率)分布直方图
说明 当我们拿到数据的时候,第一时间就是想知道数据的特点,然鹅单个的数值如平均数、中位数仍不够直观,我们更想得到数据的分布,以便后续的工作,此时就可以采用频数(率)分布直方图。这里以我的一个实际问题为例,一步步讲如何得到想要的图,分为极简版、完整版和进阶版。方法 用python实现直方图画法有很多种: 1. 纯python自己编写 2. matplotlib.pyplot,调...
2019-12-13 15:05:44
34140
4
原创 【深度学习】 基于Keras的Attention机制代码实现及剖析——LSTM+Attention
说明大部分代码来源于网上,但网上的代码一下子可能难以入门或因版本原因报错,此处整理后进行详细分析。 参考的代码来源1:Attention mechanism Implementation for Keras.网上大部分代码都源于此,直接使用时注意Keras版本,若版本不对应,在merge处会报错,解决办法为:导入Multiply层并将attention_dense.py第17行的:att...
2019-12-11 11:01:56
51229
112
原创 【深度学习】 基于Keras的Attention机制代码实现及剖析——Dense+Attention
说明大部分代码来源于网上,但网上的代码一下子可能难以入门或因版本原因报错,此处整理后进行详细分析。 参考的代码来源1:Attention mechanism Implementation for Keras.网上大部分代码都源于此,直接使用时注意Keras版本,若版本不对应,在merge处会报错,解决办法为:导入Multiply层并将attention_dense.py第17行的:att...
2019-12-09 19:26:24
21974
32
原创 【数据处理】 python 极速极简画图——二维连线、散点图
python 极速极简画图——二维连线、散点图说明 在一些作业或建模中经常要画图,自己百度的时候总要看好几个才画出来,后面有非专业的人找我画图,这里自己总结一个简单又快速的,适合萌新和非专业的人使用。数据 其实就两列。代码 直接上代码,注释很详细。# -*- coding: utf-8 -*-"""Created on Fri Nov 8 11:46:41 2019...
2019-11-30 14:45:04
8549
1
原创 【文献阅读】2019-SIGKDD-Dual Sequential Prediction Models Linking Sequential Recommendation and Informatio
说明原文链接。 此处翻译不全,仅到其主要思想部分。标题题目:Dual Sequential Prediction Models Linking Sequential Recommendation and Information Dissemination 作者: Qitian Wu1, Yirui Gao1, Xiaofeng Gao1∗, Paul Weng2, Guihai C...
2019-11-30 13:47:17
1064
3
原创 【文献阅读】 2018-SIGKDD-STAMP:Short-Term Attention/Memory Priority Model for Session-based Recommendation
说明原文链接。 此处将Session-based Recommendation直译为会话推荐,有地方意译为短序列推荐。 此处将external memory译为外部记忆,直译话为外部存储器(外存),short-term memory译为短期记忆,直译的话为短期存储器。标题题目:STMAP:基于会话推荐的短期注意/记忆优先模型 作者: Qiao Liu University of ...
2019-10-07 15:30:44
11294
10
原创 【文献阅读】 2019-IJCAI-Sequential Recommender Systems Challenges, Progress and Prospects
说明 1.原文链接。 2.此处将Sequential Recommender Systems 翻译为序列推荐系统,具体定义参见下文的形式化定义。 3.本篇为顶会IJCAI上的文章,给出关于此会议其他推荐系统的文章参考。 4. 此处将dependencies译为相关性。标题 序列推荐系统的挑战、进展和前景 作者:ShoujinWang1,LiangHu2,YanWang1,...
2019-10-05 15:57:25
8457
3
原创 【数据处理】 python 基于Folium地理信息可视化
数据 在某些建模比赛中,经常碰见一些地理信息的数据,它们大多都是车辆在驾驶过程中随时间产生的经纬度序列,并伴随着车辆的各种参数。由于GPS信号并不是一直都很好(如过隧道或偏远地区),无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等,都绕不过数据预处理,而地理信息可视化可以较为直观地帮助发现问题和评估效果。 本篇为可视化第二篇,关于所用的数据集见姊妹篇 python 基于Basemap地理...
2019-09-28 12:30:30
2869
3
原创 【数据处理】 python 基于Basemap地理信息可视化
数据 在某些建模比赛中,经常碰见一些地理信息的数据,它们大多都是车辆在驾驶过程中随时间产生的经纬度序列,并伴随着车辆的各种参数。由于GPS信号并不是一直都很好(如过隧道或偏远地区),无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等,都绕不过数据预处理,而地理信息可视化可以较为直观地帮助发现问题和评估效果。 下面以一辆车地行驶数据为例,对其行驶轨迹进行可视化处理。数据和代码下载可见我的Gi...
2019-09-28 12:00:48
1988
10
原创 【机器学习】 python 多种方法实验比较 文本情感二分类
实验目的及要求实验源于“2019大数据挑战赛-预选赛”。本预选赛要求选手建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测,达到或超过规定的分数线即通过预选赛。数据样本格式:其中,训练集的样本规模为6328,测试集的样本规模为2712。为保证比赛结果的真实性...
2019-09-09 15:30:58
2552
2
原创 【深度学习】 Keras 实现Minst数据集上经典网络结构(DeepDense、LeNet、AlexNet、ZFNet)分类
实验简介 本次实验一方面是熟悉Keras 序列式(Sequential)模型的使用,另一方面是复现早期的经典网络结构来学习神经网络搭建的技巧。数据集采用的是熟知的Minst手写识别,框架采用的是tensorflow、Keras,数据集和框架的导入和安装请点击这里。经典的网络结构已有大量博客进行理论分析,这里只给出代码仅供参考,关于神经网络结构的发展,推荐大家看这篇文章。DeepDense ...
2019-09-06 14:24:40
725
原创 【推荐算法】从零开始做推荐(四)——python Keras框架 利用Embedding实现矩阵分解TopK推荐
基于矩阵分解的推荐原理 矩阵分解是推荐系统里最常用的方法之一,其泛指一类算法,由最初数学中的SVD分解衍变而来,已有众多个版本,通常而言推荐系统里的矩阵分解算法指得是FunkSVD分解,可参照这里(多说一句,这位老师在NLP与推荐系统很多博客紧跟潮流,都值得一看)。关于矩阵分解算法的发展历史可以参照这里。 众多优秀博客珠玉在前,我就不详谈矩阵分解的前世今身了,下面对矩阵分解的思想做个简单地...
2019-09-04 17:57:05
3773
2
原创 【推荐系统】 Matlab 实现 基于HMM 与 personalRank 的推荐算法
写在之前 这是本人的统计学习方法作业之一,老师要求一定要用Matlab编程,本人在此之前未曾大量使用Matlab,因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下,没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法,如有建议或者错误欢迎指出,谢谢!数据集 所提供的movie.txt为MovieLens电影评论推荐网站上的用户打分数据,每一行的字段为...
2019-08-16 15:42:52
1913
原创 【机器学习】 Matlab 实现多种分类器(感知机、KNN、Logistic、最大熵、决策树、朴素贝叶斯)的二分类
写在之前 这是本人的统计学习方法作业之一,老师要求一定要用Matlab编程,本人在此之前未曾大量使用Matlab,因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下,没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法,如有建议或者错误欢迎指出,谢谢!数据集 提供的flower.txt文件为鸢尾花数据集,共分为3类花(前50个样本为一类,中间50个样本...
2019-08-16 14:39:20
4755
10
原创 【优化理论】 共轭梯度下降算法实现
实验目的实验步骤 此次实验要求采用共轭梯度下降来解决二次优化问题,在解决此问题前,首先分析下什么是共轭梯度法,共轭梯度法能解决什么问题。 我们来看一个线性方程组Ax=b,求解此方程组的过程可以看成是形如公式(1)的优化问题:argminx∥Ax−b∥2…………………………………………(1)\mathop{\arg\min_{x}} \parallel Ax-b\parallel^...
2019-08-13 11:19:24
1008
原创 【优化理论】 梯度下降算法及其python实现——以Logistic回归为例
写在之前 这是本人第一次编写博客,技术不是很娴熟,若造成阅读困扰十分抱歉。其次,编写博客的内容是基于研究生第一年所学课程作业而言的,部分时间已经比较久远,引用和转载上可能找不到当初借鉴的原文了,十分抱歉!编写博客的目的一方面是对自己所学有个总结和归处,另一方面在完成某些作业时受很多博客的影响,向他们学习、致敬!最后就是代码的正确性在当时是可以得到保证的,但不一定适用于所有场景,且效率上可能存在...
2019-07-02 15:55:45
1396
3
ml-100k Basic MF.rar
2020-04-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人