- 博客(78)
- 收藏
- 关注
原创 代码逻辑整理
构建神经网络输入函数 get_inputs()user相关:uid, user_gender,user_age,user_jobmovie相关:movie_id,movie_categories,movie_titles定义user矩阵函数 get_user_embedding( )uid_embed_layer,gender_embed_layer,age_embed_layer,job_embed_layer将User的嵌入矩阵一起全连接生成User的特征函数 get_us
2020-12-30 16:57:05
1419
原创 代码1
import pandas as pdfrom sklearn.model_selection import train_test_splitimport numpy as npimport osimport pickleimport refrom tensorflow.python.ops import math_ops# 读取User数据users_title = ['UserID', 'Gender', 'Age', 'JobID', 'Zip-code']users = pd.r
2020-12-26 19:10:42
214
2
原创 实验过程中的问题
1.报错:MemoryError: Unable to allocate 1.77 GiB for an array with shape (90570, 2623) and data type float64解决1
2020-12-23 10:16:51
770
原创 推荐系统整合
7.1 日更新嵌入(embedding)层的理解embedding练习代码Embedding和Word2Vec实战7.26 日更新AFM理论与实践一些模型优缺点:堆叠降噪自编码器:擅长没有文档时,提取用户和项目 潜在信息三种结合卷积神经网络,注意力机制神经网络在NLP关注LSTM进行文本特征提取,只关注了文本信息,忽略关键信息改进:特征提取(附加堆叠降噪自编码器,和基于卷积神经网络的矩阵分解 )缺点:卷积层输入文档包含无关键词的噪声信息,卷积层无法自动区分关键词,忽略上下文关系和词的
2020-09-27 22:07:31
243
原创 面试
Java阅文String,StringBuffer,StringBuilder区别\重写,重载构造函数可以重写。or 重载?子调用父的构造函数Java 容器哪些线程池mySQL阅文事务级别锁级别进程池判断效率最优最左侧
2020-08-14 17:35:48
159
原创 java错题集
SpringSpring 开源框架,ioc 反转控制,aop 切面编程官网 Spring.io,常用Spring. framework展现层 Springmvc,持久层 Spring jdbctrue. false. null 不是 关键字。java关键字都是小写。只是拥有父类的全部数据域和方法,但不具备对某些私有数据域或私有方法的使用权(调用)。成员变量有初始值,而局部变量没有初始值得。布尔值 1个byte定义在接口中的方法默认是public的接口里面
2020-08-13 09:06:45
210
原创 音乐系统-七月在线课程
一、原始数据利用爬虫技术获取网易云音乐歌单,存储为json格式,压缩后的全量数据共计16G,解压后超过50G。由于数据量太大,且代码中用不到这部分原始数据,故没有提供原始数据,此处仅展示原始数据的格式:二、解析基础歌单数据抽取 歌单名称,歌单id,收藏数,所属分类 4个歌单维度的信息抽取 歌曲id,歌曲名,歌手,歌曲热度 等4个维度信息歌曲的信息原始数据解析后的基础歌单数据 163_music_playlist.txt 最终要转换为surprise库支持的格式,故实际上用不到,此处没有提供;其格式
2020-07-30 17:39:16
423
1
原创 平滑
拉普拉斯平滑背景:为什么要做平滑处理?解决 零概率问题, 若某个量x,训练集中未出现,会导致整个实例概率结果是0。但不合理。 应用:文本分类中,某词语未在训练集中出现,该词语概率为0,连乘计算文本概率为0,不合理。不能因为没有观察到就认为该事件的概率是0。拉普拉斯=加法平滑,解决零概率问题。(分子+1) / (分母+1)应用举例假设在文本分类中,有3个类,C1、C2、C3。词语K1,各个类中观测计数分别为0,990,10。 未平滑前:K1的概率为0,0.99,0.01, 拉普拉斯
2020-07-17 15:48:49
200
原创 text.py
import numpy as npa=np.sum([[0, 1], [0, 5]]) # 6b=np.sum([[0, 1], [0, 5]], axis=0) # [0 6]c=np.sum([[0, 1], [0, 5]], axis=1) # [1 5]a=np.sum([[2, 1], [0, 5]]) # 8b=np.sum([[2, 1], [0, 5]], axis=0) # [2 6]c=np.sum([[2, 1], [0
2020-07-01 10:56:27
180
原创 浅谈 image caption 相关知识点 及 优秀链接
框架encoder-decoder中间向量 长度是固定的(缺陷)输入信息 太长,会丢失信息(缺陷)Seq2Seq输入 输出 序列长度可变输入输出 固定长度,长度稍微变化,补零encoder-decoder & Seq2SeqSeq2Seq 属于 Encoder-Decoder 的大范畴Seq2Seq 更强调目的,Encoder-Decoder 更强调方法...
2020-03-14 16:31:10
3473
2
原创 论文梳理(image caption)
论文四遍法:第一遍: 只 标题,摘要(讲什么),图表第二遍:看 主要思想(前言,结语,图表),不看(相关研究)第三遍:看(纵览论文主体,整体脉络框架),不看(数学推导 )第四遍:所有题目:融合卷积注意力机制的图像描述生成模型搜索源:知网,核心搜索词:关键词(图像描述; 卷积神经网络; 自然语言处理; 长短期记忆神经网络; 卷积注意力机制)第一遍:摘要,图表摘要问题:CNN+...
2020-02-21 12:56:53
787
原创 图像随记
典型关联分析CCA:相关参数:反映变量间密切程度的统计指标,相关系数Pearson相关系数:衡量两个数据集合是否在一条线上面,定距变量间的线性关系。积差相关系数:...
2020-02-09 14:38:16
520
原创 我爱的小小经济✖️计算机
股票:基本面分析,技术分析,量化投资量化投资:主动性投资策略量化投资策略:决策树,随机森林,支持向量机,神经网络股票预测模型:灰色系统理论 建立 GM(1,1)预测模型支持向量机:预测股票走势,精度高于BP算法粒子群算法的支持向量回归模型随机森林:量化投资,人脸识别 ,系统检测,文本分类随机森林的基分类器是决策树随机森林:多棵决策树,训练预测,分类器分类器:分类模型,...
2020-02-08 22:03:57
1200
原创 论文梳理(图像标注)
自动图像标注总述:是图像语义理解的热点,是 无标注图像内容的语义关键词属于图像检索领域,是图像 语义检索(成熟 )关键涉及计算机视觉,机器学习,信息检索总实现思路:用(已标注图像集)或 关联,映射关系(可获信息 自动学习语义空间 与 视觉特征空间)。预测未知图像标注。现实现方法:基于分类的标注,概率关联标注,图学习的标注相关的领域:基于内容的 图像检索,瓶颈,巨大挑战(语...
2020-02-04 20:47:30
1771
原创 论文方法论
写的还不错的:关于发论文的方法论篇(1)该论文想解决哪个具体问题,(2)哪些相关问题已经得到了解决,为什么这些方法不能解决该问题,(3)该论文采用什么方法解决,(4)该方法是否能够比较好的解决论文提出的问题,(5)该方法的优点是什么,缺点是什么,优点和缺点不要盲从论文作者的观点,需要加入自己的理解。(6)该方法在解决该问题后,是否引入了其它未解决的问题(7)该方法在解决该问题后,是...
2020-02-03 20:33:55
1783
原创 论文梳理 的 复盘
本文是对自己梳理的论文博客,再重新阅读一遍的总结原文:论文梳理博客网站:优快云自己的想法:方向:多模态:自动标注,语料库,融合,描述(NLP)SVM改进,图片处理,语义鸿沟自动标注:迁移学习:题目:[基于深度学习的图像自动标注方法综述],的多模态:多区域:不同物体区域描述编码-解码:强化学习:最大似然,反向传播生成式对抗:GAN,无监督,生成器+判别器...
2020-01-31 16:50:50
535
原创 论文梳理模版
题目:论文题目,并附 此论文网址 做超链接此模版中 斜体字 为可替换内容搜索源:知网搜索词:主题(主题词),关键词(关键词)核心:人体动作识别HAR摘要0 引言1 一级标题1.1 二级标题1.2 二级标题3 总结...
2020-01-27 21:14:01
438
原创 论文梳理
题目:多模态人体动作表示识别及其正骨康复训练应用综述核心:人体动作识别HAR摘要分为:动作捕捉:基于视频,深度相机,惯性传感器动作分类(深度学习):特征自动提取,多模态特征融合应用:正骨康复训练:监督锻炼 和 模拟训练讨论:HAR 的精准动作捕捉,多模态特征融合,正骨康复重点难点引言HAR:确定人体动作类别,获取人体行为信息 ,反应行为目的医学中:衡量 脑卒,骨折患者 健康...
2020-01-27 17:23:17
1678
原创 计算机视觉领域里重要的研究方向
整理文章:https://www.cnblogs.com/YSPXIZHEN/p/11232932.html图像分类:对图像的内容对图像进行标记详细:通常会有一组固定的标签,通过模型预测出最适合图像的标签。图像说明:计算机视觉+自然语言处理,为图像生成一个最适合图像的标题,图像检测+说明目标识别/检测:对边界框围绕目标检测体图像/实例分割:将图像划分成互不相交的区域普通分割:狗,猫,...
2020-01-26 16:07:36
922
原创 关于视频理解
计算机视觉中video understanding领域有什么研究方向和比较重要的成果转自:https://www.zhihu.com/question/64021205video understand,是属于visual analysis的第三个层次,比较high-level的研究方向。1)最基础的video classification,属于运动/行为类型的类别,所以,video clas...
2020-01-26 15:55:10
1567
原创 ubuntu下安装Pycharm 以及 python第三方库
在pycharm官网上下载pycharm的ubuntu版本解压压缩包在解压后的文件里bin目录下执行 ./pycharm.sh 启动软件,打开软件。自定义安装目录,安装即可
2020-01-08 21:22:14
2900
原创 吴恩达机器学习作业
Andrew-NG-Meachine-Learningcoursera中Andrew Ng的meachine learning的所有编程测验的原文件 看到网上的下载都是要cf币,倍感心痛,特下载之服务于广大网友( ̄▽ ̄)"下载链接:https://www.cnblogs.com/studylyn/p/9590169.html...
2019-11-16 15:14:44
214
原创 深度学习:第二门课,改善深层神经网络:第一周,深度学习的实践
第一周,深度学习的实践1.1 训练,验证,测试集应用型机器学习:高度迭代项目启动–> 初步想法—> 构建特定层数 / 隐藏单元层 / 数据集个数 —> 编码 —> 运行和测试深度学习:自然语言处理,计算机视觉,语音识别,结构化数据结构化数据:广告,网络搜索深度学习自然语言处理计算机视觉语音识别结构化数据结构化数据广告网络搜索(网络搜索引擎,购...
2019-11-10 15:19:10
218
原创 深度学习:第一门课,神经网络和深度学习:第二周,神经网络的编程基础
第二周:神经网络编程基础2.1 二分类如何处理训练集前向暂停,前向传播。反向暂停,反向传播神经网络训练过程:前向传播,反向传播逻辑回归:用于二分类图片:三个矩阵:红绿蓝,像素强度值把所有像素值放到一个特征向量中。x,y,(x,y),X,Y,Mtrain,MtestX.shape,Y.shape2.2 逻辑回归2.3 逻辑回归代价函数损失函数:误差函数:L看预测值和实际...
2019-11-07 21:10:21
141
原创 深度学习:第一门课,神经网络和深度学习:第一周,深度学习引言
第一周:深度学习引言1.1 深度学习引言改变传统互联网业务:网络搜索,广告。做的比较好:读取x光,个性化教育,精准化农业cousera课程第二门课:超参数,正则化,诊断偏差,方差,高级优化算法。高级优化算法:momentum,adam算法第三门课:构建机器学习系统的策略改变深度学习错误,端对端深度学习第四门课:卷积神经网络(CNNS),应用图像。第五门课:序列模型,应用自然语言处...
2019-11-07 15:22:23
181
原创 KNN基础代码三
增进点:训练多个 KNN 模型,可视化库:matplotlib,numpy,itertools(里面有个 product 可视化),sklearnn_points = 100X1 = np.random.multivariate_normal( [1,50] , [[1,0],[0,10]] , n_points)X2 = np.random.multivariate_normal(...
2019-10-28 16:45:12
157
原创 KNN基础代码一
库 sklearn库下的工具:datasets,model_selection,neighborsK近邻代码思路:有个数据集----对数据分割----调用KNN算法iris = datasets.load_iris()导入数据集数据集权重:开源数据集,重要数据集之一数据集特点:还有3个类别,所以可分类数据集描述链接:https://archive.ics.uci.edu/ml/...
2019-10-27 21:54:24
447
原创 关于我的mac电脑自下软件路径整理
为了Mac 系统环境尽最大的保护,特整理有关我Mac电脑软件的存放位置pycharm在 macOS 系统下,路径 /Users/lin_mac/Code ,在安装过程中时让设置的,是担心之后的python包会污染我自身电脑环境,Code文件夹是自建的,安装之后有个launch文件出现,launch是安装自带的,是python代码。自联的python代码我放在了/Users/lin_mac/...
2019-10-27 16:12:13
1363
原创 基础代码
import numpy , matplotlib.pyplotdata = np.array([ [ , ] , [ , ] , [ , ] ])array 里面是数组,数组是个【】,然后里面放 n个,1行 * 多列的数组data.shapeshape 表示数组大小,(行数,列数)拆解数组:data [ : 2 ] 显示数组第1,2个...
2019-10-27 15:09:17
224
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人