
数据分析与机器学习
文章平均质量分 66
主要是机器学习理论知识及机器学习算法,数据分析,统计学以及深度学习等
lym-ucas
这个作者很懒,什么都没留下…
展开
-
LLama2源码分析——Rotary Position Embedding分析
原理推导参考自上文,以下结合huggingface代码分析公式计算过程。原创 2024-06-06 22:53:32 · 1599 阅读 · 0 评论 -
2023最新ACL大模型论文分类汇总(有代码的)
1 大模型文化道德Knowledge of cultural moral norms in large language modelsurl:https://aclanthology.org/2023.acl-long.26/code:https://github.com/AidaRamezani/cultural_inference2 长文本推理Open-ended Long Text Generation via Masked Language Modelingurl:htt原创 2023-11-13 16:43:39 · 1831 阅读 · 0 评论 -
Windows客户端下pycharm配置跳板机连接内网服务器
实验室服务器仅限内网访问,无法在宿舍(外网)访问实验室的所有内部服务器,但同时实验室又提供了一个外网可以访问的跳板机,虽然可以先ssh到跳板机再从跳板机ssh到内网服务器,但这种方式不方便传输文件,也没法用pycharm进行自动同步代码或者远程调试。原创 2023-10-26 23:00:44 · 1941 阅读 · 0 评论 -
最详细的Ubuntu服务器搭建Stable-Diffusion教程(无显卡,仅用CPU)
后续步骤可以用conda新建一个虚拟环境进行,我的服务器是临时的,所以就直接在base环境下进行了。启动后安装很多依赖以及克隆相应github仓库,过程有报错的可以看附录解决方案并重新执行这一步。一路回车,遇到选择就yes(切记要yes,不然要手动添加环境变量)文件,启动web服务,并指定监听端口为1234(端口号随意),若是GPU环境的用户需要安装与cuda版本对应的。然后重新启动项目,此时能看到公网地址,说明成功。若想让服务能在公网上被其他用户访问,则需进入。下载一个模型,这里可以根据自己的需要下载。原创 2023-04-09 12:13:03 · 14881 阅读 · 19 评论 -
Pytorch LSTM网络初始化hidden维度报错:RuntimeError: Expected hidden[0] size (2, 14, 150), got [2, 64, 150]
Pytorch LSTM网络初始化hidden维度报错:RuntimeError: Expected hidden[0] size (2, 14, 150), got [2, 64, 150]原创 2022-11-22 23:41:43 · 2590 阅读 · 0 评论 -
NLP入门之——Word2Vec词向量Skip-Gram模型代码实现(Pytorch版)
Word2vec是Google开源的将词表征为实数值向量的高效工具,其利用深度学习的思想,可以通过训练,把对词的处理简化为K维向量空间中的向量运算。简单来说,Word2Vec其实就是通过学习文本语料来用词向量的方式表示词的语义信息,即通过一个高维向量空间使得语义上相似的单词在该空间内距离很近。比如下图中的dog和cat同属于一类、tree和flower同属于一类,因此在语义上有关联的词在向量空间上也比较接近。原创 2022-11-12 23:28:00 · 1445 阅读 · 0 评论 -
Linux screen命令解决SSH远程服务器训练代码断开连接后运行中断
因为实验室经费紧张,组里一般是几个人共用一台服务器,所以都是用SSH远程连接服务器跑模型(自己电脑Windows、服务器是Linux系统),但远程跑代码过程中常因为电脑睡眠或者网络中断导致训练中断,为了解决这个问题我们可以使用screen命令screen是窗口管理器的命令行界面版本,它提供了统一的管理多个会话的界面和相应的功能。简单说只要screen还在,就算你断开了SSH连接,你这个连接中运行的东西还在,你再开个窗口输入命令又能进入这个screen对应的窗口状态具体操作如下首先命令screen -原创 2021-12-15 20:36:37 · 6602 阅读 · 1 评论 -
基于N-gram模型的中文文本纠错研究
中文拼写检查(CSC)在今天仍然是一个热门话题,也是一个悬而未决的问题。N元语法语言建模(LM)以其简单性和强大功能在CSC中得到了广泛的应用。1. 整体概述下图为系统的整体流程图,主要包含:中文分词、混淆集合、语料库和语言模型。step1.step2.step3.step4....原创 2021-10-30 22:04:01 · 2096 阅读 · 0 评论 -
文本纠错库pycorrector和kenlm安装及使用教程
1. 简介中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。2. 安装前环境准备...原创 2021-10-28 23:22:07 · 3551 阅读 · 0 评论 -
通俗易懂的Matlab线性规划求解详解
线性规划(Linear Programming LP)问题是在一组线性约束条件的限制下,求一线性目标函数最大或最小的问题。在matlab中,线性规划的标准形式如下{Ax≤baeq⋅x=beqlb≤x≤ub\begin{cases}Ax\le b \\aeq·x=beq \\lb\le x\le ub\end{cases}⎩⎪⎨⎪⎧Ax≤baeq⋅x=beqlb≤x≤ub它的标准形式求得都是最小值,若是最大值要转化为求最小值matlab函数为[x, fval] = linprog(f原创 2021-01-20 17:22:28 · 4087 阅读 · 0 评论 -
texlive运行报错Cannot load default config file解决方法
用texstudio运行latex时报错Fontconfig error: Cannot load default config file C:/texlive/2020/texmf-var/fonts/cache does not exist. Kpathsea is not working. 出现错误我出现这个问题的原因是安装过程中,还没装完就中途退出了,所以卸载重装,第二次装时耐心的等他装完,就没错误了...原创 2021-01-13 17:58:37 · 3262 阅读 · 1 评论 -
最新Latex安装详细教程
看到有的博客推荐CTeX,但CTeX已经没有维护了,所以这里还是推荐官方的TeX Live官网:TeX Live官网1、下载TeX Live这里我直接去国内的镜像站点下载了中科大镜像原创 2021-01-13 15:53:05 · 96661 阅读 · 96 评论 -
VSCode编辑器配置matlab环境,设置代码提示及高亮
matlab软件自带的编辑器栏不仅不好看而且没有代码提示,而VSCode作为程序员最喜欢用的万能编辑器就能解决这一问题,这里教你如何在VSCode中配置matlab环境1、VSCode安装首先,肯定是要安装好VSCode编辑器的,官网下载地址VSCode下载安装就一路next就好了,安装汉化扩展自行处理2、matlab插件安装在扩展中搜索matlab并安装3、插件配置进入设置,在上面搜索栏搜索matlab找出matlab相关设置,在Matlabpath中填入的是matlab可执行文件的安装路原创 2020-11-21 19:59:57 · 5489 阅读 · 4 评论 -
Jupyter Notebook设置代码提示、彩色主题字体黑色背景
默认Jupyter Notebook没有安装代码提示功能,使得编程效率非常低,我们可以配置其代码提示功能1、打开CMD运行以下命令安装扩展pip install jupyter_contrib_nbextensionsjupyter contrib nbextension install安装运行成功后打开jupyter,会看到多出个Nbextensions2、点击它,然后把下面1指向处的勾取消掉,把2处勾上,就可以使用代码提示了3、安装主题,CMD输入如下命令安装jupyter主题pi原创 2020-11-12 17:05:14 · 6101 阅读 · 1 评论 -
数据分析与建模Python pandas常用操作总结
一、索引取数据#第0行df.loc[0]#切片df.loc[3:6]#取任意值df.loc[[2, 5, 7]]原创 2020-10-26 22:05:51 · 214 阅读 · 0 评论 -
Python使用ARIMA模型做时间序列预测案例
1、python导入相应的库这里我们导入python数据分析相关的库,并配置画图模块%matplotlib inlineimport pandas as pdimport numpy as npimport datetimeimport matplotlib.pylab as pltimport seaborn as snsimport itertoolsimport statsmodels.api as smfrom matplotlib.pylab import stylefrom原创 2020-07-27 15:42:12 · 9660 阅读 · 2 评论 -
最详细数据分析与建模Python numpy常用操作总结
1、数组或矩阵中替换大于或小于等于某个值的元素最快和最简洁的方法是使用Numpy的内置索引。import numpy as npa = np.array([[1,2,3], [1,2,3], [1,2,3]])a[a > 2] = 0print(a)结果:[[1 2 0] [1 2 0] [1 2 0]]2、把二维数组(矩阵)中行或列的值相加1)、全部相加import numpy as npa = np.array原创 2020-07-23 13:34:12 · 487 阅读 · 0 评论