- 博客(41)
- 资源 (1)
- 收藏
- 关注
原创 sql 状态不同,执行不同的排序方案
需求:首先按提交/未提交,未提交的都在最前面,已提交的在后面;其次,未提交的就按先后顺序倒序,已提交的就按编号倒序。
2023-04-03 13:21:08
354
原创 Java学习笔记二之标识符
1.标识符语法:一个合法的标识符只能由“数字、字母、下划线_、美元符号$”组成,不能含有其它符号 不能数字开头 严格区分大小写 关键字不能做标识符2.命名规范见名知意 遵守驼峰命名方式UserService 类名、接口名:首字母大写,后面每个单词首字母大写 变量名、方法名:首字母小写,后面每个单词首字母大写;常量名:全部大写 ...
2021-12-16 20:45:49
166
原创 Java 学习笔记一
一般用命令行启动Java程序,涉及到Javac以及Java命令编译: 使用Javac命令对Java源文件进行编译(对Java 源文件进行检查),生成.class 字节码文件运行:(此时字节码文件可以跨平台进行移植)使用Java命令会启动Java虚拟机(JVM),JVM会启动类加载器Class Loader Class Loader 会去搜索A.class文件,找到该文件则将会将该字节码文件装载到JVM中, JVM将A.class字节码文件解释成二进制10101110...
2021-12-06 17:14:42
585
原创 Java学习小记
1.输入:Scanner in =new Scanner(System.in);两个整数相除,结果只能是整数。当整数和浮点数放在一起运算时,会先将整数转变为浮点数,然后进行浮点数的计算浮点运算存在误差存在的错误:1.忘记大括号,谨记if else后接大括号2.if后直接是大括号3.if只要求括号中的值是ture或者false4.do while 后面别忘记;5.0是偶数...
2021-08-11 11:42:47
139
原创 Java实现数字特征值题目
题目内容:对数字求特征值是常用的编码算法,奇偶特征是一种简单的特征值。对于一个整数,从个位开始对每一位数字编号,个位是1号,十位是2号,以此类推。这个整数在第n位上的数字记作x,如果x和n的奇偶性相同,则记下一个1,否则记下一个0。按照整数的顺序把对应位的表示奇偶性的0和1都记录下来,就形成了一个二进制数字。比如,对于342315,这个二进制数字就是001101。这里的计算可以用下面的表格来表示: 数字 3 4 2
2021-05-16 16:24:45
155
原创 快速下载eclipse的途径
换源https://blog.youkuaiyun.com/u010603798/article/details/104833319
2021-05-12 16:02:01
160
原创 TFIDF的改进新方法
论文:一种基于聚类的 PU 主动文本分类方法提到了TFIDF的改进新方法,感觉有点意思,貌似是根据类别进行计算的,先记下来
2020-11-10 15:57:55
678
原创 代码调用,路径问题
写代码时,总是遇到一个文件夹下的代码调用另一个文件夹下的代码的情况,需要写好路径: .\表示当前层目录 ..\表示上一层目录 ...
2020-10-25 09:38:41
294
原创 亟待解决的问题
1.不小心把.data文件默认为记事本文件格式打开,当程序调用该文件时,如果将记事本格式的内容创新复制到.data文件中,会出现bug
2020-09-01 10:16:26
359
原创 文本分类预处理
https://github.com/hundredblocks/concrete_NLP_tutorial/blob/master/NLP_notebook.ipynb清洗数据
2020-06-12 19:05:25
301
原创 中文分词过程
import sysimport osimport jiebadef savefile(savepath,content): fp = open(savepath,"wb") fp.write(content) fp.close()def readfile(path): fp = open(path,"rb") content = fp.read() fp.close() return content#以下是语料库的分词主程序:#未分...
2020-06-12 09:30:29
420
原创 python读取文档顺序问题
file_list = os.listdir(small_class_path)采用上述代码时可能会出现乱序此时在这段代码的下面加上file_list.sort(key=lambda x: int(x[:-1]))然后运行程序,读取出来的文档名称与数据集中的文档名称保持一致...
2020-04-11 11:33:39
403
原创 关于punkt下载的问题
链接:https://pan.baidu.com/s/1vvNMuoROUYNrkgyusSvqOA提取码:w3sm关键在于解压缩
2020-02-22 09:51:58
3210
2
原创 文本分类数据集
20新闻组数据集下载链接:http://qwone.com/~jason/20Newsgroups/以后用到的数据集将会在这更新
2020-01-04 10:39:02
1779
原创 python文本分类方法总结
8种传统算法: k近邻算法、决策树、多层感知器、朴素贝叶斯(包括伯努利贝叶斯、高斯贝叶斯和多项式贝叶斯)、逻辑回归和支持向量机;4种集成学习算法: 随机森林、AdaBoost、lightGBM和xgBoost;2种深度学习算法: 前馈神经网络和LSTM。 https://blog.youkuaiyun.com/qq_43012160/artic...
2019-12-08 15:23:56
638
翻译 使用python生成曲线图
import matplotlib.pyplot as pltimport xlrdfrom xlrd import open_workbookx_data=[]y_data=[]wb = open_workbook('G:/test/工况.xlsx')for s in wb.sheets(): print('Sheet:', s.name) for row in r...
2019-09-23 08:33:56
2738
转载 python 花括号、中括号以及小括号的区别
字典:dic={'a':12,'b':34}列表:list=[1,2,3,4]元组:tup=(1,2,3,4)
2019-09-22 16:38:43
1723
原创 文本分词后进行tfidf特征提取
import osimport jieba# 保存文件的函数def savefile(savepath, content): fp = open(savepath, 'w', encoding='ANSI',errors='ignore') fp.write(content) fp.close()# 读取文件的函数def readfile(path): ...
2019-09-16 10:59:04
719
原创 数据预处理一:文本分词并且去停用词代码
数据结构:搜狗数据集(最外层文件夹)类别(第二层文件夹,比如说 军事)10.txt(军事类别下面的一个文本文件)import osimport jieba# 保存文件的函数def savefile(savepath, content): fp = open(savepath, 'w', encoding='ANSI',errors='ignore') fp.write...
2019-09-16 10:53:28
4347
原创 文本分类时遇到的小问题
1.中文乱码问题:使用pycharm进行python文本jieba分词时,得到的每个字都是乱码,第一反应时重新设置编码格式utf-8,没有任何效果,后经过摸索,原因是搜狗数据集的文本格式是ANSI,不是utf-8格式,解决办法:将程序中读取文件的格式改成ANSI2.分词时空格问题,已经使用,有些空格仍然去不掉,原因:可能存在不同编码格式的空格:,解决办法:判断空格类型,并...
2019-09-06 19:11:39
830
原创 python打印数据时,出现省略号,解决办法
np.set_printoptions(threshold=np.nan)解决行与行之间的省略用下面的方法pd.set_option('display.max_rows', None)解决列与列之间的省略用下面的方法pd.set_option('display.max_columns', None)...
2019-07-29 10:47:25
3741
原创 迁移学习资料
https://github.com/jindongwang/transferlearning上面链接是关于迁移学习的相关资料,仅供参考希望研究迁移学习的小伙伴们能够一起交流哦
2019-06-11 15:55:36
217
翻译 关于“自然语言处理中主题模型的发展”论文的相关笔记
11.3.2018(NLP)自然语言处理是研究人与计算机之间用自然语言进行有效通信的各种理论和方法。自然处理领域中:主题可以看成是词项的概率分布。主题模型自动分析每个文档,统计文档内的词语,根据统计的信息来断定当前文档含有哪些主题,以及每个主题所占的比例各为多少。主题模型是对文字中隐含主题的一种建模方法。主题:主题就是一个概念、一个方面。它表现为一系列相关的词语,用数学语言描述...
2018-11-05 09:23:19
522
转载 使用AutoCompleteTextView实现对全国省市的模糊查询
使用AutoCompleteTextView实现对全国省市的模糊查询,在这里,我没有用到数据库,只是单纯的将全国省市的信息放在一个String类型的数组中。相关文章来源链接http://blog.youkuaiyun.com/liuwan1992/article/details/52832264package com.example.testdemo;import android.os
2017-07-10 16:04:59
836
转载 Java读取txt文件的方法
访问此链接即可http://www.cnblogs.com/manongxiaojiang/archive/2012/10/13/2722068.html,试验过了没问题
2017-07-05 14:42:13
336
转载 关于eclipse输出的中文乱码问题
主要将eclipse的相关设置改为utf-8就行了开始项目的时候设置好,项目就没有那么多麻烦!相关的链接:http://www.cnblogs.com/debiao/p/5721561.html
2017-01-01 15:31:40
582
解决ctrl+鼠标点击调用方法无法跳转的两种办法.txt
2020-07-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人