- 博客(21)
- 收藏
- 关注
原创 Java API for WordNet Searching (JAWS)
https://mind.cs.byu.edu/projects/DARCI/source_code/source_code/LanguageAnalysis/doc/overview-summary.htmlhttps://github.com/VitaliyOliynyk/jaws/blob/master/src/main/java/edu/smu/tspell/wordnet/WordNetDatabase.javaloadWordNetString path = "C:\\Progra
2021-05-19 22:50:24
236
原创 The SPECIALIST Lexicon API
The SPECIALIST Lexicon JAVA API使用affix 为词缀,按缀位分为 prefix (前缀)和 suffix(后缀);按缀形分成 inflection (屈折词)和 derivation (衍生词)derivation 分为 prefix 和 suffix,如:happy 加suffix为happily,加prefix为unhappy.inflection 只在词尾加词缀,表时态,数,格等变化,如:ask,asks,asking,asked,etc.derivat
2021-05-19 12:36:21
641
翻译 分类和标注词汇
一 使用词型标注器nltk.pos_tag() 对单词词性进行标记import nltktext=nltk.word_tokenize("And now for something completely different")print(nltk.pos_tag(text))import nltk# 同形同音异义词text=nltk.word_tokenize("They re...
2019-11-07 10:22:14
343
翻译 python NLP——处理原始文本
一 从网络和硬盘访问文本电子书from urllib import requesturl = "http://www.gutenberg.org/cache/epub/5517/pg5517.txt"reponse=request.urlopen(url)raw=reponse.read().decode('utf8')print(raw[:75])如果你使用的Internet...
2019-10-08 20:31:32
1373
翻译 python NLP ——获得文本语料和词汇资源
一 获取文本语料库1.Gutenberg>>> from nltk.corpus import gutenberg>>> gutenberg.fileids()['austen-emma.txt', 'austen-persuasion.txt', 'austen-sense.txt', ...]>>> emma = gutenber...
2019-09-15 10:34:42
1857
翻译 语言处理与python
一 将文本当作单词列表1.列表加法——连接追加 append()2.索引列表text.index(word)word第一次出现的索引3.变量4.字符串二 简单统计1.频率分布FreqDist接受参数words后, 会统计words中每个word的频数,并返回一个字典,key是word,value是word在words中出现的频数。f = FreqDist(text1)...
2019-09-10 17:01:59
341
翻译 python NLTK——文本和单词
from nltk.book import *从NLTK的book中加载所有东西一 搜索文本text.concordance(word)在text中找到指定单词word并显示上下文text.similar(word)根据word的上下文单词的情况,来查找具有相似的上下文单词会在文本中搜索具有类似结构的其他单词只考虑一些简单的指标,不考虑语义text.common_context...
2019-09-10 09:00:32
648
转载 考研机试——其他
一 标准模板库(STL)string#include <string>s.erase(10,8); //删除s[10]开始的8个字符二 输入输出流#include <fstream>void main(){ //读取文件 ifstream in("D:\\123.txt"); if (!in.is_open()) { cout <&l...
2019-03-24 15:12:44
352
原创 考研机试1
一 排序处理输入的多组数据while(scanf("%d",&amp;n)!=EOF)while(gets(字符串变量))1.冒泡排序时间复杂度高2.快速排序快速排序库函数sort调用后,原来地址的数组就已经排序,只需输出即可#include &lt;algorithm&gt;sort(排序内存的起始地址,结束地址);用新定义的cmp函数实现降序bool cmp(int...
2019-03-12 22:31:08
221
原创 CSS样式表 补充
CSS样式表1.表单属性placeholder=" " 文本框提示属性提供可描述输入字段预期值的提示信息(hint)。该提示会在输入字段为空时显示,并会在字段获得焦点时消失。<input type="text" name="fname" placeholder="First name"><br> <input type="text&qu
2019-01-09 21:33:57
463
原创 蓝桥杯—— 算法训练 K好数 (动态规划)
问题描述如果一个自然数N的K进制表示中任意的相邻的两位都不是相邻的数字,那么我们就说这个数是K好数。求L位K进制数中K好数的数目。例如K = 4,L = 2的时候,所有K好数为11、13、20、22、30、31、33 共7个。由于这个数目很大,请你输出它对1000000007取模后的值。输入格式输入包含两个正整数,K和L。输出格式输出一个整数,表示答案对1000000007取模后的值。样例输入4 ...
2018-02-08 20:04:53
314
原创 蓝桥杯—— 算法训练 最大最小公倍数(贪心)
问题描述已知一个正整数N,问从1~N中任选出三个数,他们的最小公倍数最大可以为多少。输入格式输入一个正整数N。输出格式输出一个整数,表示你找到的最小公倍数。样例输入9样例输出504数据规模与约定1 <= N <= 106。最大的三个数开始考虑,如果最大的数为奇数,那么相邻的三个数中有两个奇数,最大公约数为1,最小公倍数就为n*(n-1)*(n-2). 如果为偶数,那么往后移,考虑n*(...
2018-02-08 17:23:15
427
原创 蓝桥杯——基础练习 十六进制转八进制
问题描述 给定n个十六进制正整数,输出它们对应的八进制数。输入格式 输入的第一行为一个正整数n (1 接下来n行,每行一个由0~9、大写字母A~F组成的字符串,表示要转换的十六进制正整数,每个十六进制数长度不超过100000。输出格式 输出n行,每行为输入对应的八进制正整数。 【注意】 输入的十六进制数不会有前导0,比如012A。
2018-02-02 17:05:38
705
原创 蓝桥杯——基础练习 十六进制转十进制
问题描述 从键盘输入一个不超过8位的正的十六进制数字符串,将它转换为正的十进制数后输出。 注:十六进制数中的10~15分别用大写的英文字母A、B、C、D、E、F表示。样例输入FFFF样例输出65535#include #include #include using namespace std;int main(){
2018-02-01 19:00:23
460
原创 蓝桥杯——基础练习 十进制转十六进制
问题描述 十六进制数是在程序设计时经常要使用到的一种整数的表示方式。它有0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F共16个符号,分别表示十进制数的0至15。十六进制的计数方法是满16进1,所以十进制数16在十六进制中是10,而十进制的17在十六进制中是11,以此类推,十进制的30在十六进制中是1E。 给出一个非负整数,将它表示成十六进制的形式。输入格式
2018-01-30 20:03:16
479
原创 蓝桥杯——基础练习 特殊回文数
问题描述 123321是一个非常特殊的数,它从左边读和从右边读是一样的。 输入一个正整数n, 编程求所有这样的五位和六位十进制数,满足各位数字之和等于n 。输入格式 输入一行,包含一个正整数n。输出格式 按从小到大的顺序输出满足条件的整数,每个整数占一行。样例输入52样例输出8999989899899988
2018-01-30 17:39:11
231
原创 数据库SQL Server 2008&Visual Studio建立管理系统
仓库管理数据库综合实验某供应部门管理多个仓库,仓库主要管理物资的入库、出库、库存和采购等事项。1.ADO.NETADO.NET是一组向 .NET Framework程序员公开数据访问服务的类。提供对诸如 SQL Server和 XML这样的数据源以及通过 OLE DB和 ODBC公开的数据源的一致访问。.NET Framework数据提供程序l Connecti
2018-01-29 19:20:04
3147
2
原创 蓝桥杯—— 基础练习 杨辉三角形
问题描述杨辉三角形又称Pascal三角形,它的第i+1行是(a+b)i的展开式的系数。 它的一个重要性质是:三角形中的每个数字等于它两肩上的数字相加。 下面给出了杨辉三角形的前4行: 1 1 1 1 2 1 1 3 3 1 给出n,输出它的前n行。输入格式输入包含一个数n。输出
2018-01-29 18:51:14
329
原创 蓝桥杯——基础练习 字母图形
问题描述利用字母可以组成一些美丽的图形,下面给出了一个例子:ABCDEFGBABCDEFCBABCDEDCBABCDEDCBABC这是一个5行7列的图形,请找出这个图形的规律,并输出一个n行m列的图形。输入格式输入一行,包含两个整数n和m,分别表示你要输出的图形的行数的列数。输出格式输出n行,每个m个字符,为你的图形。样例
2018-01-29 16:19:14
366
1
原创 蓝桥杯——基础练习 01字串
问题描述 对于长度为5位的一个01串,每一位都可能是0或1,一共有32种可能。它们的前几个是:0000000001000100001100100请按从小到大的顺序输出这32种01串。输入格式 本试题没有输入。 输出格式 输出32行,按从小到大的顺序每行一个长度为5的01串。 样例输出 00000 00001 00010 00011 //将0-32
2018-01-29 15:31:46
240
原创 蓝桥杯—— 入门训练 Fibonacci数列
问题描述Fibonacci数列的递推公式为:Fn=Fn-1+Fn-2,其中F1=F2=1。当n比较大时,Fn也非常大,现在我们想知道,Fn除以10007的余数是多少。输入格式输入包含一个整数n。输出格式输出一行,包含一个整数,表示Fn除以10007的余数。说明:在本题中,答案是要求Fn除以10007的余数,因此我们只要能算出这个余数即可,
2018-01-28 19:39:26
253
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人