- 博客(22)
- 收藏
- 关注
转载 关于值类型和引用类型的区别
C#数据类型分为两大类:值类型(数据存放在栈stack中)和引用类型(数据存放在堆heap中,地址存放在栈stack中)。下图是列举了两种数据类型的数值类型变量声明后,不管是否已经赋值,编译器为其分配内存。声明一个引用类时,只在栈中分配内存,用于存放地址,而并没有为其分配堆上的内存空间。值类型与引用类型使用区别:本部分主要以自己编写程序来体验两者区别。对象的...
2019-06-27 16:15:00
223
转载 Hadoop综合大作业
一、用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。1、启动hadoop2、hdfs上创建文件夹并查看3、上传英文词频统计文本至hdfs4、启动hive5、创建novel原始文档表6、导入文件内容到表novel并查看7、用HQL进行词频统计,结果放在表k_wor...
2018-05-25 12:50:00
205
转载 hive基本操作与应用
通过hadoop上的hive完成WordCount启动hadoopssh localhostcd /usr/local/hadoop./sbin/start-dfs.shcd /usr/local/hive/libservice mysql startstart-all.shHdfs上创建文件夹hdfs dfs -mkdir te...
2018-05-16 16:17:00
142
转载 用mapreduce 处理气象数据集
用mapreduce 处理气象数据集编写程序求每日最高最低气温,区间最高最低气温气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa按学号后三位下载不同年份月份的数据(例如201506110136号同学,就下载2013年以6开头的数据,看具体数据情况稍有变通)解压数据集,并保存在文本文件中对气象数据格式进行解析编...
2018-05-09 21:28:00
226
转载 熟悉常用的HBase操作
1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据:学生表(Student)(不包括最后一列)学号(S_No)姓名(S_Name)性别(S_Sex)年龄(S_Age)课程(course)2015001Zhangsanmale23...
2018-05-08 17:02:00
182
转载 爬虫大作业
1.选一个自己感兴趣的主题。2.用python 编写爬虫程序,从网络上爬取相关主题的数据。3.对爬了的数据进行文本分析,生成词云。4.对文本分析结果进行解释说明。5.写一篇完整的博客,描述上述实现过程、遇到的问题及解决办法、数据分析思想及结论。6.最后提交爬取的全部数据、爬虫及数据分析源代码。 此次实验中,通过爬取网易云音乐-遥远的她网页中的热门评论来...
2018-04-29 00:15:00
190
转载 熟悉常用的HDFS操作
编程实现以下指定功能,并利用Hadoop提供的Shell命令完成相同任务:在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词.在本地查看文件位置(ls)在本地显示文件内容cd /usr/local/hadoop touch test1.txt cat test1.txt使...
2018-04-25 11:53:00
252
转载 数据结构化与保存
1. 将新闻的正文内容保存到文本文件。2. 将新闻数据结构化为字典的列表:单条新闻的详情-->字典news一个列表页所有单条新闻汇总-->列表newsls.append(news)所有列表页的所有新闻汇总列表newstotal.extend(newsls)3. 安装pandas,用pandas.DataFrame(newstotal),创建一个Da...
2018-04-12 21:04:00
163
转载 获取全部校园新闻
1.取出一个新闻列表页的全部新闻 包装成函数。2.获取总的新闻篇数,算出新闻总页数。3.获取全部新闻列表页的全部新闻详情。# -*- coding : UTF-8 -*-# -*- author : Kamchuen -*-import requestsimport reurl = "http://news.gzcc.cn/html/xiaoyuanx...
2018-04-11 20:49:00
147
转载 爬取校园新闻首页的新闻的详情,使用正则表达式,函数抽离
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。3. 将字符串格式的发布时间转换成datetime类型4.使用正则表达式取得新闻编号5. 生成点击次数的Request URL6. 获取点击次数7. 将456步骤定义成一个...
2018-04-08 20:56:00
171
转载 爬取校园新闻首页的新闻
import requestsfrom datetime import datetimefrom bs4 import BeautifulSoupurl ="http://news.gzcc.cn/html/xiaoyuanxinwen/"res=requests.get(url)res.encoding='utf-8'soup = BeautifulSoup...
2018-04-04 19:28:00
124
转载 网络爬虫基础练习
0.可以新建一个用于练习的html文件,在浏览器中打开。1.利用requests.get(url)获取网页页面的html文件import requestsnewsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/'res = requests.get(newsurl) #返回response对象res.encoding...
2018-03-29 13:42:00
117
转载 中文词频统计
下载一长篇中文文章。从文件读取待分析文本。news = open('gzccnews.txt','r',encoding = 'utf-8')安装与使用jieba进行中文分词。pip install jiebaimport jiebalist(jieba.lcut(news))生成词频统计排序排除语法型词汇,代词、冠词、连词输出词频最大TOP20...
2018-03-28 15:56:00
101
转载 英文词汇统计
词频统计预处理下载一首英文的歌词或文章将所有,.?!’:等分隔符全部替换为空格将所有大写转换为小写生成单词列表生成词频统计排序排除语法型词汇,代词、冠词、连词输出词频最大TOP10# -*- coding : UTF-8 -*-# -*- author : Kamchuen -*-article = ''' In recent year...
2018-03-21 21:59:00
171
转载 字符串练习
字符串练习:http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html取得校园新闻的编号com0='http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html'[-14:-5]print(com0)https://docs.python...
2018-03-20 20:56:00
132
转载 Python基础
# -*- coding : UTF-8 -*-# -*- author : Kamchuen -*-from turtle import *setup(600,400,0,0)bgcolor('red')color('yellow')fillcolor('yellow')def mygoto(x,y): up() goto(x,y...
2018-03-14 20:27:00
114
转载 熟悉常用的Linux操作
cd命令:切换目录(1)切换到目录 /usr/localcd /usr/local(2)去到目前的上层目录cd ..(3)回到自己的主文件夹cd ~ls命令:查看文件与目录(4)查看目录/usr下所有的文件cd /usrls -al ~mkdir命令:新建新目录(5)进入/tmp目录,创建一个名为a的目录,并查看有多少目录存在...
2018-03-13 22:55:00
182
转载 C语言文法 LL(1)文法
程序->外部声明 | 程序 外部声明程序->外部声明A'A'->外部声明A'|ε外部声明->修饰符 变量名 形参修饰符->void | int | char | float形参->修饰符A'A'->函数名|指针 变量名函数名->L | IL | ID函数名->LA'A'->LA'|DA'|ε...
2016-12-06 21:42:00
589
转载 C语言文法分析
程序 → <外部声明>|<程序><外部声明><外部声明>→<函数定义> | <声明><函数定义> → <类型标识符> <说明符> <复合语句><类型标识符> → void | char | int | float说...
2016-10-28 16:33:00
288
转载 实验报告一 词法分析程序
实验一、词法分析实验商业软件工程 刘锦泉 201506110139一、 实验目的 编制一个词法分析程序。二、 实验内容和要求输入:源程序字符串输出:二元组(种别,单词本身)待分析语言的词法规则三、 实验方法、步骤及结果测试1. 源程序名:词法分析.c可执行程序名:词法分析.e...
2016-10-09 21:14:00
578
转载 词法分析程序(编译原理)
一:词法分析程序的功能: 输入单词串,以'begin'开始,以'#'结束。如果是文法正确的句子,则输出成功的信息:'输入单词串成功',否则返回错误提示。 例: 输入 begin a:=345 end # 输出 输入单词串成功二:符号与种码对照表单词符号种别码...
2016-09-30 22:08:00
326
转载 对编译原理的看法
编译原理是计算机专业的一门重要专业课,旨在介绍编译程序构造的一般原理和基本方法。内容包括语言和文法、词法分析、语法分析、语法制导翻译、中间代码生成、存储管理、代码优化和目标代码生成。 编译原理是计算机专业设置的一门重要的专业课程。虽然只有少数人从事编译方面的工作,但是这门课在理论、技术、方法上都对学生提供了系统而有效的训练,有利于提高软件人员的素质和能力。 这门课程关...
2016-09-09 15:46:00
233
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅