自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(244)
  • 资源 (2)
  • 收藏
  • 关注

原创 安装 Microsoft Visual C++ Build Tools

安装是为了在windows系统上编译和运行需要C++支持的程序或库(例如某些Python包,Node.js模块等)。

2025-04-03 22:44:48 547

原创 Git下载安装(windows)

前往Git官网下载一般选择64位的安装包即可。这里下载的是版本。

2025-04-02 07:00:00 363

原创 英伟达NVIDIA显卡驱动与CUDA

我们要根据自己的CUDA需求去安装对应的驱动版本,每个CUDA版本有最低驱动版本要求。方法一:按下 Win+X 键组合,选择 “设备管理器”。在设备管理器窗口中,找到 “显示适配器” 选项,点击左侧的箭头展开,即可看到电脑中安装的显卡型号。可以看到我的电脑当前的驱动版本为517.40,最大支持CUDA版本,如果我想用CUDA 12.x 的话,就需要版本高一点的驱动。方法二:右键点击 “此电脑”,选择 “属性”,在弹出窗口中点击 “设备管理器”,展开 “显示适配器” 就能看到显卡型号。进入英伟达驱动官网,

2025-04-01 13:31:10 820

原创 NVIDIA驱动卸载与安装(windows系统)

在安装新的NVIDIA驱动时,有两种安装方式:包括覆盖安装和彻底卸载再安装。

2025-04-01 13:28:06 647

原创 Python虚拟环境(windows)

装的时候装一堆,卸的时候卸一个。。

2025-03-30 12:20:07 845

原创 查看显卡算力

显卡的Compute Capability(算力)决定了支持的CUDA版本。

2025-03-29 20:11:19 176

原创 为pip设置国内镜像源

在Python中使用pip安装软件包时,通常我们会遇到网络问题,尤其是在中国大陆地区。为了解决这个问题我们可以使用一些国内提供的镜像源。下面以清华大学的镜像源为例进行使用说明。

2025-03-29 14:30:00 458

原创 起始为Zotero中存在错误

点击检查更新也没反应,重启了一下电脑(因为Zotero是有备份功能的,文件都没了也不怕),重启之后可以正常使用。在使用Zotero的时候,出现。

2025-03-13 10:07:13 140

原创 Zotero设置中文引用格式

zotero自带的“gb-t-7714-2015”格式存在缺陷,直接使用会存在很多问题,例如英文参考文献多数作者时会出现"等"的字样。

2025-01-14 08:00:00 4745

原创 Zotero7 茉莉花抓取知网元数据

这里的「转换器」指的是 Zotero 从浏览器网页抓取文献信息时所需的转换器,在 Zotero 中有时也被称作是「翻译器」或「translator」。如果你遇到的是语言翻译问题(如标题翻译、摘要翻译、文献阅读中的句段翻译等),通常与本文讲的转换器(translator)无关,请参照 Translate for Zotero 插件的教程进行排查。此时如果你的浏览器仍然不能完成对文献的识别,在确保步骤 1-2 正确的前提下,可重复几次步骤 3。在 Zotero 设置 中,进入 高级 设置,点击下方。

2024-12-18 14:50:28 7201 5

原创 Translate for Zotero+翻译服务API配置

文本翻译/文本翻译API(1积分/2000字符);文档翻译/Office文档翻译API/PDF翻译API(3积分/页);图片翻译/图片翻译API(3积分/张);语音翻译/语音翻译API(4积分/10次)。由于我们使用的是通用文本翻译高级版,每月有200万免费额度,如果超过了这个额度,需要额外付费,再加上系统加测存在一定的延时,所以我们进行额度控制是非常有效的。遇到问题请考虑换用需要密钥的翻译服务。安装完成后,“翻译服务”默认为海词,不需要添加密钥即可使用。5.只有翻译成功的会扣除积分,翻译失败则不扣除。

2024-11-30 06:00:00 4650 2

原创 Zotero 7 安装与配置

因为默认存储路径在C盘,当我们的文献多了之后不太方便。

2024-11-27 22:00:00 2940

原创 Zotero插件:Green Frog(绿青蛙)

一款能够助力科研的浏览器扩展。支持在主流论文搜索网站上,显示各种期刊等级;支持在所有网站上进行轻量翻译;

2024-11-27 00:48:35 3856

原创 Zotero+InfiniCLOUD配置云端备份库

InfiniCLOUD是日本的一个支持webDav协议的网盘,大容量存储:新用户注册即可获得20GB的免费空间,通过邀请码等方式还能进一步扩容。快速传输:支持高达200Mbps的传输速度,确保用户能够快速上传和下载文件。多设备兼容:适用于各种设备,包括PC、Mac、智能手机等,用户可以在任何设备上访问和管理自己的文件。WebDAV支持:InfiniCLOUD支持WebDAV协议,方便用户与其他支持WebDAV的应用进行文件同步和备份。

2024-11-21 01:00:00 784

原创 蚁群优化算法(ACO)

蚂蚁主要靠信息素进行通信,信息素是它们分泌的化学物质。在蚂蚁沿着一条路径来到食物源并把食物带回群的同时,它们会留下信息素的痕迹。别的蚂蚁用它们的触角嗅信息素,跟踪那条路径,带回更多食物。在这个过程中,蚂蚁继续留下信息素,以强化通往食物源的路径,通向食物的最短路径因为正反馈的强化,随着时间的推移其吸引力会变得更大。有时候,食物源会耗尽或者一个障碍物会阻断通往食物源的道路。当蚂蚁沿着一条路径没能找到食物,它们会转来转去直到找到食物。如果它们采用最初的路径却没能返回,在那条路径上就不再会留下更多信息素。

2024-11-18 03:30:00 1146

原创 CiteSpace 6.3.R1安装及使用教程(以CNKI数据为例)

主界面窗口介绍:左上角:操作区,用于建立与运行项目。右侧第一栏为时间切片区:可以调整要分析文献的年份,以及每几年分析一次。第二栏为文本处理区:一般不去调整,用原始数据即可。第三栏Node Types:最重要的栏,分为四种颜色。蓝色区域:合作网络分析,对象为作者、机构、国家;绿色区域:共现分析,对象可以是主题、来源、关键词、WOS分类;红色区域:被引分析,对象为参考文献及其作者、期刊;灰色区域:耦合分析(不常用,有兴趣的同学可自行研究)。四、五两栏:一般为默认设置。

2024-10-23 08:00:00 16311 19

原创 常见学术期刊分类

什么是学术期刊?学术期刊(英语:academic journal)是一种经过同行评审的期刊,发表在学术期刊上的文章通常涉及特定的学科。学术期刊展示了研究领域的成果,并起到了公示的作用,其内容主要以原创研究、综述文章、书评等形式的文章为主。中国学术期刊按照检索库常可以分为:科技核心期刊(统计源期刊)、中文核心期刊、CSSCI、CSCD、双核心期刊。

2024-09-17 18:40:48 1372

原创 EndnoteX9安装及使用教程

这里提供一个下载链接:链接:https://pan.baidu.com/s/1RlGJksQ67YDIhz4tBmph6Q提取码:5210。

2024-09-17 08:00:00 32012 16

原创 C++Windows环境搭建(CLion)

注意:这里我使用的是学生认证,在学信网下载相应的文件或使用学生邮箱即可免费使用。点击安装(安装时间大概5min,点击Download进行下载。运行Hello World。

2024-07-09 13:05:36 4433

原创 Python数字类型

数字是自然界计数活动的抽象,更是数学运算和推理表示的基础。计算机对数字的识别和处理有两个基本要求:确定性和高效性。确定性指程序能够正确且无歧义地解读数据所代表的类型含义。例如,输入1010,计算机需要明确地知道这个输入是可以用来进行数学计算的数字1010,还是类似房间门牌号一样的字符串”1010",这两者用处不同、操作不同且在计算机内部存储方式不同。即便1010是数字,还需要进一步明确这个数字是十进制、二进制还是其他进制类型。高效性指程序能够为数字运算提供较高的计算速度,同时具备较少的存储空间代价。

2024-03-08 16:24:59 1450

原创 Python基础语法

程序员编写程序时不能定义与保留宇相同的标识符,每种程序设计语言都有一套保留字,保留字一般用来构成程序整体框架、表达关键值和具有结构性的复杂语义等。掌握一门编程语言首先要熟记其所对应的保留字。与其他标识符一样,Python的保留字也对大小写敏感。例如,for是保留字,而For则不是,程序员可以定义其为变量使用。Python 3系列可以采用中文等非英语语言字符对变量命名。由于存在输入法切换、平台编码支持、跨平台兼容等问题,从编程习惯和兼容性角度考虑,一般不建议采用中文等非英语语言字符对变量命名。

2024-03-06 11:23:53 1359

原创 Pandas基础介绍

Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。Pandas官网地址Pandas文档。

2024-03-04 11:43:41 1132

原创 【DingDing】直播回放下载

使用Fiddler进行测试了之后,发现没法进行下载。通过搜索找到了一个比较好的方案。在浏览器上打开需要先进行登录,然后在进行下载。注意:在手机上进行操作,电脑上会显示失败。4、在QQ浏览器/夸克浏览器上进行打开。

2024-03-01 00:29:48 1321

原创 Python中的可变变量与不可变变量

就像区分一个人一样,同样都是张三,可能这个张三就不是那个张三。同一个变量是指的什么相同呢?Python中的对象包含三个要素,id(内存地址),type(数据类型),value(数据值)。像如下的赋值实际上是把变量a的指针指向了5的内存地址,打印可以看到a的内存地址和5的内存地址是一样的。输出结果为:==是比较操作符,用来判断两个对象是否相等,value(值)作为判断依据is是同一性运算符,比较判断两个对象是否相同,id(内存地址)作为判断因素。

2024-02-29 16:45:32 1006

原创 Mathtype7.4安装与嵌入WPS

MathType是一款强大的数学公式编辑器,适用于教育教学、科研机构、工程学等领域人群。它支持在各种文档中插入复杂的数学公式和符号,具有应用于几何、化学及其他方面的新样板和符号,专业的颜色支持,为全球广域网创建公式,将输出公式译成其他语言(例如:TeX、AMS-TeX、LaTeX、MathML及自定义语言)的翻译器,用于公式编号、格式设置及转换Microsoft Word文档的专用命令,可自定义的工具栏,可容纳最近使用过的几百个符号、表达式和公式等功能和特点。

2024-01-05 11:27:50 34288 54

原创 HIve中的查询语句

在Hive中,不能在 WHERE 子句中直接使用字段别名,这是因为 Hive 的语法顺序限制了 WHERE 子句的启动时间早于 SELECT 子句中列别名的解析时间,所以在 WHERE 子句中,列别名是未知的。union和union all都是上下拼接sql的结果,这点是和join有区别的,join是左右关联,union和union all是上下拼接。对于distribute by进行测试,一定要分配多reduce进行处理,否则无法看到distribute by的效果。

2023-07-04 19:31:22 3508

原创 用户行为数据分析

user_data.csv是一份用户行为数据,时间区间为2017-11-25到2017-12-03,总计29132493条记录,大小为1.0G,包含5个字段。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:用户行为类型共有四种,它们分别是1、查询总访问量PV,总用户量UV2、查询日均访问量,日均用户量3、查询每个用户的购物情况(统计点击、商品购买、加入购物车、收藏的次数),统计结果放入表user_behavior_co

2023-06-10 17:48:45 1425

原创 HiveSQL初级题目

两张表:score_info,student_info。

2023-06-10 00:44:34 2534

原创 Hive中的DML操作

DML是Data Manipulation Language的缩写,意思是数据操纵语言,是指在SQL语言中,负责对数据库对象运行数据访问工作的指令集,以INSERT、UPDATE、DELETE三种指令为核心,分别代表插入、更新与删除,是开发以数据为中心的应用程序必定会使用到的指令。一并导处的HDFS路径,Import可将Export导出的内容导入Hive,表的数据和元数据信息都会恢复。(2)overwrite:表示覆盖表中已有数据,否则表示追加。(3)加载数据覆盖表中已有的数据。①上传文件到HDFS。

2023-06-08 14:32:09 2345 1

原创 Hive中的DDL操作

在Apache Hive中,托管表(managed table)是由Hive自己管理其数据存储的表,因此,当您在Hive中执行TRUNCATE操作时,Hive会直接删除表中的所有数据,而存储表结构和元数据。在创建内部表的时候可以不指定路径进行创建,但是在创建外部表的时候,需要指定外部数据的存储位置,也就是指定外部存储的路径。外部表,与之相对应的是内部表(管理表)。该语法允许用户利用select查询语句返回的结果,直接建表,表的结构和查询语句的结构保持一致,且保证包含select查询语句放回的内容。

2023-06-08 11:22:42 1831

原创 Hive数据类型和文件格式

转换的原则是从数据范围小的类型向数据范围大的类型转换,或从数据精度低的类型向数据精度高的类型转换,以保证数据和精度不丢失。employees表的第1行记录看上去和下面展示的一样,它用到了上面表格中的分隔符。Hive中经常经使用未经压缩的文本文件来存储数据,各字段之间如何保证正确分隔,分隔符的选择十分重要,已选定的分隔符不能出现在数据中。Hive 的 STRING 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不限定最多能存储多少个字符,理论上它可以存储 2GB 的字符数。

2023-06-08 09:44:07 2118

原创 Linux快速安装MySQL

但是如果使用刚才那个密码,比较复杂,我们不容易记住,所以我们想把密码设置的简单一些,需要先进行设置。注意:由于MySQL密码策略,此密码必须足够复杂,需要大小写字母,数字,特殊字符。配置主要是root用户 + 密码,在任何主机上都能登录MySQL数据库。注意:若出现以下错误。

2023-06-06 18:44:50 1230

原创 sparkRDD编程实战

由于一行为一条记录,先对数据进行切分构成二元组(时间,用户),然后按照用户进行分组,得到分组后的数据,取第一条数据为该用户第一次出现的数据,然后按照时间进行分组,最后输出结果。我们按照每个品类的点击、下单、支付的量来统计热门品类。首先我们先对原始数据进行结构的转换,只需要省份和广告即可,接着我们按照(省份,广告)进行聚合,然后按照省份进行分组,再进行组内排序,取前三个,最后打印输出。上面的数据图是从数据文件中截取的一部分内容,表示为电商网站的用户行为数据,主要包含用户的4种行为:搜索,点击,下单,支付。

2023-06-05 09:55:06 1626

原创 虚拟机扩容

注意:这里有个细节,就是不能全扩展满,比如空闲空间是60G,然后这里的话60G不能全扩展上,这里我扩展的是55G。将虚拟机关机,然后点击VM顶部菜单栏中的显示或隐藏控制台视图按钮来显示已建立的虚拟机的配置信息。在我们一开始设置虚拟机的时候,一般都没有给虚拟机设定太大的磁盘容量,我当初设置的是每台虚拟机。磁盘容量,但随着课程的不断深入,内存逐渐不够用了。以上只是卷的扩容,然后我们需要将文件系统扩容。配置完成后,不要直接启动集群,需要重启一下。配置完成后,不要直接启动集群,需要重启一下。

2023-05-28 13:10:14 10228 15

原创 HBASE Phoenix异步创建索引报错

修改hbase-site.xml 的这个配置项:hbase.zookeeper.quorum。分发 hbase-site.xml 文件。关闭phoenix、hbase。启动hbase、phoenix。

2023-05-11 18:11:02 427

原创 Flink高手之路6-Flink四大基石

Spark最近在实现Continue streaming,Continue streaming的目的是为了降低处理的延时,其也需要提供这种一致性的语义,最终也采用了Chandy-Lamport这个算法,说明Chandy-Lamport算法在业界得到了一定的肯定。提供了一致性的语义之后,Flink为了让用户在编程时能够更轻松、更容易地去管理状态,还提供了一套非常简单明了的State API,包括ValueState、ListState、MapState,BroadcastState。

2023-04-20 23:19:20 1072

原创 Flink高手之路5-Table API & SQL

Flink的Table模块包括 Table API 和 SQL:Table API 是一种类SQL的API,通过Table API,用户可以像操作表一样操作数据,非常直观和方便SQL作为一种声明式语言,有着标准的语法和规范,用户可以不用关心底层实现即可进行数据的处理,非常易于上手Flink Table API 和 SQL 的实现上有80%左右的代码是公用的。作为一个流批统一的计算引擎,Flink 的 Runtime 层是统一的。

2023-04-20 23:16:18 1259

原创 Flink高手之路4-Flink流批一体

env.fromElements(可变参数)env.fromCollection(各种集合)env.generateSequence(开始,结束)env.fromSequence(开始,结束SourceFunction:非并行的随机数据源(并行度为1)RichSourceFunction:丰富的非并行的随机数据源(并行度为1)ParallelSourceFunction:并行的随机数据源(并行度可以大于等于1)

2023-04-20 21:12:28 1967

原创 HBase高手之路7—HBase之全文检索Phoneix

Phoenix官方网址:http://phoenix.apache.org/Phoenix官网:「We put the SQL back in NoSQL」Apache Phoenix让Hadoop中支持低延迟OLTP和业务操作分析。提供标准的SQL以及完备的ACID事务支持通过利用HBase作为存储,让NoSQL数据库具备通过有模式的方式读取数据,我们可以使用SQL语句来操作HBase,例如:创建表、以及插入数据、修改数据、删除数据等。

2023-04-20 14:33:14 2762

原创 HBase高手之路6—HBase高可用

HBase集群如果只有一个master,一旦master出现故障,将导致整个集群无法使用,所以在实际的生产环境中,需要搭建HBase的高可用,也就是让HMaster高可用,也就是需要再选择一个或多个节点也作为HMaster,但是只有一个是active,其他的都为backup master当active的master宕机时,从backup master中选举一个作为active。

2023-04-20 11:21:20 1080

网络大数据采集期末试卷

网络大数据采集期末试卷 包含选择题、简答题、论述题

2022-12-28

Python语言开发工具选择

Python语言开发工具选择

2022-04-10

完全数python题目解析

完全数python 如果一个数除该数本身之外的所有因子之和等于这个数,该数是完数。例如:6=1+2+3,6是完数。定义判断完数的函数isPerfect(),如果是返回True,不是返回False‬‫‬ 输入一个数,调用该函数判断是否为完数,如果是输出“是完数”,如果不是输出“不是完数”

2022-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除