- 博客(73)
- 资源 (3)
- 收藏
- 关注
原创 sql中奇数、偶数、正则
在sql中,mod()和%都是用来取余的操作符。在很多 SQL 实现中,它们可以互换使用,都可以用来计算一个数除以另一个数的余数。
2025-02-04 21:23:09
1040
原创 sql表的增删改、替换
1、向原表的字段中插入多条记录的方法# mysql中常用的三种插入数据的语句:# insert into表示插入数据,数据库会检查主键,如果出现重复会报错;# replace into表示插入替换数据,需求表中有PrimaryKey,# 或者unique索引,如果数据库已经存在数据,则用新数据替换,如果没有数据效果则和insert into一样;# insert ignore表示,如果中已经存在相同的记录,则忽略当前新数据;2、MySQL 插入日期和时间。
2025-02-04 20:47:59
1055
原创 如何获取sql数据中时间的月份、年份(类型为date)
可用自带的函数month来实现如:创建表及插入数据:执行sql语句,获取月份:执行结果:执行sql语句,获取年份YEAR:执行结果: 区别 MySQL Now ()函数和SQL Server GetDate ()函数非常相似,它们可以用于获取当前系统时间,格式化当前日期时间的输出版本,并从当前日期时间中提取特定部分。但是,它们之间存在以下区别:MySQL的Now ()函数返回当前系统日期和时间戳,它返回的值精确到秒级别,而SQL Server的GetDate ()函数返回更精确的时间戳,它
2025-02-04 10:55:02
2008
原创 增加列、删除列,修改表名、列名
如果想指定字段位置,可以使用mysql提供的first(设定为第一列)和after(设定位于某个字段之后)执行下列命令,列会默认添加到表字段末尾。
2025-02-04 10:35:06
193
原创 sql字符串函数及字符拼接函数
在SQL语句中经常需要进行字符串拼接,以sqlserver,oracle,mysql三种数据库为例,因为这三种数据库具有代表性。注意:SQL Server中没有concat函数(oracle和mysql中虽然都有concat,但是oracle中只能拼接2个字符串,所以建议用||的方式;mysql中的concat则可以拼接多个字符串。在SQL Server中的“+”号除了能够进行字符串拼接外,还可以进行数字运算,在进行字符串拼接时要小心使用。下面以“Users”表为例,进行详细分析。
2025-02-04 10:29:29
800
原创 频数分布之右偏分布左偏分布(复习)
左偏分布(负偏态)中:mean(平均数)<median(中位数)<mode(众数)右偏分布(正偏态)中:mode(众数)<median(中位数)<mean(平均数)众数,频率最高的那个数,图上就是最高峰对应的x值中位数,中间位置的那个数,在图上就是面积对半分的那条线对应的x值当右偏时,可直观得出 中位数 > 众数这个关系是什么出来的呢,其实不太好理解,我也是想了很久才想出来的一个能让自己理解的方法,在这里分享一下。首先我们看正态分布,正态分布的情况下,mode(众数)== median(中位数)== m
2025-02-04 10:11:25
821
原创 正态分布和标准正态分布区别与联系(复习)
平均数为μ标准差为σ(2)联系:正态分布可以通过标准化处理,转化为标准正态分布。具体方法是使用z=(X-μ)/σ将原始数据转化为。
2025-02-04 10:02:32
612
原创 数据思维错题知识点整理(复习)
编写数据报告是整个业务分析过程的成果,基本流程是首先明确数据报告的需求及目的,其次拆解指标发现问题,在确定问题后,就需要找到能够数值化衡量这些问题的指标,以及它们的计算方式,再以计算公式结果为指标,拓展维度(比如地区、时间)来探究不同维度下的指标差异,最终得出结论撰写报告并优化。连带率=销售总数量÷销售小票数量,指销售的件数和交易的次数相除后的数值,反映的是顾客平均单次消费的产品件数。R值:最近一次消费,指的是客户在店铺消费最近一次和上一次的时间间隔,理论上R值越小的客户是价值越高的客户。
2025-02-03 18:17:29
899
原创 互联网行业常用12个数据分析指标和八大模型
在互联网行业分析中,分析师在搭建指标体系时通常面临两个主要问题。首先是不清楚要关注哪些指标,毫无头绪;其次是找到一些指标后,却无法确定哪些是关键的,导致迷失方向。今天我们将详细讨论互联网分析中最常用的12个数据指标,以解决这些常见问题。然后通过对指标的分析,我们介绍几种互联网常用的分析模型互联网的本质之一是将线下活动转移到线上,并通过技术和运营手段提供更好的用户体验。由于线下业务搬移到了线上,我们需要分析哪些指标呢?
2025-02-03 17:52:54
1631
原创 《数据科学与工程》课程结课报告
数据集来自于搜狗实验室的用户搜索日志,该用户搜索日志是包括了大约为一个月(2008年6月)的搜索引擎部分网页的用户点击情况和搜索需求情况的网页搜索日志的数据集合,适合需要分析搜索引擎用户行为的研究实验。该用户搜索日志的数据格式为访问时间、用户ID、该URL在返回结果中的排名、用户点击的顺序号、用户点击的URL。其中,用户ID是根据用户使用浏览器访问搜索引擎时的Cookie自动赋值的,这标识同一用户输入的不同查询可以被识别出来。(本次选用精简版(一天数据,63MB))
2024-07-13 10:05:33
896
原创 搭建hadoop+spark完全分布式集群环境
tar -zxvf jdk-8u181-linux-x64.tar.gz -C /home/hadoop/apps #解压到apps下。进入/home/hadoop/apps/hadoop-2.7.6/etc/Hadoop。sudo vi /etc/profile #修改配置文件。start-slaves.sh //启动从节点。start-master.sh //启动主节点。拷贝到slave1和slave2中。拷贝到slaves1,slaves中。//将其拷贝到其他机子上。
2024-07-13 09:47:47
1538
原创 不想搭集群,直接用spark
需要用到spark的本地模式,根本用不到集群,就不想搭建虚拟机,hadoop集群啥的,很繁琐,最后写作业还用不到集群(感觉搭建集群对于我完成作业来说没有什么意义),所以才想办法在windows环境下,直接安装jdk、scala、spark等,使用spark的本地模式来写作业。
2024-06-13 17:21:05
1615
3
原创 行业分析的一些参考网站
1、数据网站各省市统计局官网:世界银行公开数据:Knoema全球数据:CEIC: 证监会官网:发现报告网站:36kr:行行查网站:TalkingData:钛媒体:德勤:艾瑞研究-艾瑞网:亿欧:七麦数据:QYResearch:卡思数据:普华永道:
2024-05-25 16:27:44
1186
转载 智能手环还能预测人的情绪?
此项研究得到中科院重点部署项目(KJZD-EW-L04)、国家重点基础研究发展计划(“973”项目,基于生物、心理多模态信息的潜在抑郁风险预警理论与生物传感关键技术的研究,2014CB744600)、中科院战略性先导科技专项(面向感知中国的新一代信息技术研究,XDA06030800)等课题资助。既有研究表明情绪会体现在人的步态中,而智能手环(内置加速度计)可以采集到人在行走时的步态加速度数据,因此如果根据加速度数据进行情绪识别,会使得情绪识别更生态方便。
2024-04-23 18:49:40
365
原创 NameError: name ‘plot_decision_boundary‘ is not defined
好像是由于版本问题,这个plot_decision_boundary被换成了DecisionBoundaryDisplay。
2024-03-30 11:13:42
580
原创 Tableau项目案例-广州美食分析
数据集有三个文件,分别是A网站美食数据、B网站美食数据、店铺地图信息如下图所示是A网站美食数据.xlsx文件的数据:如下图所示是B网站美食数据.xlsx文件的数据:如下图所示是店铺地图信息.xlsx文件的数据:打开 Tableau Prep Builder ,连接三个excel文件,将A、B网站美食数据 拖拽字段进行字段合并将店铺地图信息与合并数据进行关联制作数据透视 接下来是将口味评分、环境评分、服务评分进行转置,如上述操作一样,在转置1后面点击加号,选择转置,将口味评分、环境评分、服务评分拖拽到 转置字
2024-03-26 16:52:38
612
4
原创 脑电信号处理的学习记录
【脑电信号处理与特征提取】https://www.bilibili.com/video/BV1Sg411775g?滤波:对特定频率进行有效提取,并对提取部分进行特定的处理(增益、衰减、滤除)。带通滤波:保留某上下限值之间的信号。凹陷滤波(带阻滤波):去除某上下限值之间的信号,而保留在此之外的信号。(Cut-off frequency):半功率截止频率(增益降低3dB)(roll-off),增益下降的陡峭成都,单位为dB/oct。
2024-03-14 14:39:18
1537
原创 Microsoft Visual Studio 2019下载及安装流程记录
您可能需要自己从源代码编译 OpenCV 4.8.0,以确保它与 Visual Studio 2019 兼容。要执行此操作,请按照 OpenCV 的源代码编译指南进行操作。在编译过程中,请确保选择适用于 Visual Studio 2019 的编译器和工具。
2023-11-20 09:23:44
1743
原创 试着写几个opencv的程序
总之,C++在C的基础上引入了面向对象编程和许多其他高级特性,使得它更适合开发大型、复杂的应用程序,而C语言更接近底层硬件,通常用于编写系统级的、性能关键的代码。:OpenCV提供了一系列强大的图像处理功能,包括图像加载、保存、裁剪、缩放、旋转、滤波、边缘检测、直方图均衡化等。对于彩色图像,有三个灰度图像,分别代表了是红,绿,蓝的强度(RGB),将这些叠加起来就构成了彩色图像。:OpenCV有一个庞大的开源社区,提供了大量的文档、教程和支持,使开发者能够快速入门和解决问题。
2023-10-17 21:43:06
1336
原创 第8关:使用递归
递归(Recursion)是一种非常重要的程序设计思想。它可以极其方便的简化程序设计流程,以非常简洁的方式完成复杂的逻辑设计。我们都知道在一个函数内部还可以调用其它函数,但是如果在一个函数的内部调用函数自身,那么这个函数就是递归函数。注意,在使用递归策略时,必须要有一个明确的递归结束条件,称为递归出口。本关的编程任务是补全 src/step8/step8.py 文件中的代码,以递归的方式设计函数。递归调用的代价高昂(效率低),因为占用了大量的内存和时间。本关的任务是让学习者掌握使用递归的方式设计函数。
2023-09-17 16:49:41
959
原创 第9关:生成器与 yield
因为计算 F(i) 需要 O(i) 次加法,这使得整个运算的复杂度为 O(n2)。然而,这种方法不具有扩展性 —— 当需要存储的全局变量非常多的时候,会破坏程序的数据封装性。本关的任务是让学习者掌握 Python 中生成器的使用方法,然后利用生成器实现一个计算 π 的具有 O(N) 复杂度的算法。我们可以使用一个生成器,在避免使用过多全局变量的情况下获得开销为 O(n) 的算法,代码如下。本关的编程任务是利用生成器,基于韦达公式给出计算 π 的具有 O(N) 复杂度的算法。当对该生成器再次调用(使用。
2023-09-17 15:43:06
434
原创 jdk安装及配置
找到Path变量,双击编辑 Path变量。点击新建,变量值为%JAVA_HOME%\bin ,并将它移到最前端,然后点击确定。再新建一个系统变量CLASSPATH。我只是记录一下我的安装过程。
2023-06-25 19:02:02
135
原创 记录一下Anaconda的安装教程
找到“此电脑”右键选择“属性”,选择“高级系统设置”,选择“环境变量”,”,至此Anaconda已经安装完成了,接下来配置环境变量。安装过程有点慢,稍等一下。Anaconda官网。
2023-06-25 18:20:30
100
转载 记录搭建hadoop集群的过程
CentOS-7.6-x64镜像下载: https://www.aliyundrive.com/s/72Xg449t6i8 提取码: 32rm。点击开启此虚拟机,键盘上的上下箭头按键可以进行选择,选中第一个后,敲回车就开始安装了。Linux(CentOS-7.6-x64位)基础配置, 虚拟机平台VmWare15。剩下的参考这个博客:(我安装的是没有桌面的,这个博客安装的是有桌面的,适当参考)如何查看自己的计算机的处理器(CPU)数和内核数?内容未完,后续还会接着写……点击关闭,点击完成,即可。
2023-06-04 15:08:32
166
原创 DataSpell第一次安装使用教程
其实到这块跟jupyter notebook一样了,shift+enter运行当前cell。安装过程就一直点击下一步就好,遇到方框需要勾选的全部勾上。同样的pycharm应该也可以这样汉化,试了试。新建一个jupyer notebook。注意尽量别安装在C盘,我安装在了D盘。这样就跟pycharm差不多一样了。直接找File -> Settings。点击Launch DataSpell。看起来跟Pycharm的页面很像。pycharm的也成功了。双击.exe文件开始安装。再新建一个.py文件。
2023-06-04 11:07:00
6587
4
原创 记录一下创建第一个pycharm项目
D:\Users\xuxiaojing\.conda\envs\helloproject (原本是helloproject,后来我给改成了python-envs)在此之前,我已经安装好了默认python版本为3.10的anaconda。查看新建的虚拟环境python-envs。选择New Project。
2023-06-03 17:20:31
101
原创 C语言实现:矩形面积重叠
在笛卡尔坐标系内(x轴向右为正,y轴向上为正),给出2个矩形的左上角坐标与右下角坐标,请你计算出两个矩形所覆盖区域的面积。第一行4个空格隔开的整数,表示第1个矩形的左上角与右下角的坐标x1,y1,x2,y2;第二行4个空格隔开的整数,表示第2个矩形的左上角与右下角的坐标x3,y3,x4,y4;坐标xi与yi均大于等于1000000且小于等于-1000000;数据确保面积小于1000000000。
2023-03-01 16:28:19
969
原创 C语言之数组及其应用
幻方()是一种将数字安排在正方形格子中,使每行、列和对角线上的数字和都相等的方法。幻方也是一种中国传统游戏。旧时在官府、学堂多见。它是将从一到若干个连续的自然数排成纵横各为若干个数的正方形,使在同一行、同一列和同一对角线上的几个数的和都相等。例如有如下表所示的一个三阶幻方,幻和为15。492357816本关任务:编写程序判定N×N(规定N为奇数,且N
2022-12-11 21:16:14
1395
原创 C语言之循环嵌套和流程转移控制
为双重循环实现,请补充完整。注意两个函数均无返回值,请直接打印输出结果。万元时就结束,统计此时捐款的人数,以及平均每人捐款的数目。本关任务:请用单重循环和双重循环(嵌套)两种方式来求。条件下方程x2+y2+z2=552有多少组整数解。输出两种方式所得到的结果。提示: 整数包含正整数、负整数和。第一行输出为单重循环方式的结果。第二行输出为双重循环方式的结果。学生中,征集慈善募捐,当总数达到。本关任务:编程求满足。为单重循环实现,函数。
2022-12-11 19:13:37
1953
DEAP数据集,需要自己下载提取码
2023-12-15
“我要淘”商品交易平台App的基础架构设计
2023-05-15
实训10:管家婆手机通讯录
2023-05-15
基于JavaScript技术的途游畅享网站设计
2023-05-15
基于DIV+CSS的“犀牛付”企业宣传网站设计
2023-05-12
KN知享博客系统的静态页面设计
2023-05-11
基于Swing技术实现“HoneyViewer”图片查看器
2023-05-11
基于Java抽象类和接口实现疯狂动物城
2023-05-11
基于Java OOP的一杯可乐会员积分系统
2023-05-11
利用echarts实现网易云音乐的大屏可视化.zip
2022-06-05
美的热水器评论数据情感分析
2022-05-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人