
数据库相关(sql)
文章平均质量分 74
数据库原理与基本操作
maligebilaowang
七年数学建模经验,五一杯,电工杯,高教杯,美赛,华为杯都拿过多次一等奖,任何建模问题都可以找我!
展开
-
PG库分页查询数据丢失问题解决--线上bug
order by 的 sort 字段不使用索引(一般情况下,Sorted 字段也不使用索引),如果使用了索引,则会进行索引排序。原因主要是sql分页的时候没有加排序字段,然后pg就使用了默认排序字段group_id,而group_id字段是相同值,如果order by的列有相同的值时, 会随机选取这些行,具体根据执行计划有所不同。关系型数据库优化器在使用 order by limit 的时候,做了上面的优化,导致排序字段没有使用索引,使用堆排序。如果排序包含限制语句,则使用堆排序来优化排序过程。原创 2023-02-06 20:27:17 · 1449 阅读 · 1 评论 -
hive sql 基本命令总结
一、hive简介hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL。二、hive sql与sql的区别其实不同的数据库,比如oracle和mysql在sql语句上也有细微差别。Hive-sql与SQL基本上一样。一般情原创 2021-07-28 00:26:07 · 1274 阅读 · 0 评论 -
hive sql 的三种去重方法总结
sql字段去重在从数据库中取数据或者进行数据清洗的过程中,经常会遇到去重复问题,常用的去重方法包括三种方式。接下来主要介绍常用的三种方式以及最优方法。distinctgroup byrow_number() over()需求分析对下表中uid字段去重,并且把去重后所有字段输出。distinct方法ditinct方法适合于单字段去重,但是单字段去重还要保留其他字段数据,就无法完成了;distinct对NULL是不进行过滤的,即返回的结果中是包含NULL值的;distinct应用到原创 2021-07-28 00:25:21 · 13800 阅读 · 2 评论 -
图数据库neo4j入门:linux下社区版安装与配置
知识图谱一种基于图的数据结构,由节点(Point)和边(Edge)组成。其中节点即实体,由一个全局唯一的ID标示,关系(也称属性))用于连接两个节点。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。neo4jneo4j 是目前比较主流的图数据库,存储,查询图谱数据非常高效,由顶点-边组成,常用于微博好友关系分析、城市规划、社交、推荐等应用。原创 2023-03-08 10:00:00 · 1834 阅读 · 2 评论 -
图数据库neo4j入门(一):linux下社区版安装与配置
一、知识图谱和图数据库简介知识图谱一种基于图的数据结构,由节点(Point)和边(Edge)组成。其中节点即实体,由一个全局唯一的ID标示,关系(也称属性))用于连接两个节点。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。neo4jneo4j 是目前比较主流的图数据库,存储,查询图谱数据非常高效,由顶点-边组成,常用于微博好友关系分析、城市规划、社交、推荐等应用。原创 2021-07-28 00:07:41 · 730 阅读 · 0 评论 -
python客户端与es的通信实现批量导入,删,改,搜索查询等
前言学习一波Elastic Search(简称ES)是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎。ES是一个十分强大的搜索引擎,博主作为一个新手,在实习过程中有时候需要往ES中写数据以及取数据。博主目前只能将其当成一个数据库来用,写个博客记录一下python客户端与es的通信实现批量导入,删,改,搜索查询等操作。后期如果机会深入学习的话,还会持续更新。这篇博文...原创 2019-11-23 14:10:59 · 426 阅读 · 0 评论 -
sql的各种连接查询(join合集)
一、前言复习利用sql语句来实现两个表或者多个表的连接查询,SQL join 用于根据两个或多个表中的列之间的关系,从这些表中查询数据。连接查询是另一种类型的多表查询。连接查询对多个表进行JOIN运算,简单地说,就是先确定一个主表作为结果集,然后,把其他表的行有选择性地“连接”在主表结果集上。二、实验环境navicat premiumoracle数据库操作系统:windows10三...原创 2019-11-23 14:07:51 · 1513 阅读 · 0 评论 -
Python远程连接oracle环境配置与批量插入数据
一、前言oracle数据库算是一个大型的关系型数据库,一般企业单位存储大量数据会用的比较多。个人本地很少有安装oracle服务端,因此本文主要是介绍,pc安装oracle客户端,并且通过python连接远程oracle数据库的一般操作。具体用到了CX-Oracle这个第三方依赖库来实现python连接oracle。下面我们主要从客户端安装,环境配置,以及脚本实现来讲解如何实现python远程连接...原创 2019-11-23 14:02:18 · 1611 阅读 · 1 评论