- 博客(18)
- 资源 (24)
- 收藏
- 关注
原创 关系语言说明
除了SQL还有其它形式的关系语言:元组关系演算和域关系演算都是基于数理逻辑的声明式查询语言。下面介绍两种用户友好的查询语言QBE和DataLog1.元组关系演算元组关系演算是非过程化的查询语言,它只描述所需要的信息,而不给出获得该信息的具体过程。元组关系演算中的查询表达式为:也就是说,它是所有谓词P为真的元组t的集合。形式化定义其中P是一个公式。公式中可以出现多个元组变量。 如果元组变量不被或修饰,则称为自由变量。元组关系演算的公式由原子构成,原子可以为如下形式其
2022-03-10 22:30:26
1125
原创 全文索引打分计算公式简介
全文匹配采用TF-IDF BM25算法对文档进行打分计算。详细可以参考文章文本相似度(tf-idf 和 bm25的算法讲解)_#叫啥名字呢的博客-优快云博客_bm25和tfidf区别这里简单扒拉一下公式N为文档数,为包含了q的文档数,则单词与文档的相关性TF其中hit为单词在该文档中出现的次数,word为该文档的单词数...
2022-02-21 17:58:11
217
原创 全文索引查询原理
从前面的分析知道,全文索引根据倒排索引数据进行检索。一个是利用文档倒排过滤出所包含所有查询词的文档,再利用文档偏移倒排进行位置偏移过滤。doc过滤:通过文档倒排,就是求每个查询词文档集合的交集。由于单词的文档集合具有有序性,这样就可以做两个有序集合的交集。使用双指针对比偏移算法求交集即可hitoffset过滤:只有需要对输入短语进行完全匹配时,需要。通过查询短语的偏移倒排序列和文档的偏移序列对比,查看一致情况。.........
2022-02-21 17:42:11
619
翻译 SQLite数据库系统设计与实现
前言 本书旨在为读者构建一个学习、设计、开发、维护和加强数据库系统软件管理的思维架构,在本书的开头,我们回顾了过去几十年中形成的并且仍在许多现代数据库中普遍存在的基本概念,我会简述这些概念,并重点介绍一种基于SQL的关系数据库管理系统,即SQLite。在本书的主要部分,我们讨论了SQLite设计原理,技术上的考虑、具体实现和操作。该书对SQLite所有的重要内容进行了全面的描述,也就是说,它呈现出了一幅SQLite端到端的画面。 在过去几十年里,人们开发了许多不同种类的数据库管理系统。DB2、I..
2022-02-19 23:00:34
1159
原创 SQL进阶学习
前面简单说了SQL的基础,这里再说说SQL的一些其它特性SQL的内建数据类型:date/time/timestamp用户定义类型:独特类型:create type asdrop type/alter type大对象类型:blob/clob完整性约束:单个关系约束:not null/unique/check<谓词>参照完整性:foreign key references级联:cascade断言:create assertion<断言名>c
2022-02-19 22:28:15
292
原创 基础SQL学习
SQL---结构化查询语言,目前是关系数据库中的标准语言。其主要由DDL,DML,完整性,VIEW,事务控制,嵌入式SQL,动态SQL以及GRANT部分组成。SQL标准:SQL-92,SQL-99,SQL-2003DDL:关系模式属性的值域完整性约束每个关系的安全性和权限信息磁盘上每个关系的物理存储结构基本域类型:char,varchar,int,smallint,numeric,real,float,double,float....create table:crea
2022-02-19 15:21:02
379
原创 全文索引的建立线程模型
由于全文索引处理的数据量大,一般都是多线程并发处理。整个建立可以分为主线程,分词线程,压缩线程,输出线程。主线程负责生产,分词线程作为worker组进行消费,分词线程组处理完成后提交给排序线程,然后进行压缩,最后通过多个输出线程处理后输出。既保证处理的并发性也保证doclist处理的有序性。线程组的模式线程个数可以配置...
2022-02-18 17:01:11
197
原创 Gbase全文索引数据结构
根据前面的介绍全文索引简介_u012166464的博客-优快云博客,倒排索引表可以使用字典方式处理数据,存储使用hash方式。具体结构如下,可以每个单词用一个32位整数标识,称为wordid,所有单词保存在hash结构里。hash桶格式可以配置,这里可以定位65536(数量小了冲突多,数量大了浪费空间)。这个每个单词位置可以使用wordid%65536,hash值重复的保存在冲突链表里。doclist/hlist的存储组织doc记录了单词对应的文档id列表,HIT记录了单词在某一个文档
2022-02-18 16:10:54
359
原创 存储基本知识
1.服务器:塔式服务器;机架式服务器;刀片服务器塔式服务器:通用类别服务器,外观与普通台式PC差不多。机架式服务器:外观通过统一标准来设计,配合机柜使用,满足企业的服务器密集部署要求。刀片式服务器:在标准高度的机框内插入多个卡式服务器单元,是一种高可用密度的低成本服务器平台。特征塔式机架式刀片式使用场景多用于常见的服务,应用范围广,可以适合速度应用和存储应用,使用效率较高大型企业,将多台放在一起,...
2022-02-13 00:10:19
129
原创 优化程序性能的编程技巧
读完《深入理解计算机系统》,我们的编程不只是简简单单的码代码。而是要结合系统的基础去写更优化的代码。我们用理解计算机的工作方式去写代码。用更低层次的目光去审视我们的代码,也许一个简单的循环就能改变代码的整体效率。现代的编译器很复杂,其为程序作了很多工作,目标都是让程序更安全更快。比如我们的编译优化选项-Og -O1 -O2 -O3等,但是也由于优化,我们的机器指令被安排得“面目全非”,不信大家可以使用优化后的代码进行反汇编看看,会大大超出你的想象。以下有几条准则可以适用1.消除循环的低效率,绝不
2022-02-13 00:07:10
1171
原创 关系模型理论简介
总所周知,关系数据库在数据库市场占据着很大的份额。关系数据库具有坚实的理论基础----关系模型和关系代数。下面简单总结一下关系模型和关系代数内容,作为后续认识和学习关系数据库的基础。关系数据库处理的是结构化数据,说的明确一点就是处理具有固定格式的数据,表就是其代表,所以关系数据库就是表的集合(集合论)1.基本结构属性:表中的一列域:表中某一属性值的取值范围关系:一系列域上的笛卡尔积的子集(表)元组:表的一行元组变量:代表元组的变量数据库模式:数据库的设计逻辑关系模式:
2022-02-12 23:27:05
662
原创 UNIX SOCKET 高级学习日记-高级I/O函数
1.套接字超时a.使用alarm-SIGALARM信号b.select 中阻塞等待I/Oc.使用套接字选项SO_RCVTIMEO,SO_SNDTIMEO.在connect和recvfrom中使用alarmselect设置超时时间使用套接字选项修改recvfromreadv与writev函数分散读,集中写sendmsg,recvmsg辅助数据查看排
2018-01-12 13:22:56
211
原创 UNIX SOCKET高级学习日记-IPV4-IPV6的互操作性
由于过渡原因,IPV4到IPV6的转换不是一蹴而就的,所以需要考虑长期会有二者同时出现的可能;即需要保持clientIPV4与IPV6,IPV4的Server通信;client IPV6与IPV6,IPV4的Server通信规则遵守:向后兼容1.IPV4智能接收来自IPV4客户的外来链接;2.如果服务器有一个绑定了通配地址的IPV6监听SOCKET,且选项为设置IPV6_V
2018-01-05 13:52:47
313
原创 C告警设计
1 告警日志模块设计 1.1 功能分析本模块的功能是将产生的告警输出到串口或者日志文件 1.2 基本原理 输出到串口的告警等级缺省为info级别;输出到文件的告警等级缺省为alert级别,将alert及更高级别的信息保存到文件。 当其他模块有告警产生时,调用sysLogMsg(MODUL
2017-12-28 12:07:47
488
翻译 GPON技术标准分析一
1. 标准规范ITU-T G.984.1:GPON的一般特性ITU-T G.984.2:GPON的PMD子层规范ITU-T G.984.3:GPON的TC子层ITU-T G.984.4: GPONONT OMCI接口ITU-T G.984.5:GPON-增强带宽 ITU-T G.984.6:GPON-距离延伸 ITU-T G.987: 10G无源光网络(XG-
2017-12-23 23:18:36
6264
原创 GPON其他厂商配置流程分析
1.1.1 流量模板gemport-car命令用于配置GEM Port流量模板,对GEM Port上行流量进行控制时,使用此命令创建合适的流量模板。配置成功后,使用gponlink命令创建GPON连接时引用,对上行流量进行控制。undo gemport-car命令用于删除已配置的GEM Port流量模板,当不再需要某些流量模板时,使用此命令删除。命令格式gemp
2017-12-23 23:14:35
2645
人工智能的未来
2018-01-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人