
【国科大】
文章平均质量分 89
国科大作业
不牌不改
※ 接受自己很普通
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【现代信息检索】国科大何苯老师现代信息检索课程作业 —— 第三次作业
基于神经网络的检索模型主要分为基于学习文本的分布式表示的模型(representation based model)和基于文本匹配函数的模型(matching function model)。通过在特定任务上进行少量的有标签数据训练,BERT可以适应不同的任务,如文本分类、命名实体识别、问答等。在微调过程中,通常会在BERT模型的顶部添加一个任务特定的输出层,用于任务特定的预测。最大的 MAP,即最大的 AP,对应的返回相关文档的位置序列为。最小的 MAP,即最小的 AP,对应的返回相关文档的位置序列为。原创 2024-01-01 19:13:50 · 1752 阅读 · 0 评论 -
【现代信息检索】国科大何苯老师现代信息检索课程作业 —— 第二次作业
字典(按字典序)为 {“Ariolimax”, “banana”, “Campus”, “columbianus”, “Cruz”, “Mascot”, “mountains”, “Santa”, “slug”},总共 9 个单词。对于这里的“词项频率”有些疑惑,是指“频次”还是“频率”?括号中明确表示“不包括长度归一化因子”,所以我倾向于这里指的是“频次”,以防万一,下面将两种理解都写出来了。对于本题而言,总共 18 个单词,其中 to 和 of 各两个,其余单词均一个,字典大小为 16。原创 2024-01-01 19:12:16 · 1525 阅读 · 0 评论 -
【现代信息检索】国科大何苯老师现代信息检索课程作业 —— 第一次作业
查询词项的权重计算采用:查询中出现的词项权重为 1,否则为 0。计算查询 “bord” 与图中每个包含 2-gram “or” 的词项之间的 2-gram Jaccard 系数, 并写出计算过程。考虑表 1 中的 3 篇文档 Doc1、Doc2、Doc3 中几个词项的 tf 情况,表 2 为词项在所有文档中的 idf 值。试计算采用欧氏归一化方式处理后的文档向量,其中每个向量有 4 维,每维对应一个词项。以 “bord” 的 3-gram 为例,添加特殊标记后变为“<S。画出文档集对应的词项-文档矩阵。原创 2023-12-10 19:33:17 · 2226 阅读 · 2 评论 -
【数据挖掘】国科大苏桂平老师数据库新技术课程作业 —— 第四次作业
云数据库是在 SaaS(software-as-a-service:软件即服务)成为应用趋势的大背景下发展起来的云计算技术,它极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易,同时也虚拟化了许多后端功能。云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点。如图111所示,在云数据库应用中,客户端不需要了解云数据库的底层细节,所有的底层硬件都已经被虚拟化,对客户端而言是透明的。原创 2023-12-10 19:11:18 · 1635 阅读 · 0 评论 -
【数据挖掘】国科大苏桂平老师数据库新技术课程作业 —— 第三次作业
根据描述内容创建 student 表、course 表、department 表、selectcourse 表、teacher 表、teach 表,分别如图。表 9 somestucent 表中学生所选的所有课程名、成绩查询结果。表 4 selectcourse 关系表。表 11 somescourse 关系表。表 8 somestudent 关系表。表 3 department 关系表。表 1 student 关系表。表 2 course 关系表。原创 2023-12-09 20:10:25 · 1570 阅读 · 0 评论 -
【数据挖掘】国科大苏桂平老师数据库新技术课程作业 —— 第二次作业
,但是不满足传递依赖的定义,所以不存在传递依赖,故。当分解只包括两个关系模式时,可以使用定理”分解。指出下列关系模式是第几范式,并说明理由。注意区别”传递律“与”传递函数依赖“。具有无损连接性“判断是否为无损连接。注意,传递依赖的定义:设关系模式。1NF:如果一个关系模式。的属性子集,若函数依赖。的域值都是原子的,即。属于第一范式,简记为。原创 2023-12-09 20:02:58 · 1285 阅读 · 0 评论 -
【数据挖掘】国科大苏桂平老师数据库新技术课程作业 —— 第一次作业
首先,目标属性是“学生号码”和“学生姓名”,除法运算后需要保留“学生号码”和”学生姓名“,这么看起来仿佛被除数关系应该是 Student 关系,因为只有 Student 关系中同时包含这两个属性,但从查询语句的语义中理解可以发现,被查询的关系应该为 SC 关系,本质上还是从选课关系中查找满足一定条件的学生。首先,目标属性是“学生号码”,所以经过除法运算后保留的属性应该是“学生号码”。作为被除数的关系应该包括“学生号码”和“课程号码”,作为除数的关系应该只包括“课程号码”,这样除后的关系只剩“学生号码”。原创 2023-12-06 23:13:06 · 724 阅读 · 0 评论 -
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第二次作业
Written Part1. 给定包含属性{Height, Hair, Eye}和两个类别{C1, C2}的数据集。构建基于信息增益(info gain)的决策树。 Height Hair Eye Class 1 Tall Blond Brown C1 2 Ta原创 2023-11-29 16:39:57 · 2790 阅读 · 0 评论 -
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第三次作业
c 的条件模式基为 {{e,a,b:1}, {e,a,d:1}, {e,b:1}, {d:1}, {a,b:1}},统计基于其条件模式基的候选一项集:{a:3,b:3,e:3,d:2}。综上所述,根据 FP-Growth 算法确定的频繁项集为 {a},{b},{c},{d},{e},{ab},{ad},{ae},{be},{de},{ade}。建立 ba 条件 FP 树,需要从图。可以看出,频繁项集有 {a},{b},{c},{d},{e},{ab},{ad},{ae},{be},{de},{ade}。原创 2023-11-29 16:45:20 · 2051 阅读 · 0 评论 -
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第一次作业
经过测试,无需修正。所示,gender 取值为 ”male“ 和 ”female“,marital_status 取值为 ”unmarried“,”married“ 和 ”divorce“,二者对应的 bitmap index 分别如表。,排序后的序列为 {16,16,17,18,19,20,20,20,21,21,22,22,23,23,24,24,25,26,26,27}。,可以想象到,离散粒度过大(粗),本质不同的区间可能被划分为同一类,离散粒度过小(细),划分的区间数过多,index 表出现。原创 2023-11-29 16:26:24 · 2214 阅读 · 0 评论