- 博客(24)
- 收藏
- 关注
原创 2024自然语言处理期末回忆
3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X|总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式。4.(1)什么是句法分析,句法分析的作用(?(4)”我们经常有意见“的前向和后向分词结果。(4)对比依存句法和成分句法的优势和不足。5.(1)什么是语言模型。
2024-07-01 13:25:35
486
原创 山东大学多核并行2024年回忆版
问题:为什么不能对这个循环并行化,请你写出一种循环并行化的方法,并写出OPENMP并行化的代码。块划分、循环划分、循环块划分(14个向量,4个进程)奇偶排序,说明代码有什么性能问题,并改进。CUDA指出代码有什么性能问题改进。集合通信与点对点通信的区别。2024.6.13回忆版。矩阵向量乘不可整除代码。按行访问还是按列访问快。
2024-06-26 16:02:11
220
原创 【项目实训】根据词云高频词查询各公司高频知识点,形成参考(多表联查)
我们前端设计了一个界面,以实现,用户可以选择公司,输入关键词,来查询相应的高频考题.。于是编写相应的后端接口函数
2024-06-24 14:16:55
192
原创 【项目实训】对前期面经爬取为空的页面重新爬取
在前期经过团队成员对牛客网面试经验帖子的爬取,已经获得了部分面试经验的相关数据,但是在使用过程中,发现存在大量内容为空的数据记录,为了保证数据的可用性,我对这些页面重新进行了爬取。经查询,发现这些页面与大部分页面源代码布局不一致,于是主要对分门别类地对不同页面的爬取工作量比较大
2024-06-24 13:39:02
323
原创 【项目实训】新增根据关键词模糊查询大模型生成的相应公司的问题
为了完善项目,我们计划新增一个页面,以实现用户输入关键词,从而到数据库中模糊查询。实现逻辑:用户输入关键词,选择公司,首先根据公司查询该公司的高频考点,(如果用户没有选择公司,则不匹配公司名称,自动匹配关键词即可),查询到高频考点后,进入大模型生成的问题的表llmquestion中,模糊查询问题,从而在前端显示该公司对应于该关键词可能提问的问题,以供用户参考。
2024-06-24 03:53:29
326
原创 【项目实训】falsk后端连接数据库以及与前端vue进行通信
综上,我们实现了vue+flask+mysql的整体框架。根据不同的前端展示需求,编写不同的后端代码及sql查询即可。
2024-06-23 19:05:59
647
原创 【项目实训】远程连接他人本地的mysql数据库
其中,use mysql是指针对某个数据库,这里要换成自己的要被别人访问的数据库grant是授权命令,@符号之前的'user'是用户名,如果对root用户授权,即为'root',@后边是对哪个电脑授权,%是通配符,表示对所有授权,如果要指定,则输入希望连接到本地Mysql的另一台机器的IP地址。
2024-06-23 02:28:52
1071
1
原创 【项目实训】后台数据库搭建
前期我们已经爬取了各大公司岗位的相关信息,并且爬取了牛客网的面试经验贴。之后我们将面试经验喂给大模型进行了面试经验总结,得到了良好的面试经验,以供用户参考。为了提高我们系统的效率,降低系统反应时长,我们计划将大模型总结好的经验存储到数据库中,并把一些固定的比如公司岗位信息存储到数据库中,这样,就变成了查询数据库操作,会大大缩短反应时长。并且经会议讨论,我们认真观察了爬取数据的结构内容,发现大部分经验贴中都涉及到了八股信息。于是我们打算爬取八股信息作为模拟面试模块的参考,以提高大模型性能。
2024-06-22 18:53:09
595
原创 【项目实训】面试经验总结页面编写(前期探索)
前端调用的后端接口是api.knowledge_base_chat()函数,需要传递的参数为promot,查询知识库的名称,匹配的知识条数,分数阈值,历史信息,大语言模型,prompt_template_name,temperature。对于面试经验页,我们希望实现的是:不需要用户对话,只需要用户在侧边栏选择公司和岗位,大模型自动给出面试经验的总结,包括岗位要求,岗位职责等。但是这里需要注意,我们希望可以在选择好公司之后,去数据库查询有哪些岗位,从而将相应的岗位显示在下拉框中(有待实现)
2024-06-20 21:59:40
301
原创 山东大学软件学院操作系统2023期末考试回忆版
3.保护:以下几种情况操作系统是如何实现保护的:(1) (2)进程占用CPU过长时间(3)一个线程阻塞时,进程仍能执行(4)分段内存管理方案中,对地址空间的保护(原题不是这么描述的,大概这样)(5)5.页面置换问题,给出逻辑地址,页面大小1024(1)求引用串(2)用FIFO,OPT,LRU页置换,给出缺页次数。(2)自己写一个进程问题,至少有两个实体,有临界资源,且两个实体间有逻辑关系(要求不是课本上 的,可以是课后题的。2.I/O子系统的目的是什么,I/O子系统中buffer的作用。
2024-06-01 19:47:11
688
1
原创 山东大学软件学院数据库2023期末考试回忆版
6.(时间戳协议)数据项Q的R-timestamp和W-timestamp的时间戳均为20,Ta的时间戳为30,Tb的时 间戳为34,Tb先发出read(Q)操作,然后Ta发出read(Q)操作,问执行之后Q的R-timestamp为多 少,为什么。满足条件的记录有n条,树的高度为h,问最坏情况 下,代价为多少。yzm老师,老师给分很不错,数据库要学的内容比较多,老师之前给的课件有录音非常方便。4.查找没有被北京的顾客购买的电子书号(关系代数和SQL)3.查找所有顾客都购买的电子书的号(关系代数和SQL)
2024-06-01 19:38:02
325
原创 【项目实训】前端页面修改1
因此,在我们完成开发后,我们计划固定某些选项,如大语言模型的选择、知识库的选择等,以使这些细节对用户来说不可修改,从而保持对用户的透明性。设定知识库匹配条数、匹配分数阈值固定,其实这里也可以设定知识库固定,但是暂时未编写,因为我们的数据还未完全上传至知识库中。设置公司列表,并使用streamlit的selectbox设置下拉框,但是这里还未关联到后端,因此切换公司时暂时无反应。暂时修改前端页面使之呈现出我们希望呈现的页面,但是没有关联到后端,没有添加相关动作。修改全部页面的侧边栏设置。
2024-05-30 19:35:55
581
1
原创 【项目实训】修改chatchat源码适应数据需求
项目实现过程中,我们将爬取到的数据保存到了csv文件中,并且有固定的列名,为了使chat-chat模型更好的处理我们所爬取的csv文件中的数据,我对chat-chat模型中filteredCSVLoader加载器进行了修改。
2024-05-30 18:35:17
438
原创 【项目实训】chat-chat开源项目代码解读
在项目实训过程中,我们希望搞清chat-chat是如何调用的大模型接口,以及如何实现的前后端交互,从而可以实现自己项目的页面编写,于是读chat-chat源码部分的前端页面webui_page部分。
2024-05-29 22:39:08
1888
原创 【项目实训】互联网公司招聘官网爬虫--Scrapy+selenium
介绍了基础的爬虫操作,以及较复杂的爬虫(使用selenium解决),同时针对招聘官网进行了爬虫实操
2024-05-29 17:31:57
1878
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人