自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 2024自然语言处理期末回忆

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X|总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式。4.(1)什么是句法分析,句法分析的作用(?(4)”我们经常有意见“的前向和后向分词结果。(4)对比依存句法和成分句法的优势和不足。5.(1)什么是语言模型。

2024-07-01 13:25:35 486

原创 山东大学多核并行2024年回忆版

问题:为什么不能对这个循环并行化,请你写出一种循环并行化的方法,并写出OPENMP并行化的代码。块划分、循环划分、循环块划分(14个向量,4个进程)奇偶排序,说明代码有什么性能问题,并改进。CUDA指出代码有什么性能问题改进。集合通信与点对点通信的区别。2024.6.13回忆版。矩阵向量乘不可整除代码。按行访问还是按列访问快。

2024-06-26 16:02:11 220

原创 山东大学2024深度学习期末考试回忆

2024.6.17考整体来说比往年难了些,没有考计算图。LSTM看上去必考了,LSTM的图一定要会画。

2024-06-26 15:53:08 552

原创 【项目实训】根据词云高频词查询各公司高频知识点,形成参考(多表联查)

我们前端设计了一个界面,以实现,用户可以选择公司,输入关键词,来查询相应的高频考题.。于是编写相应的后端接口函数

2024-06-24 14:16:55 192

原创 【项目实训】解决前后端跨域问题

由于前端框架使用vue,后端使用flask,因此需要解决前后端通信问题。

2024-06-24 14:02:28 461

原创 【项目实训】对前期面经爬取为空的页面重新爬取

在前期经过团队成员对牛客网面试经验帖子的爬取,已经获得了部分面试经验的相关数据,但是在使用过程中,发现存在大量内容为空的数据记录,为了保证数据的可用性,我对这些页面重新进行了爬取。经查询,发现这些页面与大部分页面源代码布局不一致,于是主要对分门别类地对不同页面的爬取工作量比较大

2024-06-24 13:39:02 323

原创 【项目实训】前端页面初探索(前期探索)

前期,由于没有确定页面展示形式,于是进行了很多探索,以便实现更好的页面展示效果

2024-06-24 12:46:54 209

原创 【项目实训】各种反爬策略及爬虫困难点总结

在这里,我总结了本次项目的数据收集过程中遇到的反爬虫策略以及一些爬虫过程中容易出现问题的地方。

2024-06-24 12:36:50 1232

原创 【项目实训】新增根据关键词模糊查询大模型生成的相应公司的问题

为了完善项目,我们计划新增一个页面,以实现用户输入关键词,从而到数据库中模糊查询。实现逻辑:用户输入关键词,选择公司,首先根据公司查询该公司的高频考点,(如果用户没有选择公司,则不匹配公司名称,自动匹配关键词即可),查询到高频考点后,进入大模型生成的问题的表llmquestion中,模糊查询问题,从而在前端显示该公司对应于该关键词可能提问的问题,以供用户参考。

2024-06-24 03:53:29 326

原创 【项目实训】数据库内容丰富

从而更新了数据库,以使在前端显示优质面经,过滤掉噪声影响。

2024-06-24 00:06:38 276

原创 【项目实训】后端逻辑完善

经测试,我们决定前端可以同时选择多个类型的岗位进行查询,以显示相应的公司岗位信息。

2024-06-23 22:24:12 228

原创 【项目实训】使用jieba实现对csv文件中的文本提取关键词并绘制词云

对文本进行中文分词,统计词频并绘制词云

2024-06-23 19:41:33 605

原创 【项目实训】falsk后端连接数据库以及与前端vue进行通信

综上,我们实现了vue+flask+mysql的整体框架。根据不同的前端展示需求,编写不同的后端代码及sql查询即可。

2024-06-23 19:05:59 647

原创 【项目实训】远程连接他人本地的mysql数据库

其中,use mysql是指针对某个数据库,这里要换成自己的要被别人访问的数据库grant是授权命令,@符号之前的'user'是用户名,如果对root用户授权,即为'root',@后边是对哪个电脑授权,%是通配符,表示对所有授权,如果要指定,则输入希望连接到本地Mysql的另一台机器的IP地址。

2024-06-23 02:28:52 1071 1

原创 【项目实训】后台数据库搭建

前期我们已经爬取了各大公司岗位的相关信息,并且爬取了牛客网的面试经验贴。之后我们将面试经验喂给大模型进行了面试经验总结,得到了良好的面试经验,以供用户参考。为了提高我们系统的效率,降低系统反应时长,我们计划将大模型总结好的经验存储到数据库中,并把一些固定的比如公司岗位信息存储到数据库中,这样,就变成了查询数据库操作,会大大缩短反应时长。并且经会议讨论,我们认真观察了爬取数据的结构内容,发现大部分经验贴中都涉及到了八股信息。于是我们打算爬取八股信息作为模拟面试模块的参考,以提高大模型性能。

2024-06-22 18:53:09 595

原创 【项目实训】面试经验总结页面编写(前期探索)

前端调用的后端接口是api.knowledge_base_chat()函数,需要传递的参数为promot,查询知识库的名称,匹配的知识条数,分数阈值,历史信息,大语言模型,prompt_template_name,temperature。对于面试经验页,我们希望实现的是:不需要用户对话,只需要用户在侧边栏选择公司和岗位,大模型自动给出面试经验的总结,包括岗位要求,岗位职责等。但是这里需要注意,我们希望可以在选择好公司之后,去数据库查询有哪些岗位,从而将相应的岗位显示在下拉框中(有待实现)

2024-06-20 21:59:40 301

原创 山东大学软件学院操作系统2023期末考试回忆版

3.保护:以下几种情况操作系统是如何实现保护的:(1) (2)进程占用CPU过长时间(3)一个线程阻塞时,进程仍能执行(4)分段内存管理方案中,对地址空间的保护(原题不是这么描述的,大概这样)(5)5.页面置换问题,给出逻辑地址,页面大小1024(1)求引用串(2)用FIFO,OPT,LRU页置换,给出缺页次数。(2)自己写一个进程问题,至少有两个实体,有临界资源,且两个实体间有逻辑关系(要求不是课本上 的,可以是课后题的。2.I/O子系统的目的是什么,I/O子系统中buffer的作用。

2024-06-01 19:47:11 688 1

原创 山东大学软件学院数据库2023期末考试回忆版

6.(时间戳协议)数据项Q的R-timestamp和W-timestamp的时间戳均为20,Ta的时间戳为30,Tb的时 间戳为34,Tb先发出read(Q)操作,然后Ta发出read(Q)操作,问执行之后Q的R-timestamp为多 少,为什么。满足条件的记录有n条,树的高度为h,问最坏情况 下,代价为多少。yzm老师,老师给分很不错,数据库要学的内容比较多,老师之前给的课件有录音非常方便。4.查找没有被北京的顾客购买的电子书号(关系代数和SQL)3.查找所有顾客都购买的电子书的号(关系代数和SQL)

2024-06-01 19:38:02 325

原创 山东大学软件学院编译原理考试回忆23-24第二学期

编译原理考试24年5月回忆+复习总结

2024-05-31 16:32:16 1277

原创 【项目实训】前端页面修改1

因此,在我们完成开发后,我们计划固定某些选项,如大语言模型的选择、知识库的选择等,以使这些细节对用户来说不可修改,从而保持对用户的透明性。设定知识库匹配条数、匹配分数阈值固定,其实这里也可以设定知识库固定,但是暂时未编写,因为我们的数据还未完全上传至知识库中。设置公司列表,并使用streamlit的selectbox设置下拉框,但是这里还未关联到后端,因此切换公司时暂时无反应。暂时修改前端页面使之呈现出我们希望呈现的页面,但是没有关联到后端,没有添加相关动作。修改全部页面的侧边栏设置。

2024-05-30 19:35:55 581 1

原创 【项目实训】修改chatchat源码适应数据需求

项目实现过程中,我们将爬取到的数据保存到了csv文件中,并且有固定的列名,为了使chat-chat模型更好的处理我们所爬取的csv文件中的数据,我对chat-chat模型中filteredCSVLoader加载器进行了修改。

2024-05-30 18:35:17 438

原创 【项目实训】chat-chat开源项目代码解读

在项目实训过程中,我们希望搞清chat-chat是如何调用的大模型接口,以及如何实现的前后端交互,从而可以实现自己项目的页面编写,于是读chat-chat源码部分的前端页面webui_page部分。

2024-05-29 22:39:08 1888

原创 【项目实训】互联网公司招聘官网爬虫--Scrapy+selenium

介绍了基础的爬虫操作,以及较复杂的爬虫(使用selenium解决),同时针对招聘官网进行了爬虫实操

2024-05-29 17:31:57 1878

原创 【项目实训】RAG框架初了解

介绍RAG结构、langchain、以及langchain与大模型集成的方式

2024-05-29 15:37:01 479

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除