自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 山东大学软件学院项目实训-创新实训-cherry_sdu-6

添加选项功能,基于选择的不同模式进行不同api的调用。使用fastAPI,添加后端的api接口。使用智谱ai提供的api,调用文生图功能。

2025-06-10 21:11:27 47

原创 山东大学软件学院项目实训-创新实训-cherry_sdu-5

比如问完一个问题,继续提问我想要了解更详细的情况,则无法正确回答,需后续完善。

2025-06-07 21:42:08 154

原创 山东大学软件学院项目实训-创新实训-cherry_sdu-4

使用upload folder将项目上传至服务器并试运行。此次任务是连接服务器,并试运行。从管理员出获得服务器信息。创建容器docker。正确执行,结果一致。

2025-05-05 17:45:55 125

原创 山东大学软件学院项目实训-创新实训-cherry_sdu-3

在使用代码查询时,我们注意到,有些文章只有几百字,但有些文章有上万字,如果块大小一定,对内容少的文章,只有一至两个分块,分块意义不大;而对于内容很多的文章,块数过于多,会导致检索效果较差。于是,我在文章分块中增加动态分配块大小的方法,利用文章长度决定块大小。建立记录批号的txt文件,每次运行主程序可以导入100篇数据,记为1批,批号加一,可便于日后数据更新,记录插入时间。我发现导入数据时,有些获取的文章内容为空,会导致程序中断报错,于是增加判断条件,如果为空,则跳过。

2025-05-01 15:51:30 568

原创 山东大学软件学院项目实训-创新实训-cherry_sdu-2

find_overlap 函数动态检测实际重叠量(而非固定50字符),通过逆向扫描找到最大匹配子串。利用在分块循环中添加的chunk_number元数据,确保后续能按原始顺序重组文本。chunk_overlap=50:块间重叠50字符(保持语义连贯)extract_images=True:尝试提取PDF中的图片。with_score 返回带相似度的结果(值越大越相关)创建名为 sdu_articles_v4 的集合。chunk_size=200:每块约200字符。输出带元数据的文档块列表。

2025-04-22 11:31:17 311

原创 山东大学软件学院项目实训-创新实训-cherry_sdu

本系统是基于语义嵌入的校园信息检索系统,采用先进的自然语言处理技术和向量数据库技术,并结合deepseek,实现对山东大学相关文档的高效语义搜索。系统架构分为模型服务层、数据存储层和业务逻辑层,具有模块化设计特点。本系统构建了基于深度语义理解的校园信息检索架构,在中文处理效果和工程实践上具有良好基础。后续可通过完善数据源、优化算法模型、增强系统功能等方向进行迭代升级,打造成为智能校园信息服务的核心平台。

2025-04-04 12:42:57 1236

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除