- 博客(6)
- 收藏
- 关注
原创 山东大学软件学院项目实训-创新实训-cherry_sdu-6
添加选项功能,基于选择的不同模式进行不同api的调用。使用fastAPI,添加后端的api接口。使用智谱ai提供的api,调用文生图功能。
2025-06-10 21:11:27
47
原创 山东大学软件学院项目实训-创新实训-cherry_sdu-4
使用upload folder将项目上传至服务器并试运行。此次任务是连接服务器,并试运行。从管理员出获得服务器信息。创建容器docker。正确执行,结果一致。
2025-05-05 17:45:55
125
原创 山东大学软件学院项目实训-创新实训-cherry_sdu-3
在使用代码查询时,我们注意到,有些文章只有几百字,但有些文章有上万字,如果块大小一定,对内容少的文章,只有一至两个分块,分块意义不大;而对于内容很多的文章,块数过于多,会导致检索效果较差。于是,我在文章分块中增加动态分配块大小的方法,利用文章长度决定块大小。建立记录批号的txt文件,每次运行主程序可以导入100篇数据,记为1批,批号加一,可便于日后数据更新,记录插入时间。我发现导入数据时,有些获取的文章内容为空,会导致程序中断报错,于是增加判断条件,如果为空,则跳过。
2025-05-01 15:51:30
568
原创 山东大学软件学院项目实训-创新实训-cherry_sdu-2
find_overlap 函数动态检测实际重叠量(而非固定50字符),通过逆向扫描找到最大匹配子串。利用在分块循环中添加的chunk_number元数据,确保后续能按原始顺序重组文本。chunk_overlap=50:块间重叠50字符(保持语义连贯)extract_images=True:尝试提取PDF中的图片。with_score 返回带相似度的结果(值越大越相关)创建名为 sdu_articles_v4 的集合。chunk_size=200:每块约200字符。输出带元数据的文档块列表。
2025-04-22 11:31:17
311
原创 山东大学软件学院项目实训-创新实训-cherry_sdu
本系统是基于语义嵌入的校园信息检索系统,采用先进的自然语言处理技术和向量数据库技术,并结合deepseek,实现对山东大学相关文档的高效语义搜索。系统架构分为模型服务层、数据存储层和业务逻辑层,具有模块化设计特点。本系统构建了基于深度语义理解的校园信息检索架构,在中文处理效果和工程实践上具有良好基础。后续可通过完善数据源、优化算法模型、增强系统功能等方向进行迭代升级,打造成为智能校园信息服务的核心平台。
2025-04-04 12:42:57
1236
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人