- 博客(21)
- 收藏
- 关注
原创 Python神器Tesseract:从零掌握OCR图像识别技术
本文详细介绍了使用Python和Tesseract进行OCR文字识别的完整流程。内容涵盖Tesseract简介、环境安装(Windows/Mac/Linux)以及核心API使用方法。Tesseract作为开源OCR引擎,支持100+种语言,具有高精度识别能力。安装步骤包括引擎安装和Python库配置,核心API演示了中英文文本识别的基本操作。文章还提供了实用技巧,建议根据实际场景调整预处理方法和识别参数。
2025-07-02 17:45:14
534
原创 零基础langchain v0.3 实战三 自定义工具的定义和使用
tool使用@tool组件定义工具工具三要素 :name :工具的名称description :对工具功能的描述args:返回工具参数的JSON模式属性。该流程是 LangChain 中 Agent 模式调用自定义工具的标准流程,其核心思想是:LLM 决策:决定是否调用工具。工具执行:实际调用外部函数或 API。结果整合:将工具结果反馈给 LLM 生成最终答案。
2025-06-29 15:18:29
375
原创 零基础langchain实战二:大模型输出格式化成Pydantic对象
本文介绍了如何使用LangChain框架实现大模型输出的结构化处理。通过ResponseSchema定义JSON格式输出字段,结合StructuredOutputParser解析器将自由文本转换为结构化数据。文章演示了如何设置提示词模板、调用大模型API,并将输出解析为包含情感评分、优缺点等字段的JSON格式。这种输入/输出中间层设计解决了自由文本的不确定性,提高了开发效率,特别适用于需要结构化输出的业务场景(如智能客服、数据分析等)。关键点包括:定义输出模式、生成格式化指令、创建提示模板,最终实现模型输出
2025-06-28 20:08:19
627
原创 零基础langchain实战一:模型、提示词和解析器
本文介绍了两种使用Python调用大模型API的方法:1) 直接调用方式:通过获取API密钥,设置环境变量或.env文件,使用openai类或指定base_url调用特定模型;2) 使用LangChain框架:提供了标准化的模型调用接口,并支持prompt模板化处理。文章详细说明了API密钥管理、基础调用流程以及如何构建prompt模板,并对比了两种方法的异同,为开发者提供了灵活的大模型集成方案。
2025-06-28 19:04:16
601
原创 ReasonGraph 大模型推理过程可视化开源工具使用探索,大模型幻觉可视化研究
错误体现:模型首先提出虚构框架(approach1的时间机器理论),然后在第二层添加不合理的扩展(如“兵马俑中的相对论公式浮雕”和“普林斯顿大学档案里的竹简残片”),这些元素在现实中毫无依据,却通过“考古证据”等术语包装得看似可信。最后,在第三层引入“项目终止原因”(如时间悖论引发的焚书坑儒事件),这完全基于初始虚构的再创造,加剧了与现实的距离。在基于虚构模型构建后,大模型进行了一次虚构陈述,但下一步在此基础上又进行了进一步的虚构陈述和想象,使原本与现实有偏差的叙述进一步偏差,加剧了大模型的幻觉。
2025-06-28 18:17:09
1237
原创 nginx 只有图片等静态资源时 监听80端口 会404 NOT FOUND
sites-enabled文件中的default会将80端口索引至默认值:/var/www/html目录下,这样当访问80端口时永远为欢迎界面。原因:当nginx没有设置首页路径index时,sites-enabled目录中配置的优先级会高于nginx.conf。删除 /var/nginx/sites-enabled。因此删除sites-enabled是一个很好的解决方案。导致404 NOT FOUND。或者将nginx.conf中的。
2024-07-02 20:02:29
336
原创 webClient + fastJSON2 获取json格式的数据,同时解析至java class 并 下划线转驼峰
决定返回值是什么格式一般情况可以不写,但这里要获取JSON格式的。可以将JSON和java的class属性自动进行匹配。webClient中。fastJSON2中。
2024-06-17 23:49:16
822
原创 WireShark抓包软件的使用 上海商学院 计算机网络 实验作业3
实验总结与收获一、实验目的与过程本次实验以Wireshark工具为载体,旨在深入理解计算机网络原理,提升对网络通信过程的直观认识,具体涉及以下几个方面:1. **Wireshark的使用与基本操作**:通过实际操作,熟悉Wireshark软件的安装、启动、捕获网络流量、停止捕获、保存捕获文件等基本操作流程。2. **设置过滤器**:学习并实践如何在Wireshark中运用各种过滤器(如协议过滤、IP地址过滤、端口过滤等)来精准定位特定类型或特定源/目标的网络流量,提高数据分析效率。
2024-05-31 09:58:23
1338
原创 vue2如何父组件 对象 双向绑定子组件
对于Vue 2,你不能直接用v-model绑定对象,但可以通过在子组件内部处理valueprop的变化并触发input事件来模拟这一行为。
2024-05-27 12:17:13
1053
原创 Packet Tracer模拟器的使用 计算机网络实验二 上海商学院
由于集线器采用共享介质(总线型拓扑)的工作方式,同一时间内只有一个端口可以发送数据,其他端口必须等待,导致所有端口在同一冲突域内运行在半双工模式(即不能同时收发数据)。交换机为每个端口提供独立的带宽,端口间通信互不影响,因此可以实现全双工模式,即同一端口可以同时进行收发操作,大大提高了网络效率。单步仿真执行,观察事件列表的变化如图4,解释每步转发过程,并与上述集线器设备工作模式作对比,分析两个设备的工作原理。冲突域增大了,当有两个集线器的时候,明显发现被标记为“冲突”的数据包变多,频繁出现重传和丢包。
2024-04-17 18:18:41
1320
原创 Pandas 基础练习 python金融数据分析实验 第七周 上海商学院 实验
根据基金对外披露的信息显示,该基金主要配置了国泰金鑫股票基金、中海医疗保健基金、华夏优势精选股票基金、富国城镇发展股票基金以及上投摩根民生需求股票基金等5 只股票型基金,表中列出了这些基金从2019 年4 月1 日至4 月12 日期间的每日净值数据。针对表中的信息,先创建中海医疗保健基金、华夏优势精选股票基金、富国城镇发展股票基金这3 只基金在2019 年4 月8 日至4 月12 日净值的数组(array),然后再通过数组生成一个数据框(DataFrame)。将数据框转变为数组,则运用函数values。
2024-04-09 19:35:34
759
1
原创 pandas练习 python金融数据分析实验 第七周 上海商学院实验
7.生成一个DataFrame,df_2,值为array_2,自定义index,columns(index为a,b,c与columns为A,B,C)2.用这个ndarray生成一个DataFrame,df_1,并自定义index和columns。1.生成一个4行5列的ndarray,array_1(取-10到9之间的20个数字)4.在上述DataFrame中增加一列,列名为‘apd_col’,值自定义。6.生成一个3行3列的数组array_2,values服从标准正态分布。9.df_1与df_2相加。
2024-04-09 19:03:35
447
1
原创 最无聊的大学计算机网络实验作业大家快来围观(含答案)-计算机网络-上海商学院-实验一 含答案
计算机网络-上海商学院-实验一 含答案实验目的(1)学会常用网络命令的使用,如:ipconfig、ping、arp、nslookup、tracert、netstat命令(2)学会正确使用网络命令诊断网络问题。2. 实验要求学生各自应独立完成,严格禁止抄袭;文档命名要求:学号-姓名-专业班级-实验报告号;(示例:12345678-张三-计科201班-实验报告一)正文部分字体字号
2024-04-07 13:44:40
1292
原创 ipvsadm-1.26下载安装,以及简易负载均衡服务器+服务器集群配置与搭建,linux服务器管理作业 -- 上海商学院
这里不同的服务器网卡名称不同,常见的是eth0和ens33。网卡名可以用ifconfig查看。关闭防火墙并停止防火墙自启动。
2024-03-31 19:21:11
757
1
原创 python金融数据分析实验 上海商学院 # Numpy练习
2.用列表list_1,list_2,list_3创建一个3行4列的ndarray,用array_1表示。1.创建三个列表list_1,list_2,list_3,每个列表中包含4个浮点数。7.使array_2中每一个元素乘以array_3中对应的元素,形成array_4。8.将array_4变为一个3维(2,2,3)的ndarray,array_3d。11.将array_3d变为一个4行3列的ndarray,array_5。3.将array_1转变为2行6列,用array_2表示。
2024-03-26 19:03:56
410
原创 python金融数据分析实验 上海商学院 NumPy基础
volume_stock1 = [10, 20, 10, 15, 20] # python下的普通列表,部分数据源返回数据与此形式相似。当我们设置相同的seed,每次生成的随机数相同。stock_position = np.array([[100,150,200,300], # 假设为不同行业不同股票的持仓量数据。stock_pe = np.array([[15,16,15,17,16], # 假设为不同行业不同股票的pe。
2024-03-26 17:53:30
2075
原创 上海某学院 作业3 python作业 A公司是总部位于北京的一家大型公募基金管理公司,在 2019 年年初发行了一只 QDII基金并主要投资于美国纳斯达克交易所上市的科技公司股票,并且该基金主要的重
A 公司是总部位于北京的一家大型公募基金管理公司,在 2019 年年初发行了一只 QDII基金并主要投资于美国纳斯达克交易所上市的科技公司股票,并且该基金主要的重仓股包括 亚马逊、苹果、微软、谷歌和奈飞等 5 只全球知名科技公司股票,表中列示了这 5 只股 票在 2019 年 5 月 13 日至 5 月 17 日这一交易周的日收盘价格数据。
2024-03-19 19:27:15
295
原创 spring boot在创建项目时选成war / jar包在项目后期应该怎么修改?
spring boot在创建项目时选成war / jar包在项目后期应该怎么修改?
2024-03-19 13:42:33
2628
原创 ubuntu22上docker利用docker-compose.yum一键配置nginx,前端,后端,数据库
docker compose mysql迁移到docker容器,version services mysql image container_name depends_on nginx container_name:ports:environment TZ MYSQL_ROOT_PASSWORD volumes:networks
2024-03-18 21:30:58
741
原创 linux centOS7系统下源码安装httpd-2.4.52
如果输入这行代码后没有反应,可能是防火墙没关,请自行搜索相应的linux版本的防火墙关闭方式。安装完成后,再次进行配置,如果报错,还有什么依赖需要安装,请自行安装。Httpd侦听的是80端口,80端口正在被侦听说明httpd成功运行。httpd的配置文件在conf目录下的httpd.conf。2,用configure进行配置安装(检查依赖问题)上面的./configure配置命令再输入一遍。再次使用./configure配置httpd。这边报错,缺少APR依赖源,无法进行配置。至此,httpd安装成功。
2024-03-17 17:10:01
1092
1
原创 用wireshark抓取HTTP的get和post方法流量包
下载安装WireShark网络抓包分析工具,并分别用该工具抓取HTTP的get和post两种页面的网络流量包,并将HTTP的request和response里相应各信息内容抓取在实验报告里并解释各内容的功能和含义。
2024-03-16 11:26:22
12968
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅