
机器学习与深度学习实战
文章平均质量分 66
总结机器学习和深度学习实战中遇到的常见问题和实用技能。
东哥说AI
AI超级个体:专注AI智能体、AI编程、大模型部署定制、RPA等前沿技术应用。
分享AI玩法、变现思路。
关注东哥不迷路,创富路上大踏步。
展开
-
Windows安装Tesseract OCR与Python中使用pytesseract进行文字识别
Tesseract OCR是一个开源OCR引擎,用于从图像中提取文本;Pytesseract提供了简单的API,帮助开发者轻松地使用Tesseract引擎来实现图像中文本的识别。本文主要介绍了Windows下安装Tesse下载并安装Tesseract OCR、配置环境变量、Python中安装使用pytesseract等内容。Tesseract OCR是一个本地的图片识别开源引擎,不需要额外的深度学习OCR模型即可实现简单、快速的识别,同时可以通过接口来与多种编程语言对接而集成,可以作为轻量OCR的最佳选择。原创 2023-12-12 16:08:51 · 3680 阅读 · 3 评论 -
Windows系统安装PyTorch框架支持AMD Radeon显卡/Intel显卡
PyTorch对NVIDIA显卡的支持最好,但是通过额外配置,也可以支持其他常见显卡,例如通过安装DirectML即可实现使用AMD和Intel显卡,但是性能上可能存在一定的区别,需要根据需要和表现进行灵活选择。原创 2024-03-25 15:23:55 · 13111 阅读 · 1 评论 -
你真的会用Python随机数种子吗——Python生成随机数随机种子“失效”:Jupyter中不同cell中生成的随机数不一致
在Python中经常会生成很多随机数,例如Python自带的random库、科学计算库NumPy、深度学习框架PyTorch都可以生成随机数,同时为了固定生产的随机数、使得随机数生成可复现,很多时候都会设置随机种子,但随机种子固定的是随机过程,而不是每一个随机数本身,只要设置了相同的随机数,就会生成一个固定的随机过程,那么不管执行多少次过程,生成的这些随机数都是不变的,只不过每一次结果内部的各个随机数并不保证一致。同时,随机结果与是否在Jupyter中运行并无关系,在.py文件中运行结果也相同。原创 2023-01-15 21:23:03 · 2012 阅读 · 49 评论 -
Jupyter Lab设置切换虚拟环境
在进行数据科学任务时,一般会用到交互式开发环境,即Jupyter Notebook,Jupyter lab是Jupyter Notebook的升级版,功能更强大、更好用,但是默认情况下,是不能切换虚拟环境的,只有自带的主环境,对应于conda中的base,而无法显示已经创建好的虚拟环境,此时可以按照以下步骤配置:(1)创建虚拟环境;(2)激活进入虚拟环境;(3)将虚拟环境写入Jupyter的kernel中;(4)在Jupyter Lab中确认,刷新Jupyter Lab的页面,即可查看和切换虚拟环境。原创 2022-04-06 13:00:40 · 6360 阅读 · 0 评论 -
机器学习常见异常和解决办法汇总
Python有很多机器学习库,在使用的过程中可能会出现各种异常,下面汇总了一些常见的一场和解决办法:sklearn库的LogisticRegression模型训练时警告lbfgs failed to converge (status=1)。sklearn库的LogisticRegression模型使用L1正则报错,需要设置分类器为liblinear。持续更新中...原创 2022-02-21 20:10:08 · 1782 阅读 · 0 评论 -
PyTorch使用常见异常和解决办法汇总
PyTorch是一个经常用到的机器学习框架,在使用时可能会出现一些异常,这里总结一些常用的异常和解决办法:使用conda安装PyTorch后同时在Jupyter导入失败No module named ‘torch’,需要安装nb_conda_kernels;使用张量时报错expected scalar type Double but found Float,需要将数据类型转为float32;创建Embedding时报错IndexError: index out of range of self。原创 2021-11-21 17:23:14 · 3067 阅读 · 1 评论