- 博客(15)
- 收藏
- 关注
原创 20185110054CSL组(天池大赛>MTWI 2018 挑战赛一:网络图像的文本识别)
简介基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别文本检测:CTPN文本识别:DenseNet + CTC环境部署(基于Ubuntu操作系统)sh setup.sh即:pip install numpy scipy matplotlib pillowpip install easydict opencv-python keras h5py PyYAM...
2019-06-26 20:58:53
2782
1
原创 20185109007——工业蒸汽测量
工业蒸汽测量0. 成员说明姓名学号分工职责完成情况201851090072018xxxxxx2018xxxxxx2018xxxxxx1. 前期准备前期主要进行:账号申请md语法学习开发环境搭建git命令学习python语法学习开发环境搭建算法学习1.1 账号创建csdn账号创建github账号创...
2019-06-25 21:27:13
679
1
原创 20185111019石燕鹏组
**模型结果该比赛计算每一个条目的f1score,取所有条目的平均,具体计算方式在这里。这里的计算方式不对一句话里的相同文字重复计算,故f1score比提交的最终结果低:-trainvalf1score0.99110.9582recall0.99430.9574precision0.98940.9637模型说明模型采用densene...
2019-06-23 17:34:05
340
原创 北京PM2.5浓度回归分析
任务由给定一段时间内的北京天气相关指数数据和北京PM2.5指数等,建立模型预测接下来一段时间内北京的PM2.5指数。难度中等。数据数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据。数据分为训练数据和测试数据,分别保存在pm25_train.csv和pm25_test.csv两个文件中。其中训练数据主要包括35746条记录,13个字段,主要字...
2019-06-22 10:39:42
6736
1
原创 天池新人赛-数据挖掘
天池新人赛-数据挖掘组别:WLH奥林匹克百米跑数据预测-python编程是基于python的环境进行,可以在环境中构造数据模型数据读取将数据导入到环境中,是数据处理的基础。初始数据绘图数据处理#画出建立的方程模型图像和散点图的图像,进行对比x_test = np.linspace(1896,2008,100)[:,None]#在文档中读取x的值f_test = w0+w1*x...
2019-06-21 19:12:01
917
原创 kaggle竞赛-手写数字分类技术
kaggle竞赛-手写数字分类技术|姓名学号于 朋20185109052班飞虎20185109035数据来源:手写数字分类引用的是MNIST的样本库,train.csv是一个42000*785的数据集,有42000个样本,第一列是label,后面784是灰度值。 train.csv是测试集,28000个样本。算法实现过程:本次手写识别技术的实现模型...
2019-06-20 23:25:05
1102
原创 天池新人赛数据挖掘
数据挖掘大作业|姓名学号段阳阳20185111075王浩20185111045贾德智20185111076周成成20185111033乔伟20185111046刘宗敏20185111006数据读取import pandas as pdimport numpy as np#train= np.loadtxt(‘zhengq...
2019-06-20 20:00:26
842
原创 文本智能处理
组别:李宝成组我们组的任务是建立模型通过长文本数据正文(article),预测文本对应的类别(class)环境配置代码基于Pytorch,版本为0.4.1,Python版本为3.6。需安装:pytorchtorchtextword2vecpandassklearnnumpyfire文件说明emb_build/: word2vec训练词/字向量models/: 深度学习模型...
2019-06-20 19:30:42
552
原创 网络图像文本识别
#OCR目录背景介绍项目介绍使用说明背景介绍OCR是通过图像处理和模式识别技术对光学的字符进行识别的意思,是自动识别技术研究和应用领域中的一个重要方面。它是一种能够将文字自动识别录入到电脑中的软件技术。这是由于课程需要,报名参赛后设计的。项目介绍OCR的实现是一个比较复杂的过程,先需要进行图像预处理,包括灰度化、二值化,倾斜检测与校正,行、字切分,平滑,规范化等;然后通过版...
2019-06-20 19:20:29
1651
原创 网络图像的文本行(列)识别
网络图像的文本行(列)识别0. 成员说明姓名学号分工职责完成情况2018510xxx2018xxxxxx2018xxxxxx2018xxxxxx1. 前期准备前期主要进行:账号申请md语法学习开发环境搭建git命令学习python语法学习开发环境搭建算法学习1.1 账号创建1.2 markdown语...
2019-06-19 21:02:11
910
2
原创 天池(新人赛)工业蒸汽预测
天池(新人赛)工业蒸汽预测学习使用交流借鉴参赛链接Windows1.下载Anaconda2.安装相应库:pip install Keras注意:python 依赖:- Keras - Numpy - Sklearn- Lightgbm- Pandas赛题背景火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产...
2019-06-19 16:43:29
1474
原创 网络图像的文本识别(阿里天池竞赛)
网络图片的文本识别的文档描述实验目的实验步骤tesseract.exe所在的文件路径获取图片中像素点数量最多的像素按照阈值进行二值化处理threshold: 像素阈值去掉二值化处理后的图片中的噪声点识别图片中的数字加字母传入参数为图片路径,返回结果为:识别结果实验目的本文将具体介绍如何利用Python的图像处理模块pillow和OCR模块pytesseract来识别平常生活中我们所见到的验证码...
2019-06-18 20:06:17
2914
原创 阿里天池新人赛——幸福感挖掘
本文简要介绍参加阿里天池新人赛——幸福感挖掘的相关思路整体思路1.分析问题,提出分析目的2.数据清洗、数据预处理及数据可视化3.数据分析4.建模计算5.分析结果及竞赛成绩1.分析问题,提出分析目的幸福感是一个古老而深刻的话题,是人类世代追求的方向。与幸福感相关的因素成千上万、因人而异,大如国计民生,小如路边烤红薯,都会对幸福感产生影响。在这些错综复杂的因素中,如何找到其中的共性,一...
2019-06-17 09:52:59
10189
3
原创 二分类算法比赛的文档描述
数据来源:选自UCI机器学习库中的「银行营销数据集(Bank Marketing Data Set)」算法完成目标: 这些数据与葡萄牙银行机构的营销活动相关。这些营销活动以电话为基础,一般,银行的客服人员需要联系客户至少一次,以此确认客户是否将认购该银行的产品(定期存款)。我们的目的是预测研究客户定期存款业务的概率,可能性。代码输出的示例:ID表示客户唯一标识,pred表示预测客户订...
2019-06-03 23:54:35
550
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人