- 博客(11)
- 收藏
- 关注
原创 猫狗图片识别
1、数据简介这份数据集来源于Kaggle,原数据集有12500只猫和12500只狗,这里选取2000张图片,工具用的是基于tensorflow的keras。2、数据预处理import os # 处理字符串路径import glob # 查找文件from keras.models import Sequential # 导入Sequential模型from keras.la...
2018-11-14 09:18:55
2747
原创 发票数据识别
import cv2import mathimport numpy as npimport matplotlib.pyplot as pltimport skimagefrom PIL import Imagefrom pytesseract import pytesseractfrom skimage import data,color,morphology,featureim...
2018-07-24 00:00:01
2884
原创 发票数据识别
import cv2import mathimport numpy as npimport matplotlib.pyplot as pltimport skimagefrom PIL import Imagefrom pytesseract import pytesseractfrom skimage import data,color,morphology,featureim...
2018-07-23 23:58:04
2878
原创 EM算法及其推广
1.EM算法每次迭代由两部组成:E步,求期望;M步,求极大一般,用Y表示观测随机变量的数据,Z表示隐随机变量的数据。Y和Z连在一起称为完全数据,观测数据Y又称为不完全数据。假设给定观测数据Y,其概率分布为,其中是需要估计的模型参数,Y和Z的联合概率分布是EM算法的一个重要应用是高斯混合模型的参数估计2.高斯混合模型3.
2017-12-12 15:34:02
240
原创 利用selenium进行爬虫
1.selenium之常用函数可参考网站:http://blog.sina.com.cn/s/blog_b5fe6b270101caub.html2.简单示例1首先利用webdriver进行登录# coding=utf-8from __future__ import print_functionfrom __future__ import print_functionimpo
2017-12-07 14:21:10
1104
1
原创 主题模型lda使用
import pymysqlfrom sklearn.feature_extraction.text import TfidfVectorizer,CountVectorizerfrom sklearn.decomposition import LatentDirichletAllocationimport jiebaimport ldaimport numpy as npdef m
2017-12-06 20:21:23
1154
5
原创 关键词搜索版本2
# -*- coding: utf-8 -*-"""Created on Tue Oct 31 09:56:19 2017@author: czw"""#导入包import numpy as npimport pandas as pdfrom sklearn.ensemble import RandomForestRegressor,BaggingRegressorfrom n
2017-10-31 14:12:41
377
原创 关键词搜索
本文是Kaggle 竞赛题 Home Depot Product Search Relevance######加载包#####from sklearn.ensemble import RandomForestRegressor,BaggingRegressorimport pandas as pdimport numpy as npfrom nltk.stem.snowball i
2017-10-31 08:50:44
384
原创 利用每日新闻预测金融市场的变化_版本3
之前两个版本未使用word2vec,word2vec是自然语言处理的神器 接下来,看代码import pandas as pdimport numpy as npfrom sklearn.metrics import roc_auc_scorefrom datetime import dateimport os导入数据#####导入数据######os.chdir(r'D:/
2017-10-31 08:20:51
957
原创 每日新闻预测金融市场的变化_版本2
######加载包#####from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizerimport pandas as pdimport numpy as npfrom sklearn.svm import SVCfrom sklearn.metrics import roc_auc_score
2017-10-30 14:21:01
683
原创 每日新闻预测金融市场的变化_版本1
数据来源于国外的网站,类似于国内的贴吧网站### RedditNews.csv: two columns The first column is the "date", and second column is the "news headlines". All news are ranked from top to bottom based on how hot they are. Hen
2017-10-30 13:33:22
905
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人