自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 猫狗图片识别

1、数据简介 这份数据集来源于Kaggle,原数据集有12500只猫和12500只狗,这里选取2000张图片,工具用的是基于tensorflow的keras。 2、数据预处理 import os # 处理字符串路径 import glob # 查找文件 from keras.models import Sequential # 导入Sequential模型 from keras.la...

2018-11-14 09:18:55 2795

原创 发票数据识别

import cv2 import math import numpy as np import matplotlib.pyplot as plt import skimage from PIL import Image from pytesseract import pytesseract from skimage import data,color,morphology,feature im...

2018-07-24 00:00:01 2924

原创 发票数据识别

import cv2 import math import numpy as np import matplotlib.pyplot as plt import skimage from PIL import Image from pytesseract import pytesseract from skimage import data,color,morphology,feature im...

2018-07-23 23:58:04 2981

原创 EM算法及其推广

1.EM算法每次迭代由两部组成:E步,求期望;M步,求极大 一般,用Y表示观测随机变量的数据,Z表示隐随机变量的数据。Y和Z连在一起称为完全数据,观测数据Y又称为不完全数据。假设给定观测数据Y,其概率分布为,其中是需要估计的模型参数,Y和Z的联合概率分布是 EM算法的一个重要应用是高斯混合模型的参数估计 2.高斯混合模型 3.

2017-12-12 15:34:02 266

原创 利用selenium进行爬虫

1.selenium之常用函数 可参考网站:http://blog.sina.com.cn/s/blog_b5fe6b270101caub.html 2.简单示例1 首先利用webdriver进行登录 # coding=utf-8 from __future__ import print_function from __future__ import print_function impo

2017-12-07 14:21:10 1233 1

原创 主题模型lda使用

import pymysql from sklearn.feature_extraction.text import TfidfVectorizer,CountVectorizer from sklearn.decomposition import LatentDirichletAllocation import jieba import lda import numpy as np def m

2017-12-06 20:21:23 1237 5

原创 关键词搜索版本2

# -*- coding: utf-8 -*- """ Created on Tue Oct 31 09:56:19 2017 @author: czw """ #导入包 import numpy as np import pandas as pd from sklearn.ensemble import RandomForestRegressor,BaggingRegressor from n

2017-10-31 14:12:41 406

原创 关键词搜索

本文是Kaggle 竞赛题 Home Depot Product Search Relevance ######加载包##### from sklearn.ensemble import RandomForestRegressor,BaggingRegressor import pandas as pd import numpy as np from nltk.stem.snowball i

2017-10-31 08:50:44 430

原创 利用每日新闻预测金融市场的变化_版本3

之前两个版本未使用word2vec,word2vec是自然语言处理的神器 接下来,看代码 import pandas as pd import numpy as np from sklearn.metrics import roc_auc_score from datetime import date import os 导入数据 #####导入数据###### os.chdir(r'D:/

2017-10-31 08:20:51 997

原创 每日新闻预测金融市场的变化_版本2

######加载包##### from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizer import pandas as pd import numpy as np from sklearn.svm import SVC from sklearn.metrics import roc_auc_score

2017-10-30 14:21:01 717

原创 每日新闻预测金融市场的变化_版本1

数据来源于国外的网站,类似于国内的贴吧网站 ###  RedditNews.csv: two columns The first column is the "date", and second column is the "news headlines". All news are ranked from top to bottom based on how hot they are. Hen

2017-10-30 13:33:22 964 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除