
Python语言
小木偶-嗯嗯
追求在“数据挖掘/自然语言处理”上的卓越,争取挤进小牛的行列,哈哈~~
展开
-
Python语言解决用户评论标签匹配
我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述原创 2014-11-12 14:06:17 · 2023 阅读 · 0 评论 -
python3实现多页excel转csv
# -*- coding: utf-8 -*-import pandas as pdpath = 'd:/file/线上流量包产品用户订购明细表.xls'tdir = "D:/file/liuliangbao/"xl = pd.ExcelFile(path)header = ["地市","订购状态","订购渠道","用户号码","订购号码套餐","订购时间&quo原创 2019-01-07 10:14:32 · 1395 阅读 · 0 评论 -
TensorFlow多元回归预测房子滞留天数
# -*- coding: utf-8 -*-import pandas as pdimport numpy as npimport statsmodels.formula.api as smfimport tensorflow as tfimport matplotlib.pyplot as plthouse_data = pd.read_csv('F:\lcl\data1.cs...原创 2018-06-25 14:50:01 · 699 阅读 · 0 评论 -
TensorFlow多元回归预测房子信息
# -*- coding: utf-8 -*-import pandas as pdimport numpy as npimport statsmodels.formula.api as smfimport tensorflow as tfimport matplotlib.pyplot as plthouse_data = pd.read_csv('F:\lcl\data.csv...原创 2018-06-25 14:48:29 · 1980 阅读 · 2 评论 -
python操作MySQL数据库
坚持每天学一点,每天积累一点点,作为自己每天的业余收获,这个文章是我在吃饭的期间写的,利用自己零散的时间学了一下python操作MYSQL,所以整理一下。我采用的是MySQLdb操作的MYSQL数据库。先来一个简单的例子吧:import MySQLdb try: conn=MySQLdb.connect(host='localhost',user='root',passwd转载 2018-01-05 14:28:28 · 298 阅读 · 0 评论 -
python分布式错误解决
利用python进行MapReduce时,可能会遇到报如下错误:java.io.IOException: Cannot run program “e_mapper.py”: error=2, No such file or directory解决办法是用如下命令运行mapper.py和reducer.py:hadoop jar /home/hdfs/project/hadoop-2.6.1/cont原创 2017-10-24 14:38:19 · 868 阅读 · 1 评论 -
Linux下python升级至2.7步骤
先下载源tar包 可利用Linux自带下载工具wget下载,如下所示:1# wget http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgz 下载完成后到下载目录下,解压1tar -zxvf Python-2.7.转载 2017-08-31 09:18:27 · 329 阅读 · 2 评论 -
读取文件夹下的所有文件
1、python读取文件夹下的所有文本inputpath="C:/Users/Administrator/Desktop/feature/feature"outpath="C:/Users/Administrator/Desktop/RBF"for filename in os.listdir('C:/Users/Administrator/Desktop/feature/featur原创 2015-04-08 09:07:31 · 1025 阅读 · 0 评论 -
Java直接调用Python
使用Runtime.getRuntime()执行脚本文件,这种方式和.net下面调用cmd执行命令的方式类似。如果执行的python脚本有引用第三方包的,建议使用此种方式。Process proc = Runtime.getRuntime().exec("python D:\\demo.py"); proc.waitFor(); Java调用代码:import java转载 2015-04-07 16:38:27 · 6290 阅读 · 3 评论 -
scikit-learn使用joblib持久化模型过程中的问题详解
在机器学习过程中,一般用来训练模型的过程比较长,所以我们一般会将训练的模型进行保存(持久化),然后进行评估,预测等等,这样便可以节省大量的时间。在模型持久化过程中,我们使用scikit-learn提供的joblib.dump()方法,但是在使用过程中会出现很多问题。如我们使用如下语句:[python] view plaincopy转载 2015-04-02 08:33:52 · 5919 阅读 · 0 评论 -
python sklearn机器学习库 安装
1、准备工作安装sklearn之前,我们需要先安装numpy,scipy函数库。Numpy下载地址:http://sourceforge.net/projects/numpy/files/NumPyScipy下载地址:http://sourceforge.net/projects/scipy/files/Scipy下载对应本机的python版本。2、安装sklearn机器学习库原创 2015-01-07 11:36:16 · 94262 阅读 · 9 评论 -
python ——编码问题
报错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-15: ordinal not in range(128)或者UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in r转载 2014-11-23 20:54:05 · 1068 阅读 · 0 评论 -
python脚本——re.match()和re.research()方法总结
刚完成公司安排的小任务,写个小笔记记录下。原创 2014-10-28 11:24:00 · 41204 阅读 · 0 评论 -
(转载)使用 Hyperopt 进行参数调优(译)
文章地址:https://www.jianshu.com/p/35eed1567463转载 2019-04-19 13:33:41 · 622 阅读 · 0 评论