
python技能
文章平均质量分 65
macb007
这个作者很懒,什么都没留下…
展开
-
【python技巧实用篇】python读写文件、jieba自定义字典
本篇文章的主旨已经在注释注明,改代码经过测试,可以直接使用,any question,tell me原创 2017-07-29 21:57:38 · 6771 阅读 · 0 评论 -
百度NLP词 语相似度接口Demo
def similirity(word1,word2): token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s" # 1.获取token api_key='hGs3TEt3sN3XcI3VyIAyuT原创 2018-01-10 12:47:48 · 3653 阅读 · 1 评论 -
闲聊机器人API实现
基于图灵机器人实现API实现def tulingChat(self,question): KEY = '8afba6fdc75544f0bebc465615da1e0b' # change to your API KEY url = 'http://www.tuling123.com/openapi/api' req_info = question.encode(原创 2018-01-10 13:33:59 · 4698 阅读 · 0 评论 -
【基础技能】pandas 操作csv方法 &&StratifiedShuffleSplit
#read CSV read_csv读取的数据类型为Dataframe# obj_2=pd.read_csv('f:/ceshi.csv',header=0,names=range(2,5))#表示文件第0行(即第一行,索引从0开始)为列索引,这样加names会替换原来的列索引。# header=None 原始文件数据没有列索引sample = pd.read_csv(file_dir +...原创 2018-02-09 09:50:41 · 743 阅读 · 0 评论 -
加载config文件方式
从开源项目学来的,config.ini[strings]# Mode : train, test, servemode = traintrain_enc = data/train.enctrain_dec = data/train.dectest_enc = data/test.enctest_dec = data/test.dec# folder where checkpoints...原创 2018-03-17 13:51:48 · 824 阅读 · 0 评论 -
MultiLSTM预测Mnist
#!/usr/bin/python3# -*-coding:utf-8 -*-# @Time :2018/3/14 # @Author :machuanbin"""tensorflow :1.3.0pandas: 0.19.2"""import tensorflow as tfimport osfrom tensorflow.examples.tutorials....原创 2018-03-14 11:22:59 · 973 阅读 · 2 评论 -
关于欠拟合和过拟合问题
在我们机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题,但是,一开始我们的模型往往是欠拟合的,也正是因为如此才有了优化的空间,我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了,这个问题也在学术界讨论的比较多。 首先就是我们在进行模型训练的时候会出现模型不能够很好地拟合数据的情况,这个时候就需要我们来判断究竟现...转载 2018-03-27 10:01:14 · 1653 阅读 · 0 评论 -
哈工大LTP部署及测试Demo
#coding: utf-8import osfrom pyltp import SentenceSplitterfrom pyltp import Segmentorfrom pyltp import Postaggerfrom pyltp import NamedEntityRecognizerfrom pyltp import Parserfrom pyltp import S原创 2017-12-07 09:13:17 · 3164 阅读 · 1 评论 -
【python爬虫】抓取炒股概念
非常感谢https://www.cnblogs.com/xin-xin/p/4297852.html。该系列讲解很详细。另附上我写的抓取炒股概念代码。采用火狐浏览器,F12,选取Network,解析一下传送的地址。import urllib.requestimport reimport requests# def main():# # url = "htt原创 2017-11-29 13:26:57 · 4919 阅读 · 0 评论 -
【python技能】词频统计
import jiebafrom astropy.table.np_utils import joinimport osimport sysimport jieba.posseg as psegdef main(): #分词结果存储列表 word_list = [] #词频统计词典{关键词:次数} word_dict = {} curren原创 2017-07-30 14:18:29 · 1095 阅读 · 1 评论 -
【技能篇】python读取文件、实体抽取
最近写了一个实体抽取,并且相应的实体填充预处理方案,代码如下(初步实现方案,后期会持续优化代码),完成所有功能会上传至Github上。import osimport gensimdef main(): word_list = ['平安银行', '000002', '测试', '买入'] #填充实体列表 entity_list = ['entity1原创 2017-07-28 21:07:27 · 3614 阅读 · 2 评论 -
【mark】pycharm及jieba安装说明
IDE: 建议到anaconda上安装pycharm。 window下安装jieba,需要在命令行模式下(windows+R),输入:cmd 然后 pip install jieba pip install gensim原创 2017-07-28 21:16:00 · 7874 阅读 · 2 评论 -
pandas读取csv文件
data目录下新建data2.csv。其中数据:测试1,A测试2,A测试3测试4测试5测试6测试7测试8代码:import pandas as pdstudent=pd.read_csv('./data/data2.csv', header=None)# print(student)for i in range(len(student[原创 2017-09-04 19:57:10 · 1697 阅读 · 0 评论 -
python词云生成
# encoding=utf-8"""词云"""import jieba.analysefrom PIL import Image, ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud, ImageColorGeneratorimport os#原创 2017-09-05 12:27:55 · 839 阅读 · 0 评论 -
智能纠错(N-gram、编辑距离、转化拼音)
from basicInfo import BasicInfoimport jiebafrom pypinyin import pinyin, lazy_pinyinfrom dataServer import DataServerclass ErrorRecovery(object): def __init__(self, dataSer):原创 2017-08-23 17:27:19 · 4870 阅读 · 1 评论 -
LSTM 实例
环境:python3.5,tensorflow1.1代码如下:import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data# set random seed for comparing the two result calculationstf.set_random_seed(原创 2017-09-06 08:20:17 · 1597 阅读 · 0 评论 -
python csv写入多列
import csvimport osdef main(): current_dir = os.path.abspath('.') file_name = os.path.join(current_dir, "csss.csv") csvfile = open(file_name, 'wt' ,encoding="UTF8") # writer=csv.原创 2017-09-08 12:32:40 · 21051 阅读 · 0 评论