
deep learning
激荡数十年
17年专职软件研发,喜欢使用的语言有:python, c, java, go
展开
-
2021-07-01 微信大数据竞赛源码(免费colab/GPU版本)
对github中的wechat_big_data_baseline_pytorch进行了修改,主要是整合了512个embded内容描述字段,可惜错过提交截止时间,看上去AUC结果还不错。第一次独立一人完成了整个大数据竞赛,特此纪念。 无embded数据预处理 # -*- coding: utf-8 -*- #准备数据,跑一次就好 import numpy as np import pandas as pd from tqdm import tqdm from google.colab impor.原创 2021-07-01 09:23:34 · 598 阅读 · 1 评论 -
MacBook Pro / OS X 10.10.3 (Yosemite) 编译caffe小记
就一个关键点:编译时c++标准库使用libstdc++,原因不解释了 caffe为git库中最新版本: git init git pull https://github.com/BVLC/caffe.git 其它按照官方安装提示做就行,我选用的搭配是官方推荐的anaconda python / Intel MKL / cuDNN, 有两个小处需要注意: opencv选用3.0.0:(原创 2015-07-24 09:07:09 · 1481 阅读 · 0 评论 -
用CatBoost做音素识别
1,下载TIMIT语料库,解压,全部目录,文件变小写,按照NLTK要求,修改所有根目录下的.txt配置文件 2,安装必要python库:nltk, librosa,numpy,catboost 3, 实现训练过程,原理:TIMIT中wav格式并非标准RIFF格式,好在格式简单,每个文件头占1024字节,文本格式,剩下的是pcm raw data,录制格式是单声道,16bit 16KHz,安装原创 2017-12-11 11:13:35 · 1720 阅读 · 0 评论