- 博客(6)
- 收藏
- 关注
原创 pandas处理csv文件
import pandas as pdimport randomimport numpy as npfirst = pd.read_csv(r"/file",usecols=[1])first.drop_duplicates(inplace=True)#first = np.ndarray(first[:,0])#print(type(first))second = [random.randint(1,10) for i in range(0,1000000)]third = [rando
2020-06-18 22:02:34
218
原创 离散编码问题,LabelEncoder和OneHotEncoder
在id处理与nlp处理中,离散编码的处理比较重要。可以考虑用sklearn库LableEncoder,而涉及到01编码或多重属性编码时用OneHotEncoderimport pandas as pdfrom sklearn.preprocessing import LabelEncoderdata=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]})for i in data: try: data[i]=L
2020-05-23 18:29:09
282
原创 离散编码问题,LabelEncoder和OneHotEncoder
import pandas as pdfrom sklearn.preprocessing import LabelEncoderdata=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]})for i in data: try: data[i]=LabelEncoder().fit_transform(apply(int))#transform操作就是转为数字表示形式。 except:
2020-05-23 15:18:36
348
原创 编码问题
import jsonimport codecsd =dict(name=['书', '书包', '书本'], age=[20,77,9], score=[6,8,88])f =open('./sentence.txt', 'w')json.dump(d,f)f.close()g=open('./sentence.txt', 'rb')e=json.load(g)print(e)from gensim.models import Word2Vecwith codecs.open('./s
2020-05-23 09:47:30
231
原创 队列和栈分别的应用
栈:括号匹配、算符优先算法求表达式的值、表达式的括号匹配问题、迷宫求解、进制转换、计算器、深度优先的非递归遍历、子程序与函数的调用和返回、数字转字符,表达式求值、中断时数据保存和返回。队列:广度优先层次遍历、进程调度、用户文件访问...
2020-05-21 21:31:02
720
原创 pycharm debug
debug中step into、step out显示灰色的原因:①未断点过变量,无变量生成;②数据庞大,需要等待时间;③打开多个文件,需在某文件内部debug。
2020-05-21 13:30:11
391
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人