
python
文章平均质量分 82
coding_xian
这个作者很懒,什么都没留下…
展开
-
PySpark(2)创建RDD
1.什么是RDD-弹性分布式数据集?RDD(弹性分布式数据集)是PySpark的基本构建块,它是容错的,不可变的对象分布式集合。不变的含义一旦创建了RDD,就无法更改。 RDD中的每个记录都分为逻辑分区,可以在群集的不同节点上进行计算。换句话说,RDD是类似于Python中列表的对象的集合,区别在于RDD是在分散在多个物理服务器(也称为集群中的节点)上的多个进程上计算的,而Python集合仅在一个进程中存在和处理。此外,RDD提供数据的分区和分布的数据抽象,这些数据旨在在多个节点上并行运行计算,而在原创 2021-02-18 17:18:16 · 916 阅读 · 0 评论 -
pip安装tensorflow-gpu;keras
1.tensorflow-gpu对应的cuda;dudnn版本:查询地址:https://tensorflow.google.cn/install/source_windows如python3.8可以安装:pip install tensorflow-gpu==2.3.02.cuda配置:cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive可参考:https://www.cnblogs.com/fanfzj/p/85217原创 2020-11-03 21:11:22 · 316 阅读 · 0 评论 -
python之numpy模块的使用(3)典型案例
1、创建bool布尔数组# 创建布尔数组;所有值为Truearr_bool = np.full([3, 3], True, dtype=bool)print(arr_bool)arr_bool2 = np.ones([3, 4], dtype=bool)print(arr_bool2)# 拓展: where函数的两个参数arr = np.arange(10)print(np.w...转载 2019-09-20 16:22:01 · 3948 阅读 · 1 评论 -
python之numpy模块的使用(2)
as转载 2019-09-20 12:14:47 · 325 阅读 · 0 评论 -
python之numpy模块的使用(1)
1、创建一维数组(1)普通创建一维数组# 可以将任意类型的序列(列表、元组、字典、集合、字符串)传递给np.array()a1 = np.array([1, 2, 3, 4]) # 传递列表a2 = np.array((1, 2, 3, 4)) # 传递元组a3 = np.array({'a': 'A'}) # 传递字典(无用)a4 = np.array('12314') # ...转载 2019-09-18 11:09:05 · 569 阅读 · 0 评论 -
unicode字符转成中文显示
a = '\u8fd9\u4e09\u4e2a\u5b69\u5b50\u90fd\u6b20\u6536\u62fe\uff0c\u4e0d\u4f1a\u505a\u4eba\u3002","abstract:'#方法1:使用evalb = eval("u"+"\'"+a+"\'")print(b)#方法2:使用decode将a解码 即解码成对应的汉字 但是abstract不是u...原创 2019-08-15 16:46:38 · 3424 阅读 · 0 评论 -
python实现逻辑回归算法
前言:在实现线性回归的基础上,继续推出逻辑回归的算法实现;本节将对比线性回归,说明逻辑回归的原理。1、原理注:逻辑回归,属于二分类问题,是分类算法,预测的是离散值;不是回归算法2、实现数据准备:https://blog.youkuaiyun.com/Carl_changxin/article/details/100857456代码:# 逻辑回归python...原创 2019-09-21 10:35:54 · 5259 阅读 · 5 评论 -
python实现逻辑回归数据
-0.017612 14.053064 0-1.395634 4.662541 1-0.752157 6.538620 0-1.322371 7.152853 00.423363 11.054677 00.406704 7.067335 10.667394 12.741452 0-2.460150 6.866805 10.569411 9.548755 0-0.026632 ...原创 2019-09-15 16:38:53 · 1613 阅读 · 1 评论 -
python实现线性回归的数据
单变量6.1101,17.5925.5277,9.13028.5186,13.6627.0032,11.8545.8598,6.82338.3829,11.8867.4764,4.34838.5781,126.4862,6.59875.0546,3.81665.7107,3.252214.164,15.5055.734,3.15518.4084,7.22585....原创 2019-09-14 12:23:16 · 1038 阅读 · 1 评论 -
python实现线性回归算法
前言:学习了吴恩达机器学习线性回归部分内容后,再结合很多优秀博客总结,搬运出来的干货。1、原理2、单变量线性回归数据准备:https://blog.youkuaiyun.com/Carl_changxin/article/details/100824723,第一列当作人口Population,第二列当作收益Profite实现技术:梯度下降实现目标:(1...原创 2019-09-14 12:26:37 · 2864 阅读 · 2 评论 -
python实现网络爬虫简述
1、网络爬虫分类(1)通用网络爬虫(又叫全网爬虫)特点是爬取范围和数量巨大,要求爬取速度和存储空间较高;在爬取页面的顺序要求较低,由于待刷新的页面太多,采用并行工作方式,需要较长时间才能刷新一次页面。这种爬虫主要应用于大型搜索引擎中。(2)聚焦网络爬虫(又叫主题网络爬虫)按照预先定义好的主题,有选择地进行相关网页的爬取。与通用相比,它不会将目标资源定位在整个互联网当中,而是将爬取...原创 2019-09-07 10:26:23 · 802 阅读 · 0 评论 -
python实现web项目的两个框架Flask和Django概述
可参考:https://www.cnblogs.com/tqtl911/p/9686998.html常用的Web框架有4个,各有优劣,使用时需要根据自身的应用场景选择合适的Web框架。1、Flask2、Django3、Bottle4、Tornado...原创 2019-09-07 10:25:19 · 321 阅读 · 0 评论 -
python中常用函数(2)
1、正则表达式(1)正则表达式的书写https://www.cnblogs.com/zery/p/3438845.html(2)使用re模块中的函数匹配正则表达式1、re.match(pattern,string,[flags]) 其中flags用于控制匹配方式;常用标志如下: re.A 对\w、\W、\b、\B、\d、\D、\s和\S只进行ASCII匹配...原创 2019-09-05 20:33:38 · 217 阅读 · 0 评论 -
python中常用函数(1)
目录1、输出和输入函数2、常用的类型转换函数3、序列中的常用函数4、列表中的常用函数5、元组中的常用函数6、字符串中的常用函数7、字典中的常用函数8、集合中的常用函数9、列表、元组、字典和集合的区别1、输出和输入函数python的内置函数print()input()2、常用的类型转换函数int(x)float(x)st...原创 2019-09-04 14:20:08 · 651 阅读 · 0 评论 -
python模块pandas的常用方法
1、基本数据集操作(1)读取 CSV 格式的数据集pd.DataFrame.from_csv(“csv_file”)或者:pd.read_csv(“csv_file”)(2)读取 Excel 数据集pd.read_excel("excel_file")(3)将 DataFrame 直接写入 CSV 文件如下采用逗号作为分隔符,且不带索引:df.to_csv("data....转载 2019-09-26 16:46:43 · 611 阅读 · 0 评论