
python
文章平均质量分 64
yeverwen
研究方向:数据挖掘、推荐系统、风控算法
展开
-
【bert实战】从0-1搭建bert环境
一文学会bert环境搭建原创 2024-12-26 10:08:03 · 410 阅读 · 0 评论 -
paddlenlp:社交网络中多模态虚假媒体内容核查(特征篇)
通过数据分析,我们发现了部分图片中存在文字且具有判断文本类别的作用。所以,本文采用paddleocr模型来提取图像中的文字特征。文本主要展现用什么方法来做数据特征加工。原创 2023-10-16 20:10:15 · 930 阅读 · 0 评论 -
十个排序算法的原理与实现【python版】
在算法面试时,一般都会被面试官三连问,"这算法的时间复杂度是怎样的?空间复杂度呢?它的稳定性如何?” ,为了能够清晰的作答该类问题,我梳理了基础的排序算法。原创 2022-01-12 15:07:38 · 392 阅读 · 0 评论 -
解决 No module named 'resource' 问题
最近在本地装了一个pyspark,在运行的过程中,总会遇到这样的报错。这是jupter notebook的cmd窗口。以下是我运行的一段代码stringJSONRDD = sc.parallelize((""" { "id": "123", "name": "Katie", "age": 19, "eyeColor":原创 2018-12-20 14:05:15 · 16687 阅读 · 10 评论 -
解决pyinstall打包python文件遇到的问题
1、环境说明 Windows7,Anconda+Python3.5.2,64位系统。2、开始安装pip install pyinstall安装成功,一切看起来很顺利,但实际上当你运行打包代码的时候,可能出现如下问题pyinstaller -F test.pyAttributeError: 'str' object has no attribute 'items'...原创 2019-06-19 08:52:08 · 4906 阅读 · 0 评论 -
【python基础篇】常用内置对象与操作
交互式编写代码:使用win+R调出“运行”对话框,输入cmd,再输入python即可进入“交互模式”IDE方式,我使用的是pycharm,在左下方,找到“python console”即可进入“交互模式”使用“print”打印一个字符串和一个整数>>> print 'Hello world!'Hello world!>>> print 2 ** 8256 ...原创 2018-07-05 00:28:11 · 354 阅读 · 0 评论 -
【python数据抓取技术与实战】爬虫基础
第一个爬虫应用该代码主要爬取电子工业出版社http://www.phei.com.cn首页的内容。#引入requests模块import requests#定义get_content函数def get_content(url): resp = requests.get(url) return resp.text#"__name__ == '__main__'"的作用是被...转载 2018-07-06 23:26:45 · 620 阅读 · 0 评论 -
【利用python进行数据分析】准备与实例(一)
我已经分享了本书的ipynb,所以跟着我一起来实验吧。如果你不懂怎么打开ipynb格式的文件,那也没关系,anaconda3让一切变得更简单(我像是打广告的)。安装玩anaconda之后,我们在开始里就可以找到它的文件夹,里面有一个Jupyter Notebook,就是它了。点开之后,弹出cmd的黑窗口,接着浏览器弹出网页,那么就启动成功了(这里别去关掉cmd的黑窗口,最小化就行),它的主页一般定...转载 2018-07-06 23:30:36 · 3207 阅读 · 0 评论 -
【利用python进行数据分析】准备与实例(二)
MovieLens 1M数据集GroupLens Research采集了一组从20世纪90年末到21世纪初由MovieLens用户提供的电影评分数据。MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。它分为三个表:评分、用户信息和电影信息。我们来试着读取数据,按性别计算每部电影的平均分:import pandas as pdencoding = 'lati...转载 2018-07-06 23:30:56 · 594 阅读 · 0 评论 -
【利用python进行数据分析】第4章numpy基础
Numpy的ndarray:一种多维数组对象NumPy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。你可以利用这种数组对整块数据执行一些数学运算。其语法跟标量元素之间的运算一样:from numpy.random import randndata=randn(2,3)print(data)print(data*10)print(da...转载 2018-07-28 09:26:02 · 631 阅读 · 0 评论 -
【利用python进行数据分析】第5章pandas入门
pandas的数据结构介绍要使用pandas,你首先就得熟悉它的两个主要数据结构:Series和DataFrame。虽然它们并不能解决所有的问题,但它们为大多数应用提供了一种可靠的、易于使用的基础。由于频繁的使用pandas、Series和DataFrame,所以我们将其引入本地命名空间中会更方便from pandas import Series, DataFrameimport pa...转载 2018-07-28 09:22:29 · 493 阅读 · 0 评论 -
【python入门篇】为什么选择python
1、选择python编程的主要原因:软件质量、开发者效率、程序的可移植性、标准库的支持、组件集成和享受乐趣2、python的创始人是谁:Guido van Rossum,龟叔3、python的哲学彩蛋:import this4、python可以拿来做什么:应用场景都实用,从网站和游戏开发到机器人和航天飞机控制例子:系统编程、GUI(用户图形接口)编程、Internet脚本、组件集成、数据库编程、快...原创 2018-07-05 00:18:27 · 235 阅读 · 0 评论