- 博客(11)
- 资源 (16)
- 收藏
- 关注
原创 0基础手把手DeepSeek安装教程!Windows安装Ollama和DeepSeek大模型以及AnythingLLM客户端
Windows安装ollama和deepseek大模型以及AnythingLLM客户端
2025-03-01 19:02:04
168
原创 跨境电商joom蓝海选品方法
joom是近些年发展起来的俄罗斯与欧洲的电商黑马,与wish类似,相对比较小众,新手朋友们可以尝试。在做跨境电商的时候,最难的就是选品,我应该批量上货还是只选某几个品?根据我的经验,我是在joom上看品类,然后其中选择单价高、评论数较多的产品链接,把他的评论都抓下来,根据评论日期,来推算某个产品的销量趋势情况,如果评论趋势逐渐增长,那就可以考虑卖这款产品。比如下面这款宠物产品,增长趋势是不错的,可以考虑进入这个市场:
2022-10-06 12:23:32
1811
原创 Python批量抓取swissadme数据——smiles
swissadme可以通过smiles单个查询,也可以批量查询,但是批量查询的时候,通过Excel下载需要全部都展开后下载才是全的数据,如果数据量非常大,比如1000个,那就很麻烦,这里可以通过Python写代码来批量抓取
2022-10-01 22:19:51
1986
15
原创 线性回归的四个假设 The Four Assumptions of Linear Regression
线性回归是一种常用的统计方法,我们可以用它来理解两个变量 x 和 y 之间的关系。但是,在进行线性回归之前,首先要确保满足四个假设:1.线性关系:自变量x和因变量y之间存在线性关系。2. 独立性:残差是独立的。特别是,时间序列数据中的连续残差之间没有相关性。3. 同方差性: 残差在 x 的每个水平上都有恒定的方差。4. 正态性:模型的残差呈正态分布。如果违反了这些假设中的一个或多个,那么我们的线性回归的结果可能不可靠甚至具有误导性。在这篇文章中,我们对每个假设进行了解释,如何确...
2021-11-28 17:23:00
13151
原创 怕扫描王泄露数据?5分钟自建一个文档扫描器。——基于opencv
背景最近滴滴事件闹得很大,数据安全性成了热门话题。前几天在使用扫描王扫描一个资料时,觉得文件使用这样的平台扫描非常不安全,所以打算自己弄一个这样的python程序来跑。参考了2个源代码,效果如下:看起来效果还不错,只是需要改进的还很多。# 安装# !pip3 install -i https://mirrors.aliyun.com/pypi/simple/ opencv-contrib-python# 只是包的函数直接拿出来,致谢# utlis.py# i...
2021-10-26 22:53:05
654
原创 Puchem化合物数据批量抓取采集_宝典_教程_Python爬虫
本文共计6500字,导出到PDF达42页(含代码)。从0教你如何抓取Pubchem化合物数据。1、 Pubchem介绍 Pubchem是美国国立卫生研究院(NIH)的开放式化学数据库,自2004年推出以来,pubchem已成为科学家、学生和公众的重要化学信息资源。其专门针对化学结构搜索,是网络药理学研究经常用到的数据库之一,不仅使用方便而且免费。 PubChem主要包含小分子,但也包含较大的分子,例如核苷酸,碳水化合物,脂质,肽和化学修饰的大分子。收集有关化学结构,标识符,化学和物理性..
2021-10-12 18:41:57
5243
原创 数据11212
抓取结果——供地结果页抓取结果——详情页(要的就是这个数据)1. 介绍 最近在用Python做中国土地市场网的供地数据批量下载,这个网站上包含的土地供给数据还是非常全面的,可按行政区域选择省份、市、县级,按土地用途选择,按供应方式选择,以及时间等。我们需要的信息主要是供地结果的详情页信息,如下:2. 抓取流程介绍 &
2021-10-01 09:38:31
1660
4
原创 使用Python爬虫批量抓取PubChem化合物信息
我本科是学生物工程的,研究生转到经济学,但是周围也有很多学生物和医学方面的朋友,经常帮他们抓取一些数据。最近帮他们抓取pubchem上的一些数据,pubchem是一个开放的数据库,爬起来难度不是很大,网上也有一个库叫pubchempy,之前也用来抓取过化合物的结构信息。今天主要是来看看如何通过网站的api来自定义抓取。首先打开网址:https://pubchem.ncbi.nlm.nih.gov/通过cid来搜索,输入9809进去之后获得这个地址:https://pubchem.ncbi.nlm.
2021-09-30 21:07:17
6850
2
原创 1小时搭建可视化数据分析平台redash
1小时搭建可视化数据分析平台redashBI这块选择其实挺多,比如Tableau,PowerBI,Superset,Metabase以及今天介绍的redash。Tableau比较贵,使用起来都是拖拽式,对于一个数据分析人员,写SQL是很多的,所以可以考虑superset vs. Metabase vs. redash,superset之前自己也搭建用过,Airbnb出品,美观,但是好像不太会用,Metabase没用过,PowerBI之前也了解过没深入研究,上一家公司使用的是redash,体验还不错,同时现
2021-09-28 00:16:45
1502
原创 5分钟学会Python爬虫神器autoscraper——自动化爬虫必备
怕扫描王泄露数据?5分钟自建一个文档扫描器!——基于opencv安装!pip3 install -i https://mirrors.aliyun.com/pypi/simple/ opencv-contrib-python只是包的函数直接拿出来,致谢utlis.pyimport utlisTO STACK ALL THE IMAGES IN ONE WINDOWimport utlis需要读取的图片pathImage = "1.jpg"pathImage = "page3.jpg"读取图片解决偏色问题i
2021-09-28 00:12:17
2459
10
天若OCR开源免费版本地版V5.0.0,PDF转文字
2022-03-06
Snipaste超级好用的截图软件MacOS适用
2022-03-06
Snipaste超级好用的截图软件windows7/10,64/32适用
2022-03-06
kaggle入门竞赛之泰坦尼克存活预测
2022-03-06
2022年最新。Python教程-100天从新手到大师
2022-03-06
Python3.9安装包下载,适用Macbook 10.9及以上系统。python-3.9.10-macosx10.9
2022-03-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人