- 博客(19)
- 资源 (1)
- 收藏
- 关注
原创 开发-python符号计算
python符号计算# # 需要两个映射对x1 = 1.23y1 = 4.56x2 = 0.34586196581172324y2 = -2.6774569407134363x3 = 0.12y3 = 6.123x4 = 1.6413879324508256y4 = -4.0904967383708914# 需要两个映射对# x1 = Symbol('x1')# y1 = Symbol('y1')# x2 = Symbol('x2')# y2 = Symbol('y2')# x
2022-04-16 03:24:46
549
翻译 开发-计算几何常见操作
开发-计算几何常见操作计算几何常用的库shapelygeopandaspygeos常见的代码# 系统/文件import osfrom collections import defaultdictimport heapqimport math# 基础import numpy as npimport pandas as pdimport ezdxfimport heapdict# 计算几何相关的库import pygeosimport shapelyfrom shape
2022-04-11 00:54:07
254
原创 配置-Postgresql+Postgis安装+Django连接测试
配置-Centos7安装PostgreSQL 14.2+Postgiscentos7.9起开桌面root登录vi /etc/gdm/custom.conf[daemon]AutomaticLoginEnable=TrueAutomaticLogin=root----------------------------------------------------------------------------------centos7 yum切换清华源sudo sed -e 's|^mirro
2022-04-05 00:55:31
972
原创 算法-NLP常见任务集锦含transformer任务Bert源码文本分类命名实体识别...
nlp常见任务代码总结本文的目的在于梳理NLP企业级的应用任务,根据jd判断当前主流的NLP在企业中的应用水平,熟悉常见的任务+技术+数据+评价方式。一、nlp常见任务综述信息抽取:从给定文本中抽取重要的信息,比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。文本生成:机器像人一样使用自然语言进行表达和写作。依据输入的不同,文本生成技术主要包括数据到文本生成和文本到文本生成。数据到文本生成是指将包含键
2022-03-07 23:37:03
1144
原创 算法-bert源码调试环境搭建
代码调试环境搭建windows环境搭建python环境搭建conda 源配置# 生成.condarc配置文件conda config --set show_channel_urls yes# 在~/.condarc中添加清华源channels:defaultsshow_channel_urls: truedefault_channels:https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/mainhttps://mirro
2022-03-07 20:24:07
1043
原创 算法-基于transformers/中文bert的分类fine-turing
算法-基于bert-base-chinese的中文信息安全分类竞赛实现文章目录算法-基于bert-base-chinese的中文信息安全分类竞赛实现前言一、win10 训练环境配置二、使用步骤1.引入库2.读入数据总结前言学习了nlp一段时间,了解nlp的任务和技术体系,需要写代码练习下常见的nlp任务。找到最为基础分类任务。比赛名称是:面向数据安全治理的数据内容智能发现与分级分类一、win10 训练环境配置cuda / cudnn / pytorch 的版本选择版本二、使用步骤1
2022-02-24 00:16:46
1316
原创 算法-论文阅读-一文读懂nlp论文含word2vec词向量transformer语言模型...
算法-transformer入门transformer三个种类
2022-01-14 10:14:57
460
原创 实践-机器学习任务
机器学习任务方法论理解机器学习和深度学习框架中的核心功能点根据问题找到对应的数据集2.读入数据总结方法论理解机器学习和深度学习框架中的核心功能点例如:sklearn学习路线:理解分类、聚类、降维、回归的思维;熟悉决策树、高斯混合模型、支持向量机等常见的方法;熟悉特征工程及特征选择、模型的评价、集成学习;理解数据预处理方法。例如:pytorch学习路线理解pytorch中深度学习的一般流程;熟悉CNN、RNN、GNN、Transformer实现一般流程;熟悉训练/测试的理论;熟悉根据
2021-12-25 15:47:04
621
原创 数据-计算框架数据集
数据-计算框架数据集sklearn.datasetstorchvision.datasetskeras.datasetssklearn.datasetssklearn.datasets1sklearn.datasets2sklearn.datasets3torchvision.datasetstorchvision.datasets1torchvision.datasets2torchvision.datasets3keras.datasetskeras.datatsets...
2021-12-25 15:16:49
243
原创 数据-pandas cheatsheet
数据-pandas cheatsheet数据-pandas cheatsheet数据-pandas cheatsheetpandas常见操作链接:pandas分组统计pandas筛选
2021-12-18 18:02:28
802
原创 算法-lightgbm cheatsheet
算法-lightgbm实践算法-lightgbm实践API及使用算法-lightgbm实践最近,工作中使用到了lightgbm作为二分类器,需要进一步学习该算法的各类知识,本文用于记录lightgbm使用过程中的知识点和问题。API及使用经过查阅lightgbm有两套API,lightGBM主要分为:原生接口,scikit-learn接口。除去传参与调包格式不一样,后者的save与load需要用sklearn来完成。区别...
2021-12-18 17:00:44
292
原创 配置-jupyter notebook快速配置
配置-jupyter notebook快速配置安装必要的插件pip3 install yapfpip install autopep8 --userpip3 install jedi==0.17.2生成密码from notebook.auth import passwdpasswd()xxx12345+'argon2:$argon2id$v=19$m=10240,t=10,p=8$U4zUU7WDdXK1GAiqZHiBKw$/uIJNKuzQbJx6kxZLJD53A'生成配置文件
2021-12-07 15:57:15
829
原创 配置-samba服务器文件共享配置
samba服务使用教程samba简介Samba是linux和unix系统上实现SMB/CIFS协议的一个免费软件,由服务器和客户端程序构成。而SMB是局域网支持共享文件和打印机的一种通信协议,为局域网内不同计算机之间提供文件及打印机等资源的共享服务 ,最初SMB主要是作为Microsoft的网络通讯协议,后来一个名叫Andrew Tridgwell 的大学生将SMB通信协议应用到了Linux系统上,就形成了现在的Samba软件。后来微软又把 SMB 改名为 CIFS(Common Internet Fi
2021-06-17 19:37:38
414
原创 脚本-Linux常用命令和常用Shell脚本
Linux工具的使用find ./ -name '*.mp4' | cut -d '/' -f3 | sort
2020-12-16 10:37:32
166
原创 配置-Linux挂在远程磁盘
磁盘端yum -y install nfs*rpm -qa |grep nfsrpm -qa |grep rpcbind开机启动systemctl start nfssystemctl start rpcbindsystemctl enable nfssystemclt enable rpcbindshowmount -e localhost数据端mkdir /mnt/nfs01vim /etc/exports/mnt/nfs01 10.10.10.0/24 (rw,no_root
2020-06-19 21:18:07
287
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人