- 博客(267)
- 资源 (2)
- 收藏
- 关注

原创 【python】pandas
一边删除一边遍历,需要删除后重新建立索引wea= pd.read_csv(path) for i in range(wea.shape[0]): datee = str(wea.loc[i,'date']) #读取某一列 if():#满足某个条件 wea.drop(wea.index[i],inplace=True) wea = wea.re...
2019-11-10 13:21:06
556
1
转载 【B站自学】page rank
Link as vote: 重点是投票总数目(一共多少人,每个人手里多少票)怎么衡量别人是否是大佬呢?2.越是大佬引用我说明我重要。1.引用我的人越多越重要。
2024-11-04 22:19:26
137
原创 encoder-decoder
在解码器中,自注意力层只允许关注输出序列中较早的位置。-inf这是通过在自注意力计算中的 softmax 步骤之前屏蔽未来位置(将它们设置为 )来完成的。“编码器-解码器注意力”层的工作方式与多头自注意力类似,只不过它从其下面的层创建查询矩阵,并从编码器堆栈的输出中获取键和值矩阵。文章写的非常好:http://jalammar.github.io/illustrated-transformer/
2023-08-14 19:32:32
380
转载 Bert/Transformer模型的参数大小计算
https://blog.youkuaiyun.com/weixin_43922901/article/details/102602557?spm=1001.2101.3001.6650.12&utm_medium=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-12-102602557-blog-126405946.pc_relevant_multi_platform_whitelistv4&depth_1-utm_source=distribute
2023-05-16 16:36:15
257
原创 chatgpt优化小红书文案
起因是拍一个背影过了大概得5分钟,然后一张照片都没拍,而我摆pose,僵硬的纯站了5分钟,不知道是不是因为工作养成的坏习惯,我非常不喜欢那种压迫感,因为后面有太多人在排队,而我喜欢速战速决,然后给别人让位。但我又不甘心排了那么久的队进来,一张照都没有,我说我自己去自拍,晾了她大概10-20分钟,我自己挤进去自拍了。没管理好自己的情绪,我很后悔,希望下次我能够管理好自己。总结[斜眼R]:这是我人生第3次去南方旅行,五一这个时间没有非常热,也不潮湿,还是蛮好的,长沙和张家界都非常值得一去噢!
2023-05-14 20:30:26
532
原创 原封不动-做个chatGPT的搬运工
跨平台:C++ 具有很高的跨平台能力,可以在多个操作系统和硬件平台上编译和运行。底层控制:C++ 给予了程序员很高的底层控制,便于构建高效的底层系统。并发支持:Go 提供了方便的并发模型,便于构建高效的多任务系统。垃圾回收:Go 实现了垃圾回收,使得程序员不需要手动管理内存。高性能:C++ 编译后的代码具有高性能,适用于资源密集型应用。大量第三方库:C++ 社区拥有大量第三方库,涵盖了各种领域。高效编译:Go 编译代码速度快,链接速度快。简洁易学:Go 语法简单,易于学习。
2023-02-07 14:17:11
207
原创 【python】实用tools
json解析变 if else高手import jsonfrom urlparse import *# 词典获取value值需要判断key是否存在,于是慢慢变成 if else高手了# dict 本身有个get函数,可以不用判断,直接获取,如果没有key, 获取的就是默认值# 获取 key = realtitle 的值,如果没有就设为默认值 realtitlereal_title = ana.get('page_element', {}).get('realtitle', "realtitle"
2021-07-25 19:00:19
296
原创 linux python matplotlib.font_manager 中文显示问题
https://zhuanlan.zhihu.com/p/81262346
2021-03-26 19:35:12
446
转载 tokenization方法总结
文章目录基于字粒度和词粒度的BERT,效果哪个好词粒度字粒度Subword粒度-Transformer如何获得un-friend-ly而不是unfr-ien-dlyBPE(Byte Pair Encoding)基于字粒度和词粒度的BERT,效果哪个好词粒度常用一些工具来完成,例如英文的NLTK、SpaCy,中文的jieba、LTP等。英文: live in New York ------> live / in / New York /中文: 在纽约生活 -----> 在 / 纽约 /
2021-02-19 14:59:53
1096
原创 【python】collections
from collections import namedtupledef csv_reader(fd, delimiter='\t'): def gen(): for i in fd: yield i.rstrip('\n').split(delimiter) return gen()def read_tsv(input_file, quotechar=None): with open(input_file, 'r', encoding
2021-02-19 13:24:33
215
1
原创 【python】itertools
groupby以为只有pandas有groupby,没想到python自带groupby,两个的不同点在于自带版本只能聚合相邻相同key,pandas的聚合没有相邻这个限制# -*-coding:utf-8-*-import sysreload(sys)sys.setdefaultencoding('utf-8') import osimport refrom itertools import groupby def group_pattern(line): return line
2021-02-19 11:27:20
191
原创 linux-shell 脚本
HOSTNAME=`hostname`INDEX="template"GSMSERVER=emp01.baidu.comGSMPORT=15001EMAIL_LIST="yangmin11@baidu.com"function CAT_EMAIL_LIST() { # 按EMAIL_LIST列表发送邮件 ELIST="" for i in $* do if [ -z $ELIST ]; then ELIST=$i el
2021-01-19 16:00:05
441
1
原创 【slam-2020-01-02】扩展应用
VR、ARVR\AR和slam的结合,主要是需要slam进行投影定位,让他们不会发生不必要的晃动,更进一步,需要在现实生活中实现叠加定位,比如藏在真实的桌子后面, 才能更有真实感,也才能让看的人不出戏。SLAM目前最先进的开源方案,feature-based 的ORBSLAM作者Raul Mur-Artal,还是直接法DSO作者Jakob Engel以及其他一些SLAM方向重要实验室的毕业生很...
2020-06-29 11:24:03
637
3
原创 六个人传一个球,每两个人之间最多传一次,最多进行多少次传球
题目如标题小学三年级ACM-ICPC考前辅导班?不知真假10秒出答案,5+4+3+2+1 = 15次,答案错,重读题目,再来背景:传球,球传到哪就是哪,不可回头限制:每两个人之间务必只能传一次类似一笔画问题(5 x 2 + 4 x 4)/ 2 = 13次除了两个灰色的点有5条线,剩余点只有4条线,除2因为是无向图,而每条边被计算了两次。继续找规律,题目描述为“n个人”呢考虑n分奇数和偶数本题是偶数,规律总结为2(n−1)+(n−2)22\frac{2(n-1) + (n-2
2020-06-02 10:54:37
2909
原创 Tensorflow-GPU版本需要的CUDA版本以及Cudnn的对应关系
具体环境配置可参考:配置深度学习环境ubuntu16.10 + cuda9.2 + cudnn 7 + tensorflow-gpu以下表格更新可参考官网here或者官网there版本Python 版本编译器构建工具cuDNNCUDAtensorflow-2.1.02.7、3.5-3.7GCC 7.3.1Bazel 0.27.17.6 10.1ten...
2020-04-10 16:14:40
3005
1
转载 【linux】查找文件
locate查找所有位置中 文件名中包含XX的文件whereis用于程序名的搜索,搜索结果只限于二进制文件(参数-b)、man说明文件(参数-m)和源代码文件(参数-s),如果省略参数,则返回所有信息which在环境变量$PATH设置的目录里查找符合条件的文件,所以基本的功能是寻找可执行文件。find / -name +文件名在指定的目录下遍历...
2020-02-15 17:12:41
215
转载 【linux-deepin-wine】体验linux下的windows版微信、QQ、TIM、迅雷
截图全家福安装第1步,安装deepin-wine环境https://github.com/wszqkzqk/deepin-wine-ubuntu页面下载zip包(或用git方式克隆,可能会很慢,源码下载参考介个,下载嗖嗖嗖),解压到本地文件夹,在文件夹中打开终端,输入sudo sh ./install.sh一键安装。第2步,安装相关应用容器在http://mirrors.aliyun....
2020-02-06 12:03:12
1202
原创 【dell安装win10+ubuntu16 双系统】引导硬核修复
计算机硬件型号Dell G3256G SSD+1T HDDCPU i5-8500显卡 NVIDIA 1060Ti安装背景本来电脑是双系统,但是很久没用,ubuntu启动项很早就消失了,当时修复没成功,之后也没管。现在重新需要双系统了,所以重新开始修复安装。UEFI启动这是最新的启动方式,而目前安装的时候出bug的也是因为这种方式...
2020-02-04 13:42:41
5165
4
原创 【VS2019安装】解决问题:准备就绪之后出现闪退,安装无法开始
答案参考:微软VS官网进C盘,在安装目录下,找到两个exe文件,一个是setup.exe,一个是vs_installer.exe,然后右键属性,修改他们的兼容性,改为使用兼容版本安装。...
2020-01-15 11:36:13
3500
1
转载 内网穿透,公司连接校园服务器
https://blog.youkuaiyun.com/weixin_41549915/article/details/95832323
2020-01-13 11:43:20
610
原创 【python】随机数
目前用到啥,整理啥随机打乱样本数据linuxpandas'''frac指的是返回的样本,如果需要30%的数据,那么可以设置参数为0.3df.sample(frac=1).reset_index(drop=True) 随机生成无重复数据'''list中取出5个样本import randomlist = []sap = random.sample(list, 5)...
2019-12-16 22:21:07
372
原创 【python-bug】日期正则表达式 unbalanced parenthesis at position 64
# 正则表达式import repattern = re.compile(r"^((19[2-9]\d{1})|(20((0?[0-9])|(1?[0-8]))))\ ((0?[1-9])|(1?[0-2]))\ ((0?[1-9])|([1-2][0-9])|30|31)$")pattern.findall("1989 01 08")pattern = re.compile(r"^((1...
2019-12-12 16:57:01
2307
原创 【python】文件操作---读写创建
文件是否存在、不存在创建if(os.path.exists("lstm_res.txt") is False): fp = open("./lstm_res.txt",'x') 读取文件夹下的所有文件
2019-12-10 23:46:58
222
原创 中文分词模型-pkuseg-jieba-thulac对比
下载了4个模型,官网也有其他的模型可参考。看下模型结果对比:import pkusegs = "小米粒儿"seg = pkuseg.pkuseg(model_name='./web')text = seg.cut(s)print(text)'''['小米', '粒儿']'''import pkusegs = "小米粒儿"seg = pkuseg.pkuseg(model_na...
2019-12-06 14:03:19
2058
原创 记录tensorflow大坑之迷惑操作
1、TensorFlow 1.13.1: ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory #26209参考:https://github.com/tensorflow/tensorflow/issues/26182#issuecomment-468882301和h...
2019-12-01 16:54:53
258
转载 查看tensorflow是GPU版还是CPU版
import numpyimport tensorflow as tfa = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')c = tf.matmul(a, b)...
2019-12-01 15:22:48
1070
原创 【python】堆heap
记录序列的前5大import heapqlist_o = [1,6,4,9,10,8,4]list_s = []for num in list_o: heapq.heappush(list_s, num) if(len(list_s) > 5): heapq.heappop(list_s)print(list_s)...
2019-11-25 16:52:07
295
原创 【ssh连接3分钟热度】每次连接不超过3分钟就自己断开,再次连接显示服务器秘钥已改变
本地windows登录服务器A不超过3分钟之后,每次都报错@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@...
2019-11-24 22:50:07
560
转载 【python】Dask并行
背景双重for循环,40000 * 40000的时间复杂度,其中不涉及改值,只是读取,而且计算之后需要保留top5大值,符合并行原则。for i in n: for j in m:其实i和j的计算不冲突,i和0-m进行计算,i+1值分别和0-m计算,不必排序计算,可以多进程。...
2019-11-23 22:58:04
2355
原创 mysql存入json数据
import pymysqlimport pandas as pdimport csvdef connectdb(): print('连接到mysql服务器...') # 打开数据库连接 # 用户名:hp, 密码:Hp12345.,用户名和密码需要改成你自己的mysql用户名和密码,并且要创建数据库TESTDB,并在TESTDB数据库中创建好表Student ...
2019-11-14 22:43:34
1049
原创 业界大神篇
1.杰少的南大研究生三年总结2.王赟 Maigo的我的八年博士生涯-CMU王赟写在入职Facebook之前3.李沐的博士这五年4.田渊栋的博士五年总结
2019-11-12 13:50:45
531
原创 【leetcode】字符串匹配
KMP算法https://leetcode-cn.com/problems/implement-strstr/submissions/返回p中匹配s的子串的起始位置def KMP(pattern): M = len(pattern) dp = [[0 for i in range(26)] for j in range(M)] dp[0][ord(patter...
2019-10-28 22:43:50
369
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人