- 博客(20)
- 资源 (1)
- 收藏
- 关注
原创 工作学习 Git知识点
右击下面那个版本,选择 Reset Current Branch to here,点击Mixed,Reset。如果在提代码的时候push发现行数超过了1000行,或者有其他的问题不想push了,可以先回到之前的分支。稍等一会儿就会把push的反到本地,stash pop以后 git add . 加上所有的文件。最后再拉一下主代码就可以正常重新提交了push的时候用push -f。先Git stash 保存当前的改变。在Git(下图)中找到想退回到的版本。
2023-11-15 15:08:39
75
原创 jd记录 01
6、熟悉 Spark技术栈, 包括RDD和DataFrame的使用,能够使用SparkCore结合SparkSQL 进行数据的统计和计算,以支持大规数据处理和分析任务;10、熟练使用Pycharm, DataGrip,MobaXterm, Git等大数据相关工具,能够高效地进行开发、调试和管理大数据项目;9、熟练使用消息队列工具Kafka、日志数据采集工具 Flume、纯内存计算引擎 Presto;5、熟悉Hive数仓,熟练使用HiveSQL,能够针对不同的应用场景进行Hive优化;
2023-11-14 10:02:48
80
原创 学习记录 nlp学习02
LSTM也属于RNN中的一种,所以输入的数据跟前面的一样,时序或者序列数据。最重要的是有一个传输带向量C,过去的信息可以通过传输带向量送到下一个时刻,并且不会发生太大的变化。是可以处理序列或者是时序数据,每个最后输出的h都包含了t时刻前的所有输入信息,但是局限性就在与管理长序列的能力有限。1.梯度爆炸和消失:因为过长,在反向传播的时候,越靠近顶层梯度越小,会导致速度变慢,甚至停止学习。三个参数,batch_size(batch数据),timesteps(序列长度),词向量维度(输出的维度)
2023-11-14 09:56:00
56
原创 笔试记录 01
这个查询使用了LEFT JOIN操作,它返回所有左表(在这里是表a)的行,以及与右表(在这里是表b)匹配的行。如果n等于1或2,函数返回1;否则,函数先计算前n-1位的和,根据位数的奇偶性来确定是加上还是减去1,然后将结果与前n-1位的和相加得到最终结果。一个叫team的表,里面只有一个字段name,一共四条记录,分别是a,b,c,d,对应四个球队,现在四个球队进行比赛,用一条SQL语句显示所有比赛组合。求表达式的值 1-2+3-4+5-6+7-8....+m,写出计算数列任意位数值的函数,请用伪代码写。
2023-11-13 15:35:18
101
原创 一些工作记录
2、事实一致性prompt数据构建:包括query清洗构建、以及prompt生成脚本开发。1. 向量手册数据爬取与清洗:网页爬取数据、对网页数据作清洗。3、事实一致性训练脏数据的处理:归纳为统一json格式。5、plan数据清晰:清晰chatgpt生成的原始数据。6、知识检索框架以及大模型微调之后的性能提升数据审核。1、知识场景的RM数据审核-18328条。7、DPO微调方法的性能提升数据审核。5、单轮数据撰写以及多轮数据撰写。2、时间推理数据审核。4、推荐建议数据审核。
2023-11-09 15:12:05
51
原创 python3 剑指刷题记录11
2、三个情况,判断是否越界、位数和是否大于输入threshold、是否是已经达到过的格子,这三种情况下返回空。3、非三种情况下就记录当前位置,然后继续递归其他方向位置是否合适,返回的是记录的所有位置长度。1、跟上一题的路径搜索思路差不多,先限制输入,然后进行遍历,对路径堵塞的情况进行分析。dfs是递归,用作检索四个方向位置是否合适,合适则进行记录marked。sumofDigit是计算位置的数位之和是多少。
2023-07-14 22:25:31
60
原创 工作记录 02 批量调用api接口
用Post请求,request_data是请求体,ret.status_code是状态,ret.text是回复体,写个遍历就能批量调用。
2023-07-14 20:31:39
541
原创 python3 剑指刷题记录10
3、注意处理下标越界、字符不匹配、已经遍历过不能重复这三个情况,第一个情况是碰到边界,则需要返回原始位置,第二个情况是查询方向上的值与匹配值不等,则返回原始位置,第三个情况是匹配的方向已经被之前查询匹配过了,也需要返回原始位置;经过第一个条件判断的,只能是没越界的,当前值相等的,未匹配过的情况,所以如果匹配的值是字符串最后一个字符,则返回True,若是还没匹配到最后一个字符,首先先把匹配过的标记打上。第三个条件判断,是处理该位置上的四个方向是否能匹配k位置的下一个字符,进行递归。4、可以使用递归来处理。
2023-07-14 11:25:52
61
原创 工作记录 01 各种文件的转换
读取json文件,返回的是一个列表值,需要注意的是Json文件中格式是否正确,若不正确将会报错无法读取,还有无法读取的情况很可能是因为数据量太大,无法使用一次性读取的方法,那就可以使用一条条读取再转换存储。表的merged_cells是一个列表,每个元素存储着这个合并单元格的起始行,结束行,起始列,结束列位置,用cell_value()方法可以根据行列定位到单元格获取单元格值;思路:我拿到的文件结构是列表里存放的是字典类型,字典有两个键值,所以我先获取每列的字符串,然后进行判断,根据结构进行存储。
2023-07-13 17:33:50
84
原创 python3 剑指刷题记录09
3、解释一下旋转数组特性,旋转数组中包含两组数据,最小数为第二组数据开头,并且前序列的值都大于后序列的值,最开始的若干元素搬到数组末位,例如{123456},分为两组{123}和{456},旋转之后{456123};2、这题我第一反应用min方法,直接出结果,运行也能通过,不知道说一次旋转的意义在哪里,实际就是数组求最小值,数组最小值算法有很多,快排和冒泡同样适用。4、根据旋转数组特性,寻找出位于第二数组的首位数据即可。
2023-07-12 14:12:59
69
原创 python3 剑指刷题记录08
2、在数学上,费波那契数列是以递归的方法来定义:F1 = 1 (n=1),F2 = 1 (n=2),Fn = F[n-1]+ Fn-2,python可用遍历来实现。
2023-07-12 11:11:37
69
原创 python3 剑指刷题记录07
2、python的append方法就是从尾部插入,pop方法就是从尾部删除并输出删除的元素。1、限制输入数据范围;
2023-07-12 10:43:58
59
原创 python3 剑指刷题记录06
3、输出的返回值要求也不常规,要求返回输入子节点的下一个节点,并不是值,后台会根据返回的节点打印出节点值,若不存在则返回空;2、输入值跟常规的不同,输入的是一个树结构,第一个节点是用户输入的子树节点,第二个节点才是实际输入的树;4、注意需要进行中序遍历,左中右。1、输入检测节点数和节点值范围;
2023-07-12 10:08:09
67
原创 python3 剑指刷题记录05
1、前序遍历首个元素是根节点,中序遍历由根节点分隔左右节点,前序遍历的节点总数和中序遍历一样,节点值也一样;2、根据输入的前序遍历得到根节点,然后在输入的中序遍历中找到左节点和右节点,即可得到树结构。
2023-07-11 14:56:24
48
原创 python3 剑指刷题记录04
1、写题时,发现在代码里已经写好了链表类,不需要直接再写;2、先正着存入列表1,再反着输出存入列表2,将列表2输出。
2023-07-11 14:36:06
66
原创 python3 剑指刷题记录03
3、对于只有三种类型的处理,我想法是用正则替换这三类为空值,然后再检测字符串是否还存在除空之外的其他字符,若存在即输出no,否则就进行空格替换“%20”。2、对输入检测范围0 ≤ len(s) ≤ 1000,确保字符中只有大小写英文字母和空格三种类型,若出现其他类型输出no;1、字符串替换有很多方法,是比较简单的,我选择用正则匹配替换;
2023-07-11 14:29:17
87
原创 python3 剑指刷题记录02
3、对输入的二维数组,只需要对比每行的首位元素是否比这个整数大,末位元素是否比这个整数小,即可确定该行是否为这个整数的区间,再进行条件判断是否在这行内即可。2、题目中设定的二维数组已经有限定条件了,必须是每行从左到右递增,每列从左到右递增,我们只需要判断输入的这个整数是否存在在输入的二维数组中;1、输入范围为 0 ≤ 行,列 ≤500, 0≤ 数组中元素 ≤109;
2023-07-11 14:18:41
70
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人