记录账号-优快云博客

原创工作学习 Git知识点

右击下面那个版本，选择 Reset Current Branch to here，点击Mixed，Reset。如果在提代码的时候push发现行数超过了1000行，或者有其他的问题不想push了，可以先回到之前的分支。稍等一会儿就会把push的反到本地，stash pop以后 git add . 加上所有的文件。最后再拉一下主代码就可以正常重新提交了push的时候用push -f。先Git stash 保存当前的改变。在Git（下图）中找到想退回到的版本。

2023-11-15 15:08:39 109

原创 jd记录 01

6、熟悉 Spark技术栈, 包括RDD和DataFrame的使用，能够使用SparkCore结合SparkSQL 进行数据的统计和计算，以支持大规数据处理和分析任务；10、熟练使用Pycharm, DataGrip,MobaXterm, Git等大数据相关工具，能够高效地进行开发、调试和管理大数据项目;9、熟练使用消息队列工具Kafka、日志数据采集工具 Flume、纯内存计算引擎 Presto；5、熟悉Hive数仓，熟练使用HiveSQL，能够针对不同的应用场景进行Hive优化；

2023-11-14 10:02:48 113

原创学习记录 nlp学习02

LSTM也属于RNN中的一种，所以输入的数据跟前面的一样，时序或者序列数据。最重要的是有一个传输带向量C，过去的信息可以通过传输带向量送到下一个时刻，并且不会发生太大的变化。是可以处理序列或者是时序数据，每个最后输出的h都包含了t时刻前的所有输入信息，但是局限性就在与管理长序列的能力有限。1.梯度爆炸和消失：因为过长，在反向传播的时候，越靠近顶层梯度越小，会导致速度变慢，甚至停止学习。三个参数，batch_size（batch数据），timesteps（序列长度），词向量维度（输出的维度）

2023-11-14 09:56:00 85

原创笔试记录 01

这个查询使用了LEFT JOIN操作，它返回所有左表（在这里是表a）的行，以及与右表（在这里是表b）匹配的行。如果n等于1或2，函数返回1；否则，函数先计算前n-1位的和，根据位数的奇偶性来确定是加上还是减去1，然后将结果与前n-1位的和相加得到最终结果。一个叫team的表，里面只有一个字段name，一共四条记录，分别是a，b，c，d，对应四个球队，现在四个球队进行比赛，用一条SQL语句显示所有比赛组合。求表达式的值 1-2+3-4+5-6+7-8....+m，写出计算数列任意位数值的函数，请用伪代码写。

2023-11-13 15:35:18 143

原创一些工作记录

2、事实一致性prompt数据构建：包括query清洗构建、以及prompt生成脚本开发。1. 向量手册数据爬取与清洗：网页爬取数据、对网页数据作清洗。3、事实一致性训练脏数据的处理：归纳为统一json格式。5、plan数据清晰：清晰chatgpt生成的原始数据。6、知识检索框架以及大模型微调之后的性能提升数据审核。1、知识场景的RM数据审核-18328条。7、DPO微调方法的性能提升数据审核。5、单轮数据撰写以及多轮数据撰写。2、时间推理数据审核。4、推荐建议数据审核。

2023-11-09 15:12:05 82

原创学习记录 nlp学习01

nlp

2023-11-09 15:11:30 79

原创工作记录 03 正则的一些匹配表达式

【代码】工作记录 03 正则的一些匹配表达式。

2023-07-21 15:17:58 89

原创 python3 剑指刷题记录11

2、三个情况，判断是否越界、位数和是否大于输入threshold、是否是已经达到过的格子，这三种情况下返回空。3、非三种情况下就记录当前位置，然后继续递归其他方向位置是否合适，返回的是记录的所有位置长度。1、跟上一题的路径搜索思路差不多，先限制输入，然后进行遍历，对路径堵塞的情况进行分析。dfs是递归，用作检索四个方向位置是否合适，合适则进行记录marked。sumofDigit是计算位置的数位之和是多少。

2023-07-14 22:25:31 89

原创工作记录 02 批量调用api接口

用Post请求，request_data是请求体，ret.status_code是状态，ret.text是回复体，写个遍历就能批量调用。

2023-07-14 20:31:39 721

原创 python3 剑指刷题记录10

3、注意处理下标越界、字符不匹配、已经遍历过不能重复这三个情况，第一个情况是碰到边界，则需要返回原始位置，第二个情况是查询方向上的值与匹配值不等，则返回原始位置，第三个情况是匹配的方向已经被之前查询匹配过了，也需要返回原始位置；经过第一个条件判断的，只能是没越界的，当前值相等的，未匹配过的情况，所以如果匹配的值是字符串最后一个字符，则返回True，若是还没匹配到最后一个字符，首先先把匹配过的标记打上。第三个条件判断，是处理该位置上的四个方向是否能匹配k位置的下一个字符，进行递归。4、可以使用递归来处理。

2023-07-14 11:25:52 83

原创工作记录 01 各种文件的转换

读取json文件，返回的是一个列表值，需要注意的是Json文件中格式是否正确，若不正确将会报错无法读取，还有无法读取的情况很可能是因为数据量太大，无法使用一次性读取的方法，那就可以使用一条条读取再转换存储。表的merged_cells是一个列表，每个元素存储着这个合并单元格的起始行，结束行，起始列，结束列位置，用cell_value（）方法可以根据行列定位到单元格获取单元格值；思路：我拿到的文件结构是列表里存放的是字典类型，字典有两个键值，所以我先获取每列的字符串，然后进行判断，根据结构进行存储。

2023-07-13 17:33:50 139

原创 python3 剑指刷题记录09

3、解释一下旋转数组特性，旋转数组中包含两组数据，最小数为第二组数据开头，并且前序列的值都大于后序列的值，最开始的若干元素搬到数组末位，例如{123456}，分为两组{123}和{456}，旋转之后{456123}；2、这题我第一反应用min方法，直接出结果，运行也能通过，不知道说一次旋转的意义在哪里，实际就是数组求最小值，数组最小值算法有很多，快排和冒泡同样适用。4、根据旋转数组特性，寻找出位于第二数组的首位数据即可。

2023-07-12 14:12:59 92

原创 python3 剑指刷题记录08

2、在数学上，费波那契数列是以递归的方法来定义：F1 = 1 (n=1)，F2 = 1 (n=2)，Fn = F[n-1]+ Fn-2，python可用遍历来实现。

2023-07-12 11:11:37 87

原创 python3 剑指刷题记录07

2、python的append方法就是从尾部插入，pop方法就是从尾部删除并输出删除的元素。1、限制输入数据范围；

2023-07-12 10:43:58 77

原创 python3 剑指刷题记录06

3、输出的返回值要求也不常规，要求返回输入子节点的下一个节点，并不是值，后台会根据返回的节点打印出节点值，若不存在则返回空；2、输入值跟常规的不同，输入的是一个树结构，第一个节点是用户输入的子树节点，第二个节点才是实际输入的树；4、注意需要进行中序遍历，左中右。1、输入检测节点数和节点值范围；

2023-07-12 10:08:09 84

原创 python3 剑指刷题记录05

1、前序遍历首个元素是根节点，中序遍历由根节点分隔左右节点，前序遍历的节点总数和中序遍历一样，节点值也一样；2、根据输入的前序遍历得到根节点，然后在输入的中序遍历中找到左节点和右节点，即可得到树结构。

2023-07-11 14:56:24 67

原创 python3 剑指刷题记录04

1、写题时，发现在代码里已经写好了链表类，不需要直接再写；2、先正着存入列表1，再反着输出存入列表2，将列表2输出。

2023-07-11 14:36:06 93

原创 python3 剑指刷题记录03

3、对于只有三种类型的处理，我想法是用正则替换这三类为空值，然后再检测字符串是否还存在除空之外的其他字符，若存在即输出no，否则就进行空格替换“%20”。2、对输入检测范围0 ≤ len(s) ≤ 1000，确保字符中只有大小写英文字母和空格三种类型，若出现其他类型输出no；1、字符串替换有很多方法，是比较简单的，我选择用正则匹配替换；

2023-07-11 14:29:17 117

原创 python3 剑指刷题记录02

3、对输入的二维数组，只需要对比每行的首位元素是否比这个整数大，末位元素是否比这个整数小，即可确定该行是否为这个整数的区间，再进行条件判断是否在这行内即可。2、题目中设定的二维数组已经有限定条件了，必须是每行从左到右递增，每列从左到右递增，我们只需要判断输入的这个整数是否存在在输入的二维数组中；1、输入范围为 0 ≤ 行，列 ≤500， 0≤ 数组中元素 ≤109；

2023-07-11 14:18:41 90

原创 python3 剑指刷题记录01

python 数组

2023-07-11 11:36:39 107

Worse_Programmer的博客