- 博客(162)
- 收藏
- 关注

原创 百度7日强化学习总结
基本概念包括:两部分:Agent智能体,Environment 环境三要素:state状态,动作action,reward奖励。Agent学习两种策略基于价值的value-based:随机性策略,代表性的有Sarsa,Q-learning,DQN基于策略的policy-based:随机性策略,代表方法:Policy gradient第二课:表格型方法方法包括SARSA方法:On-policy策略,优化实际执行策略。Q_learning方法:Off-p...
2020-06-26 09:48:53
258
原创 大模型预训练核心代码分析
这段代码的核心是计算语言模型预测结果与真实标签之间的损失,通过对logits和labels进行适当的切片和形状重塑,使其能够匹配损失函数的输入要求。数据tokenizer这段代码的主要功能是对输入文本text进行分词处理,接着把分词结果转换为 PyTorch 张量,最后将这些张量进行压缩(去除维度为 1 的维度)。key。
2025-03-13 19:04:13
644
原创 Flask返回浏览器无乱码方法
Response(对应字典, content_type='application/json')1、先json.dumps(对应字典, ensure_ascii=False)编码。方可解决浏览器显示乱码问题。
2025-01-07 19:35:11
510
原创 Linux上安装Anaconda&常用包信息检查
配置对应的conda环境,export PATH=/对应目录/anaconda3/bin:$PATH。*注意为bin目录下。
2024-12-12 15:07:31
283
原创 docker打包
1、docker run -it --gpus all --name dockername -p 外网端口:内网端口 -v 机器实际地址:docker地址(/workspace) 镜像名称llm:latest /bin/bash。docker exec -it dockername(镜像名) /bin/bash。docker exec -it ID(镜像名or ID) /bin/bash。docker start dockername(镜像名)
2024-10-24 11:32:15
315
1
原创 JSON解析
res =str([{'name': '李二二', 'sex': '', 'landline_number': '025-57126822', 'idcard': '', 'phone': ''}, {'name': '杜三平', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '189'}, {'name': '周东', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '1
2024-08-08 16:00:36
144
原创 Transformer位置编码详解
在处理自然语言时候,因Transformer是基于注意力机制,不像RNN有词位置顺序信息,故需要加入词的位置信息来显示的表明词的上下文关系。具体是将词经过位置编码(positional encoding),然后与emb词向量求和,作为编码块(Encoder block)的输入信息。据此,即可根据不同的pos信息和i信息得到不同的位置嵌入信息。其中PE的维度为:[序列长度,编码维度](即[seq_len,emb_dim])i表示词向量的位置,偶数位置用sin,奇数位置用cos。pos表示词语在句子中的位置。
2024-04-05 23:08:30
487
原创 大模型相关技术汇总分析
随着大模型技术的发展,基于prompt方式对模型进行微调获得输出是非常普遍的做法,为获得更好的输出,对prompt进行微调是非常重要的。大模型是今年最火的概念,大模型时代必备技巧之一是-----提升工程(Prompt Engineering)。即从数据,模型,参数及执行四个方面均获得了最佳训练效果。完整的大模型由:芯片层->框架层->模型层 组成。4、分组参数切片,Sharding策略。
2023-06-13 15:17:49
583
原创 浅谈线性回归
线性回归可以应用于生产生活中的许多领域,比如股票预测,房价规律摸索等应用中。初中时候,我们就学习过y=ax+b这样的公式,它具有很强的泛化能力。可以通用的表示线性方程。
2023-04-30 10:32:18
93
原创 设计模式之代理模式
1、定义公共接口,这些接口表示所有请求行为;2、定义请求者,继承公共接口,包含准备执行者对象;3、定义代理(proxy),继承公共接口,包含请求者对象,传入被请求者对象;4、调用请求行为;5、竹类中由代理来调用对应请求行为在《大话设计模式》中以追求女生为例,现将自己改造的Java代码显示如下://被请求者public class SchoolGirl { private String name; public String getName() { return name
2022-05-26 19:12:41
110
原创 设计模式之装饰模式
//定义人(物件)public class Person { private String name; public Person(){ } public Person(String name){ this.name = name; } public void Show() { System.out.println("装饰" + this.name); }}//装饰抽象类//需继承对象,从外类拓展对象类功能public class Finery extends P.
2022-05-25 00:02:22
115
原创 策略模式(Strategy)
//公共类public abstract class Strategy { public abstract void AlgorithInterface();}//策略Apublic class ContreteStrategyA extends Strategy { @Override public void AlgorithInterface() { // TODO Auto-generated method stub System.out.println("算法A实现");.
2022-05-22 00:13:20
166
原创 简单工厂模式
//基础类public class Operation { private double numberA = 0; private double numberB = 0; public double getNumberA() { return numberA; } public void setNumberA(double numberA) { this.numberA = numberA; } public double getNumberB() { return nu.
2022-05-21 12:14:02
124
原创 Latex多行公式编辑
1、\usepackage{amsmath} 使用amsmath包2、equation和aligned配合使用\begin{equation} \begin{aligned} & M_{r_{g_{s}}}(x1) \\ & N_{r_{g_{s}}} \\ \end{aligned}\end{equation}3、左对齐使用&4、空格使用符号~...
2022-03-16 15:59:01
558
原创 字符串反转
def reverseOnlyLetters2(s: str) ans = list(s) left = 0 right = len(ans) - 1 while True: while left < right and not ans[left].isalpha(): left += 1 while right > left and not ans[right].isalpha(): .
2022-02-23 12:12:48
149
原创 torch.where使用总结
a = torch.randn(3, 5) print(a) b = torch.ones(3, 5) print(b) c = torch.where(a > 0, a, b) print(c)合并两个tensor,a>0的地方取a值,否则取b值
2021-12-28 14:48:56
1030
原创 树的递归总结
以java为例:比如dfs()public int dfs(TreeNode node){//刚进来一般都是边界条件if(node==null){ return 0; }//左递归int leftval = this.dfs(node.left);//右递归int rightval = this.dfs(node.right);//都要做的操作int data = Math.abs(leftval-rightval);...
2021-11-18 12:15:19
260
原创 是否2的幂次判断
判断大于0的数字是否为2的幂// 是否是2的幂(n必须大于0)public boolean isPowerOfTwo(int n) { //return (n&(n-1))==0; return (n & -n) == n;}
2021-11-16 11:09:11
166
原创 Python中dict结构根据时间字段排序方法研究
对于Python3来说,引入from functools import cmp_to_key方法。from functools import cmp_to_keydef cmp_datetime(a, b): a_datetime = datetime.datetime.strptime(a["time"], '%Y-%m-%d') b_datetime = datetime.datetime.strptime(b["time"], '%Y-%m-%d') if a_d
2021-11-12 14:41:10
862
原创 Java和Python读取文件总结
public static ArrayList<String> readTxtFile() { String fileName = JavaFile.class.getClassLoader().getResource("filename/list.txt").getPath(); ArrayList<String> arrayList = new ArrayList<>(); try { File jsonFile = new File(fileNa.
2021-11-07 21:27:01
801
原创 Java二叉树遍历的非递归算法(前序)
二叉树迭代:遍历左子树无论左子树为空还是右子树为空:出栈操作 访问右子树public String preOrder(TreeNode root) { StringBuffer sb = new StringBuffer(); Deque<TreeNode> stack = new ArrayDeque<>(); TreeNode p = root; while (p != null || !stack.isEmpty()) { while (
2021-10-17 18:53:36
334
原创 GPU上数据转换为一般的Python数据方法
cuda为True时候调用cuda().data.cpu().numpy().tolist()方法,CPU时候调用numpy().tolist()方法if args.cuda: pred_labels = preds.cuda().data.cpu().numpy().tolist()else: pred_labels = preds.numpy().tolist()
2021-09-09 12:07:31
409
原创 对常数*幂次的总结与感想
今天刷题,思路上有一点启发,记录下方便以后调用:1、A对应65,A-Z之间对应数字可以用,当前值-'A'+1表示2、结果result,先存之前的,然后再加上新值表示(+=),result +=新数3、如果是某个数字number的x次幂,可以用在for循环中加实现,初始number赋值14、可以表示excel中数字编号5、先执行幂次初始化1,然后执行加法操作,新值=老值+新数,简化为value +=num;6、再执行幂次或者加新数计算。...
2021-07-30 09:52:04
214
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人