自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

珊瑚海的博客

坚持梦想,十年不变

  • 博客(162)
  • 收藏
  • 关注

原创 百度7日强化学习总结

基本概念包括:两部分:Agent智能体,Environment 环境三要素:state状态,动作action,reward奖励。Agent学习两种策略基于价值的value-based:随机性策略,代表性的有Sarsa,Q-learning,DQN基于策略的policy-based:随机性策略,代表方法:Policy gradient第二课:表格型方法方法包括SARSA方法:On-policy策略,优化实际执行策略。Q_learning方法:Off-p...

2020-06-26 09:48:53 258

原创 大模型训练后封装服务

包括端口,服务地址等。

2025-03-14 15:00:22 82

原创 大模型预训练核心代码分析

这段代码的核心是计算语言模型预测结果与真实标签之间的损失,通过对logits和labels进行适当的切片和形状重塑,使其能够匹配损失函数的输入要求。数据tokenizer这段代码的主要功能是对输入文本text进行分词处理,接着把分词结果转换为 PyTorch 张量,最后将这些张量进行压缩(去除维度为 1 的维度)。key。

2025-03-13 19:04:13 644

原创 centos 7.6 安装mysql实用方案

参考如上。

2025-02-06 17:20:22 329

原创 服务器乱码解决方案

【代码】服务器乱码解决方案。

2025-01-10 16:59:31 102

原创 Flask返回浏览器无乱码方法

Response(对应字典, content_type='application/json')1、先json.dumps(对应字典, ensure_ascii=False)编码。方可解决浏览器显示乱码问题。

2025-01-07 19:35:11 510

原创 Redis作为发布订阅模式中介代码示例

【代码】Redis作为发布订阅模式中介代码示例。

2025-01-03 14:26:10 97

原创 Qwen2.5代码简易写法

【代码】Qwen2.5代码简易写法。

2024-12-17 15:34:54 253

原创 Linux上安装Anaconda&常用包信息检查

配置对应的conda环境,export PATH=/对应目录/anaconda3/bin:$PATH。*注意为bin目录下。

2024-12-12 15:07:31 283

原创 Leetcode 3243题解

【代码】Leetcode 3243题解。

2024-11-20 11:19:51 108

原创 docker打包

1、docker run -it --gpus all --name dockername -p 外网端口:内网端口 -v 机器实际地址:docker地址(/workspace) 镜像名称llm:latest /bin/bash。docker exec -it dockername(镜像名) /bin/bash。docker exec -it ID(镜像名or ID) /bin/bash。docker start dockername(镜像名)

2024-10-24 11:32:15 315 1

原创 Pyke学习系列(pyke基础执行)(一)

pyke使用学习

2024-10-11 17:50:18 418

原创 python查找和插入子串位置并解析

【代码】python查找和插入子串位置并解析。

2024-09-03 18:55:10 216

原创 JSON解析

res =str([{'name': '李二二', 'sex': '', 'landline_number': '025-57126822', 'idcard': '', 'phone': ''}, {'name': '杜三平', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '189'}, {'name': '周东', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '1

2024-08-08 16:00:36 144

原创 查看环境中python3安装在哪指令

pip install wherewhere python3

2024-05-25 11:40:57 416

原创 Transformer位置编码详解

在处理自然语言时候,因Transformer是基于注意力机制,不像RNN有词位置顺序信息,故需要加入词的位置信息来显示的表明词的上下文关系。具体是将词经过位置编码(positional encoding),然后与emb词向量求和,作为编码块(Encoder block)的输入信息。据此,即可根据不同的pos信息和i信息得到不同的位置嵌入信息。其中PE的维度为:[序列长度,编码维度](即[seq_len,emb_dim])i表示词向量的位置,偶数位置用sin,奇数位置用cos。pos表示词语在句子中的位置。

2024-04-05 23:08:30 487

原创 安装合适的GPU中DGL版本

【代码】安装合适的GPU中DGL版本。

2023-12-08 16:29:22 1018

原创 大模型相关技术汇总分析

随着大模型技术的发展,基于prompt方式对模型进行微调获得输出是非常普遍的做法,为获得更好的输出,对prompt进行微调是非常重要的。大模型是今年最火的概念,大模型时代必备技巧之一是-----提升工程(Prompt Engineering)。即从数据,模型,参数及执行四个方面均获得了最佳训练效果。完整的大模型由:芯片层->框架层->模型层 组成。4、分组参数切片,Sharding策略。

2023-06-13 15:17:49 583

原创 Softmax中top K个元素

取softmax中第K大数

2023-05-24 16:31:06 226

原创 浅谈线性回归

线性回归可以应用于生产生活中的许多领域,比如股票预测,房价规律摸索等应用中。初中时候,我们就学习过y=ax+b这样的公式,它具有很强的泛化能力。可以通用的表示线性方程。

2023-04-30 10:32:18 93

原创 Sklearn机器学习过程分析

sklearn机器学习过程

2023-04-15 10:32:06 178

原创 PyTorch获取对应类并设置相应参数

Pytorch获取类中对应字段值方法

2023-03-04 22:48:16 140

原创 Python的Dict根据value找到key

Python的Dict根据value找到key

2022-10-24 17:02:24 2767

原创 Java设计模式之原型模式·

Java设计模式

2022-07-17 17:48:44 89

原创 原型模式(浅克隆,Java实现)

原型模式(浅克隆,Java实现)

2022-07-05 20:58:42 156

原创 设计模式之工厂模式

设计模式之工厂模式

2022-06-05 00:04:11 110

原创 设计模式之代理模式

1、定义公共接口,这些接口表示所有请求行为;2、定义请求者,继承公共接口,包含准备执行者对象;3、定义代理(proxy),继承公共接口,包含请求者对象,传入被请求者对象;4、调用请求行为;5、竹类中由代理来调用对应请求行为在《大话设计模式》中以追求女生为例,现将自己改造的Java代码显示如下://被请求者public class SchoolGirl { private String name; public String getName() { return name

2022-05-26 19:12:41 110

原创 设计模式之装饰模式

//定义人(物件)public class Person { private String name; public Person(){ } public Person(String name){ this.name = name; } public void Show() { System.out.println("装饰" + this.name); }}//装饰抽象类//需继承对象,从外类拓展对象类功能public class Finery extends P.

2022-05-25 00:02:22 115

原创 策略模式(Strategy)

//公共类public abstract class Strategy { public abstract void AlgorithInterface();}//策略Apublic class ContreteStrategyA extends Strategy { @Override public void AlgorithInterface() { // TODO Auto-generated method stub System.out.println("算法A实现");.

2022-05-22 00:13:20 166

原创 简单工厂模式

//基础类public class Operation { private double numberA = 0; private double numberB = 0; public double getNumberA() { return numberA; } public void setNumberA(double numberA) { this.numberA = numberA; } public double getNumberB() { return nu.

2022-05-21 12:14:02 124

原创 Latex多行公式编辑

1、\usepackage{amsmath} 使用amsmath包2、equation和aligned配合使用\begin{equation} \begin{aligned} & M_{r_{g_{s}}}(x1) \\ & N_{r_{g_{s}}} \\ \end{aligned}\end{equation}3、左对齐使用&4、空格使用符号~...

2022-03-16 15:59:01 558

原创 字符串反转

def reverseOnlyLetters2(s: str) ans = list(s) left = 0 right = len(ans) - 1 while True: while left < right and not ans[left].isalpha(): left += 1 while right > left and not ans[right].isalpha(): .

2022-02-23 12:12:48 149

原创 torch.where使用总结

a = torch.randn(3, 5) print(a) b = torch.ones(3, 5) print(b) c = torch.where(a > 0, a, b) print(c)合并两个tensor,a>0的地方取a值,否则取b值

2021-12-28 14:48:56 1030

原创 树的递归总结

以java为例:比如dfs()public int dfs(TreeNode node){//刚进来一般都是边界条件if(node==null){ return 0; }//左递归int leftval = this.dfs(node.left);//右递归int rightval = this.dfs(node.right);//都要做的操作int data = Math.abs(leftval-rightval);...

2021-11-18 12:15:19 260

原创 是否2的幂次判断

判断大于0的数字是否为2的幂// 是否是2的幂(n必须大于0)public boolean isPowerOfTwo(int n) { //return (n&(n-1))==0; return (n & -n) == n;}

2021-11-16 11:09:11 166

原创 Python中dict结构根据时间字段排序方法研究

对于Python3来说,引入from functools import cmp_to_key方法。from functools import cmp_to_keydef cmp_datetime(a, b): a_datetime = datetime.datetime.strptime(a["time"], '%Y-%m-%d') b_datetime = datetime.datetime.strptime(b["time"], '%Y-%m-%d') if a_d

2021-11-12 14:41:10 862

原创 Java和Python读取文件总结

public static ArrayList<String> readTxtFile() { String fileName = JavaFile.class.getClassLoader().getResource("filename/list.txt").getPath(); ArrayList<String> arrayList = new ArrayList<>(); try { File jsonFile = new File(fileNa.

2021-11-07 21:27:01 801

原创 Java二叉树遍历的非递归算法(前序)

二叉树迭代:遍历左子树无论左子树为空还是右子树为空:出栈操作 访问右子树public String preOrder(TreeNode root) { StringBuffer sb = new StringBuffer(); Deque<TreeNode> stack = new ArrayDeque<>(); TreeNode p = root; while (p != null || !stack.isEmpty()) { while (

2021-10-17 18:53:36 334

原创 GPU上数据转换为一般的Python数据方法

cuda为True时候调用cuda().data.cpu().numpy().tolist()方法,CPU时候调用numpy().tolist()方法if args.cuda: pred_labels = preds.cuda().data.cpu().numpy().tolist()else: pred_labels = preds.numpy().tolist()

2021-09-09 12:07:31 409

原创 对常数*幂次的总结与感想

今天刷题,思路上有一点启发,记录下方便以后调用:1、A对应65,A-Z之间对应数字可以用,当前值-'A'+1表示2、结果result,先存之前的,然后再加上新值表示(+=),result +=新数3、如果是某个数字number的x次幂,可以用在for循环中加实现,初始number赋值14、可以表示excel中数字编号5、先执行幂次初始化1,然后执行加法操作,新值=老值+新数,简化为value +=num;6、再执行幂次或者加新数计算。...

2021-07-30 09:52:04 214

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除