- 博客(31)
- 收藏
- 关注
原创 强化学习的基本概念
(action)是智能体基于当前状态所做出的决策. 在《超级马力欧兄弟》的例子中,假设马力欧只能向左走、向右走、向上跳,那么动作就是左、右、上三者中的一种. 在围棋游戏中,棋盘上有361个位置,于是有361种动作,第 i种动作是指把棋子放到第i个位置上. 动作的选取可以是确定性的,也可以是随机的. 随机是指以一定概率选取一个动作。动作的随机性来自策略.状态的随机性来自状态转移. 当状态和动作都确定下来时,下一个状态仍然有随机性. 环境(比如游戏程序)用状态转移函数计算所有可能的状态的概率,
2025-03-24 11:45:05
918
原创 windows系统配置huggingface镜像下载模型
右击电脑,点击属性,进入高级系统设置,环境变量——系统变量——新建变量,下载Deepseek模型到本地文件夹。进入虚拟环境,安装依赖。
2025-03-14 09:37:13
288
原创 知识蒸馏(Knowledge Distillation),五种模型压缩方法
在知识蒸馏中,⼩⽹络(即学⽣⽹络)是根据教师⽹络来学习的. 假设要做⼿写数字识别,把训练数据丢进教师⽹络,教师⽹络产⽣输出,因为这是⼀个分类的问题,所以教师⽹络的输出其实是⼀个分布。:⾸先训练⼀个⼤的⽹络. 然后衡量这个⽹络⾥每⼀个参数或者说神经元的重要性,最简单的⽅法也许就是看它的绝对值. 这个参数的绝对值越⼤,它对整个⽹络的影响可能就越⼤. 或者说,这个参数的绝对值越接近零,它对整个⽹络的影响就越⼩,对任务的影响也就越⼩.③参数量化(Parameter Quantization)
2025-03-14 09:34:47
340
原创 RAG及使用LangChain实现RAG应用开发示例
比如,对检索的结果借助更专业的排序模型与算法进行重排序或者过滤掉一些不符合条件的知识块等,使得最需要、最合规的知识块处于上下文的最前端,这有助于提高大模型的输出质量。(2)生成(Generation):生成的核心是大模型,可以是本地部署的大模型,也可以是基于 API 访问的远程大模型。(1)检索(Retrieval):检索的作用是借助数据索引(比如向量存储索引),从存储库(比如向量库)中检索出相关知识块,并按照相关性进行排序,经过排序后的知识块将作为参考上下文用于后面的生成。
2025-03-13 15:37:07
729
原创 eclipse的subclipse下载安装,python插件安装,svn设置
eclipse的python插件安装成功之后,windows→perference→Pydev→interpreters中选择python解释器点击Add选择python的位置。打开eclipse,点击help—install new software点击add添加http://www.pydev.org/updates。打开“Help”菜单,选择“Eclipse Marketplace”。选择project并点击apply然后再选择interpreter。选择pydev一路同意next结束。
2025-03-10 13:57:37
279
原创 安卓帧布局练习————霓虹灯
布局activity_main.xml<?xml version="1.0" encoding="utf-8"?><LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:app="http://schemas.android.com/apk/res-auto" xmlns:tools="http://schemas.android.com/tools" andr
2021-06-14 22:35:57
1648
3
原创 zip压缩包解密器
加密压缩包密码破解:https://www.lanzous.com/i7ialcd 网站自取参考这个大佬写的方法进行解密:https://baijiahao.baidu.com/s?id=1651800174436851026&wfr=spider&for=pc
2021-01-27 12:53:36
2091
原创 java基础知识整理
java一、java基础1,跨平台原理平台:一般指windows 系统,linux系统,mac系统针对不同的操作系统安装不同的java虚拟机(JVM)。JVM在几个系统中相当于翻译的作用。2,JDK,JRE,JVMJDK是开发工具包,包括编译工具和运行工具,JRE是java程序运行环境,JVM是可以保证java程序的跨平台。3,常见的DOS命令windows+R打开窗口cmd打开命令提示符窗口操作说明盘符名称:盘符切换。E:回车,表示切换到E盘。dir查看当前
2020-12-11 23:17:05
310
原创 蓝桥杯带分数题C/C++
从标准输入读入一个正整数N (N<1000*1000)程序输出该数字用数码1~9不重复不遗漏地组成带分数表示的全部种数。注意:不要求输出每个表示,只统计有多少表示法!例如:用户输入:100程序输出:11再例如:用户输入:105程序输出:6#include<iostream>#include<cstdio>#include<algorithm>using namespace std;int arr[9]={1,2,3,4,5,6,7,
2020-10-02 14:41:16
236
原创 圆的问题
title: 圆的问题date: 2020-01-13 10:20:40tags: 蓝桥杯π的算法:第一,用常数π=3.14159265358979323。第二,用数学公式,PI=atan(1.0)*4.0,这里要用到<math.h>。圆面积公式S=πr^2。float类型能存储6 位小数,double类型能存储15位小数。long double 能存储19位小数。printf的%f说明符既可以输出float型又可以输出double型。scanf对于float类型必须用%f,d.
2020-08-14 10:08:33
254
原创 排序的方法:希尔、冒泡、选择、快速
title: 各种排序的方法date: 2020-01-26 09:12:37tags: c语言数据结构插入排序直接插入排序第一步:序列中的第一个元素保留,第二个元素和它比较,比它大放在前面,比它小方在后面。第二步:保留第一第二个元素,第三个与第二个比较,比它大插入到前面,比它小插入到后面。其他步如第二步一样,直到排序完成。c语言代码如下:int insort(int a[],int n){ int i,j; for(i=2;i<=n;i++) { .
2020-08-14 10:07:46
228
原创 long型输入与输出
title: long型输入与输出date: 2020-01-13 09:32:58tags: 蓝桥杯long型存储大小为4个字节,存储值的范围为-2,147,483,648 到 2,147,483,647。long a是long int a的简写,完全一样。%ld和%d在一般的32位环境中也是一样的,因为long和int都是32位的,当然,用%ld更符合规范一些。#include<stdio.h>int main(){ long n,i,s=0; scanf("%ld",&.
2020-08-14 10:06:22
19139
原创 C++入门知识
title: C++入门知识date: 2020-01-13 14:26:21tags: c++iostream是输入输出库流。命名空间using前缀std::表明是定义在命名空间(namespace) std中的。使用命名空间,程序员可以避免由于无意中使用了与库中所定义名字相同的名字而引致冲突。因为标准库定义的名字是定义在命名空间中,所以我们可以按自己的意图使用相同的名字。标准库使用命名空间的副作用是,当我们使用标准库中的名字时,必须显式地表达出使用的是命名空间std下的名字。std: :.
2020-08-14 10:05:30
164
原创 ”scanf格式化问题
title: scanf格式化问题date: 2020-01-12 19:42:53tags: 蓝桥杯试题空白字符(white space)。一般,程序中所指的空白字符是指空格(space),回车(enter)和指标符(table)整数输入%d在 “%d ” 里是一个%d加一个空格,这是程序读入数据时的格式,这个格式是什么意思呢? 这个格式的意思是说是在读完一个整数后,格式中的空格还需要匹配一次有效的输入,就是需要再读一个整数。scanf默认的分割符是所有的空白字符(空格,回车和指标符都行.
2020-08-14 10:04:32
229
原创 蓝桥杯c语言16进制转10进制
十六进制转十进制:从键盘输入一个不超过8位的正的十六进制数字符串,将它转换为正的十进制数后输出。 注:十六进制数中的10~15分别用大写的英文字母A、B、C、D、E、F表示。 C语言: 第一种方法:得分75,因为int型是整型的#include<stdio.h>int main(){ int n; scanf("%x",&n);//输入16进制数 printf("%d",n); return 0; }第二种方法:带上检测方法,得分为0,我吐了呀。#i
2020-08-13 10:33:18
2285
1
原创 计算机自顶而下方法笔记
第一章计算机网络和因特网因特网具体构成描述:互联了遍及全世界设备的网络,连接因特网的设备叫做主机或端系统,端系统通过通信链路和分组交换机连接到一起,通信链路有很多种物理媒体构成(电缆、光纤、无线电频谱……)速率以bps为单位。发送端系统将数据分段,加工形成的信息成为分组,分组通过网络发送到目的端系统。端系统通过因特网服务提供商(ISP)接入因特网。每个ISP是由一个由多个分组交换机和多段通信链路组成的网络。不同的ISP为端系统提供不同的网络接入。TCP和IP是因特网中两个重要的协议,IP协议定义了路由
2020-07-23 14:21:12
282
转载 《深入理解计算机系统》笔记整理
预处理阶段。预处理器(cpp)根据以字符 # 开头的命令,修改原始的 C 程序。比如 hello.c 中第 1 行的 #include 命令告诉预处理器读取系统头文件 stdio.h 的内容,并把它直接插入到程序文本中。结果就得到了另一个 C 程序,通常是以 .i 作为文件扩展名。编译阶段。编译器(cc1)将文本文件 hello.i 翻译成文本文件 hello.s,它包含一个汇编语言程序。汇编语言程序中的每条语句都以一种标准的文本格式确切地描述了一条低级机器语言指令。汇编语言是非常有用的,因为它为不同高.
2020-07-11 14:59:16
349
原创 数据结构1
数据结构逻辑结构数据对象中数据元素之间的关系。分为集合结构、线性结构、树形结构、图形结构。物理结构数据的逻辑结构在计算机中的存储形式。分为顺序存储和链式存储。算法五个特性:输入、输出、有穷性、确定性和可行性算法设计的要求:正确性、可读性、健壮性、时间效率高和存储量低算法效率的估算:程序在计算机上运行时所消耗的时间取决于(1)算法采用的方法(程序)(2)编译产生的代码质量(编译软件)(3)输入问题的规模(4)机器执行指令的速度(硬件)算法时间复杂度一般用大O()表示O(1)是常数阶、O(
2020-07-02 13:48:43
258
原创 单片机定时器救急复习
定时器#include<reg52.h>unsigned char i=100;void main(){ TMOD=0X01; TH0=0XEE; TL0=0X00; P2=0x00; EA=1; ET0=1; TR0=1; while(1);}void time() interrupt 1{ TH0=0XEE; TL0=0X00; i--; if(i<=0) { P2=~P2; i=100; } }中断的程序写法:
2020-05-24 09:25:41
859
1
原创 LeetCode每日一刷
题目一个整型数组 nums 里除两个数字之外,其他数字都出现了两次。请写程序找出这两个只出现一次的数字。要求时间复杂度是O(n),空间复杂度是O(1)。输入:nums = [4,1,4,6]输出:[1,6] 或 [6,1]示例 2:输入:nums = [1,2,10,4,1,4,3,3]输出:[2,10] 或 [10,2]限制:2 <= nums <= 10000来源...
2020-04-28 08:59:54
214
原创 Linux常见指令
Linux常见指令cat cdchmod chowncp cut名称:cat使用权限:所有使用者使用方式:cat [-AbeEnstTuv] [–help] [–version] fileName说明:把档案串连接后传到基本输出(萤幕或加 > fileName 到另一个档案)参数:-n 或 --number 由 1 开始对所有输出的行数编号-b 或 --number-no...
2020-04-27 21:22:34
286
原创 类与对象(一)
类对象构造函数析构函数对象生存期类的声明类作为另一种结构化的数据类型,与结构体不同的是,类专门设计用来组织数据和函数的一般格式:class 类名{private: 私有数据成员和成员函数;protected: 保护数据成员和成员函数;public: 公有数据成员和成员函数;};各个成员函数的实现;类定义是以关键字 class ...
2020-04-27 20:38:56
269
原创 Leetcode每日一题
假设按照升序排序的数组在预先未知的某个点上进行了旋转。( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。你可以假设数组中不存在重复的元素。你的算法时间复杂度必须是 O(log n) 级别。示例 1:输入: nums = [4,5,6,7,0,1,2], targ...
2020-04-27 07:28:46
187
原创 哈希表
哈希表前言在顺序表中查找时,需要从表头开始,依次遍历比较a[i]与key的值(也就是所查找的值)是否相等;在有序表中查找时,我们经常使用的是二分查找,通过比较key与a[i]的大小来折半查找。 但是,这两种方法的效率都依赖于查找中比较的次数。有人就研究想到,能不能不经过比较,而是直接通过关键字key一次得到所要的结果呢?这时,就有了散列表查找(哈希表)。概念哈希表(Hash tabl...
2020-04-22 07:18:22
334
原创 LeetCode 每日一刷✔
LeetCode 每日一刷✔题目给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数,则其数值范围为 [−231, 231 − 1]。请根据这个假设,如果反转后整数溢出那么就返回 0...
2020-04-21 08:23:35
212
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人