- 博客(32)
- 资源 (10)
- 收藏
- 关注

原创 为什么在大模型中需要使用向量数据库?
本文将从向量、语义理解、向量之间的距离等方面入手,带你理解向量数据库的核心作用,并解释它在 AI 时代的重要性。传统的计算机理解文本是基于字符串匹配的,例如查找关键词 “苹果” 时,它只会寻找完全匹配的 “苹果”。但在实际应用中,向量的维度可能是 128、512,甚至 768 维,这样的高维向量能更精准地表示信息的特征。在 AI 时代,掌握向量和向量数据库的基本概念,将帮助我们更好地理解和应用大模型技术。向量数据库是大模型的重要组件,它解决了普通数据库无法处理语义搜索的问题,让 AI 具备。
2025-03-21 08:08:08
616
原创 Dify平台离线镜像部署
是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。
2025-03-17 21:14:02
606
3
原创 一夜爆火的Manus是什么?如何构成?它对未来意味着什么
通用 AI 智能体代表了人工智能的未来方向,它不仅仅是一个“更聪明的 ChatGPT”,更是一个能够自主学习、适应不同任务的智能系统。通过合理的架构设计,我们可以逐步构建自己的 AI 智能体,并探索它在生产力、学习、社会等方面的潜力。与传统 AI 相比,通用 AI 智能体具备更强的适应性,能像人类一样灵活应对问题。如果说 ChatGPT 这样的 AI 更像是一个强大的助手,那么通用 AI 智能体就是能够自主完成任务、学习新知识,并适应各种场景的“超级助手”。你可以选择一个合适的 LLM 作为核心大脑。
2025-03-07 14:09:57
688
原创 软考高项(信息系统项目管理师)学习计划(2025)
按计划学习,稳步推进多练习案例,提升解题能力提前准备论文,掌握写作技巧考前调整状态,确保最佳发挥🎯目标:一次通过软考高项!
2025-03-05 21:57:45
938
原创 大语言模型中的 Token:它们是什么,如何工作?
了解 Token 的概念,可以帮助你更好地理解大语言模型的工作原理。如果你对 AI 感兴趣,可以尝试使用 Tokenizer 工具,把不同的句子转换成 Token,看看它们是如何被拆分的!大语言模型需要一种方法把句子转换成计算机能理解的格式,而 Token 化(Tokenization)就是这个过程的关键步骤。当你输入一段文本时,模型会先把它转换成 Token,然后再进行处理。,就像字母是单词的组成部分,Token 是大模型理解文本的基本“积木”。大模型的计算量和 Token 的数量直接相关。
2025-03-01 17:30:14
1000
原创 使用Python实现机器学习小案例:构建房价预测模型
通过本项目,我们实现了一个基于线性回归的房价预测模型,并使用实际数据进行训练和预测。数据准备数据探索与预处理模型训练与评估结果可视化通过这个简单的案例,读者可以更好地理解机器学习的工作原理。通过本教程,你应该能够理解如何使用Python和机器学习库构建一个简单的房价预测模型。尽管该模型比较基础,但它为你进一步学习机器学习的其他领域打下了坚实的基础。如果你有更多问题或想要深入探讨,请随时留言讨论。
2025-02-26 18:29:13
1104
原创 大模型-Prompt 工程:教你如何“指挥”AI
Prompt 工程就是设计和编写指令(Prompt),让 AI 明白你的需求,然后给出准确、有用的回答。Prompt 就是你输入给 AI 的那几句话,比如“给我讲个笑话”或者“帮我写一篇作文”。但如果问得不好,AI 可能会跑偏,就像你跟朋友说“帮我拿点东西”,朋友却不知道拿什么。所以,Prompt 工程就像是给 AI 一张“任务清单”,告诉它该干什么。例子差的 Prompt:“写点东西。”(AI:写什么呀?好的 Prompt:“写一篇 200 字的日记,讲我今天去公园玩的事。”(AI:明白,马上写!
2025-02-26 14:01:39
695
原创 大语言模型架构:从基础到进阶,如何理解和演变
这些模型的背后有着复杂的架构和技术,但如果你了解这些架构,就能明白它们是如何工作的。今天,我们将用简单的语言,逐步介绍大语言模型的架构,并且展示这些架构是如何随着时间演变的。这些模型基于改进的 Transformer 架构,旨在提高模型的效率和准确性。大语言模型(例如 GPT、BERT、T5)是基于神经网络的计算模型,它们通过分析大量文本数据,学习语言的结构和规律。解码器的作用是生成输出文本。LLAMA 3 是最新的一代模型,相比于 GPT 系列,LLAMA 模型在一些任务上有着更强的性能表现,尤其是在。
2025-02-22 23:20:06
847
原创 大模型采样方法:从简单到复杂,如何生成自然流畅的文本
在大语言模型(如 GPT-4、ChatGPT 等)的应用中,生成自然流畅的文本是一个非常重要的任务。例如,“是”和“不是”两个词的累计概率已经达到 0.8,因此这两个词会被保留下来,剩余的词(如“可能”)会被舍弃。如果模型认为“今天”后面最有可能出现的词是“是”,那么模型就会选择“是”作为下一个词。个词中选择一个进行生成。通过限制候选词汇的数量,Top-k 采样可以避免选择低概率的词,同时增加生成文本的多样性。与 Top-k 采样不同,Top-p 采样会从模型输出概率分布中选择最小的词集合,使得这些词的。
2025-02-19 19:30:45
514
原创 AI 语言模型发展史:统计方法、RNN 与 Transformer 的技术演进
自然语言处理(NLP)是 AI 领域的重要分支,而语言模型(Language Model, LM)是 NLP 的核心技术。本文从技术角度详细分析三种方法的核心原理、优缺点,并探讨 Transformer 如何在 AI 大模型(如 GPT-4)中发挥关键作用。目前,Transformer 是大模型(如 GPT-4、BERT)的核心技术,未来 NLP 发展仍围绕自注意力机制展开。记忆过去的信息,解决了 N-gram 只能处理短上下文的问题。的演进,每一步都在提升模型的表达能力和计算效率。RNN 通过隐藏状态。
2025-02-16 22:51:45
1049
原创 老旧笔记本搭建群晖NAS-释放iCloud资源
下载链接:https://pan.baidu.com/s/1wJW48v27GxF8nrTfiGQp7g?写盘工具:rufus-4.4p。
2024-12-07 23:25:20
468
原创 如何通过python自动化薅短视频APP羊毛
现网各类短视频APP通过刷视频奖励金币来兑换现金的方式来获得更多的用户,我也下载一个视频APP尝试一波,简单一波操作后发现的确可以领到金币并兑换现金,不过很浪费时间,就想试试用python脚本去自动刷视频和任务。一、准备一台闲置的安卓机,为什么是安卓,因为是通过adb来操作手机的。二、电脑装好python环境,不会的话,百度下python安装,python无需安装第三方依赖包,安装完后cmd输入python命令三、电脑安装ADB工具,百度搜索ADB工具安装,安装完成后cmd命令输入adb显.
2020-11-03 15:43:38
2218
原创 高数回顾-函数
函数的定义假设有两个变量x、y,如果对于任意一个x都有唯一确定的一个y和它对应,那么就称x是自变量,y是x的函数函数的三要素定义域:x的取值范围叫做这个函数的定义域,例如:y=logx 的定义域是x>0值域:相应y的全体值叫做函数的值域对应法则:例:y=2x 对应法则是x的2倍等于y常见的作用域:对数,根式,分母,三角函数,反三角函数函数的性态 对单...
2018-08-11 20:50:03
697
原创 docker 容器操作
一、后台运行1.使用-d 参数让容器后台运行:docker -d [NAME]/[CONTAINER ID] 2.docker ps [NAME]/[CONTAINER ID] 查看后台运行的容器的id3.docker attach 容器id 进入容器,注意进入容器exit后,容器则后台不会运行,可以用docker exec -it 容器id 这种方式进入后exit后台继续运行二、查看容器状态1....
2018-04-19 15:30:04
262
原创 Python的垃圾回收机制
进程空间进程运行时需要在内核中占据一段内存空间,用以存储程序和数据。每个进程空间分布如下所示:进程空间的结构text段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。data段:数据段(data segmen
2017-03-22 21:28:03
529
原创 Linux 基础-命令帮助文档,IO重定向及管道操作
linux命令分为两种:内部命令linux内置的指令外部命令对应一个位于文件系统某目录下的可执行程序通过type指令可区分命令类型[root@senlong ~]# type cd # 内部命令cd is a shell builtin[root@senlong ~]# type cat # 外部命令cat is /b
2017-02-11 22:11:00
552
原创 MySQL基础教程
Mysql是最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。下面是MySQL常用的一些命令创建用户CREATE USER 'root'@'%' IDENTIFIED BY 'password';创建用户并赋予指定权限grant create,
2017-01-13 21:46:43
325
原创 Linux的进程优先级 NI 和 PR
为什么要有进程优先级?这似乎不用过多的解释,毕竟自从多任务操作系统诞生以来,进程执行占用cpu的能力就是一个必须要可以人为控制的事情。因为有的进程相对重要,而有的进程则没那么重要。进程优先级起作用的方式从发明以来基本没有什么变化,无论是只有一个cpu的时代,还是多核cpu时代,都是通过控制进程占用cpu时间的长短来实现的。就是说在同一个调度周期中,优先级高的进程占用
2017-01-13 21:35:54
1992
转载 详解Linux系统调优参数
对于Linux系统新手而言,可能对系统调优参数了解的并不多,介绍了Liunx系统最重要的一些调优参数以及它们各自的含义。所有的TCP/IP调优参数都位于/proc/sys/net/目录。例如, 下面是最重要的一些调优参数,后面是它们的含义:/proc/sys/net/core/rmem_max — 最大的TCP数据接收缓冲/proc/sys/net/core/wmem_max — 最
2017-01-08 20:07:32
932
原创 Linux磁盘管理
1. 写在前面在此强调一个Linux的核心机制就是 一切皆文件 。I/O Ports即 I/O设备地址 ,用来标识硬件对应的设备地址,来让操作系统以及cpu使用。CPU的核数不一定就是越多越好,由于 CPU协调 之间的协调问题,可能性能不升反降。2. 设备文件关联至一个设备驱动程序,进而能够跟与之对应硬件设备进行通信设备文件分类
2016-12-27 16:36:36
708
原创 初探-TCP/IP 协议
一、TCP/IP协议族TCP/IP协议族体系结构及主要协议.png1、数据链路层ARP协议和RARP协议,它们实现了IP地址和机器物理地址之间的相互转化ARP协议(Address Resolve Protocol,地址解析协议)RARP协议(Reverse Address Resolve Protocol,逆地址解析协议)
2016-12-26 17:16:15
369
原创 python学习笔记(二)
版本问题 python2与python3是目前主要的两个版本。 python3.0版本较之前的有很大变动,而且不向下兼容。 Python 2.7作为一个过渡版本,基本使用了Python 2.x的语法和库,同时考虑了向Python 3.0的迁移。即2.7版本兼容2.x和3.0的语法 Python 2.7保持了对之前版本的全兼容,而且还包含了Python 3.0的新玩意
2016-12-06 15:36:31
1343
原创 Linux/UNIX 定时任务 cron 详解
定时任务(cron job)被用于安排那些需要被周期性执行的命令。利用它,你可以配置某些命令或者脚本,让它们在某个设定的时间内周期性地运行。cron 是 Linux 或者类 Unix 系统中最为实用的工具之一。cron 服务(守护进程)在系统后台运行,并且会持续地检查 /etc/crontab 文件和 /etc/cron.*/目录。它同样也会检查 /var/spool/cron/ 目录。
2016-11-30 15:01:26
12358
1
原创 python的笔记(一)
Python的基本特点一种动态解释型的编程语言规范的代码: Python 采用强制缩进的方式使得代码具有极佳的可读性。高级语言特性: 封装内存管理等可移植性: 程序如果避免使用依赖于系统的特性,那么无需修改就可以在任何平台上运行解释性: 直接从源代码运行程序,不再需要担心如何编译程序,使得程序更加易于移植。面向对象
2016-11-24 10:40:14
1698
原创 Centos 6.6 编译安装MySQL-5.6.23
1.下载官方源码MySQL:wget http://dev.mysql.com/get/Downloads/MySQL-5.6/mysql-5.6.23.tar.gzCmake:wget http://dev.mysql.com/get/Downloads/MySQL-5.6/mysql-5.6.23.tar.gz2.编译安装MySQL前的准备工作sudo yum
2016-11-22 21:18:23
412
转载 Python 闭包详解
很多高级语言都支持闭包,面试的时候也可能会问到,这可以作为对Python水平的一个参考。先看看百科的解释在计算机科学中,闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。所以,有另一种说法认为闭包是由函数和与其相关的引用环境组合而成的实体。闭包在运行时可以有
2016-11-21 10:44:20
1683
原创 MySQL 主主复制 + LVS + Keepalived 实现 MySQL 高可用性
MySQL复制能够保证数据的冗余的同时可以做读写分离来分担系统压力,如果是主主复制还可以很好的避免主节点的单点故障。但是MySQL主主复制存在一些问题无法满足我们的实际需要:未提供统一访问入口来实现负载均衡,如果其中master宕掉的话需要手动切换到另外一个master,而不能自动进行切换。这篇文章下面要介绍如何通过LVS+Keepalived的方式来是实现MySQL的高可用性,同时解决以
2016-11-19 20:55:57
551
原创 Linux常用命令
下面介绍的都是一些命令行工具,这些工具在几位回答者的日常工作中都很有用。对于任何不了解的命令,请使用“man “查看,或者使用Google。有些命令需要先用 yum, apt-get install 命令安装。1、基本命令了解基本的bash通读整个bash man page.学习VIM在Linux系统上,虽然你
2016-11-19 16:00:10
347
原创 vim 常用操作
分类命令一、打开文件、保存、关闭文件vim filename //打开filename文件:w //保存文件:w atool.org //保存至atool.org文件:q //退出编辑器,如果文件已修改请使用下面的命令:q! //退出编辑器,且不保存:wq //退出编辑器,且保存
2016-11-19 11:24:05
399
原创 RHEL7系统修复
导读RHEL7/Centos7系统发布这么长时间了,大家都知道这个系统的一个特点就是用systemctl代替了init系统守护进程,系统越来越模块化了。在新版的系统中许多的命令也发生了改变,grub也变为了grub2完全看不懂了,网上也有许多的新版本与老版本对比的教程。一直想试一下7版本的系统修复,今天就手一划把系统干掉了,修复ing暴力干掉系统---"rm -rf
2016-11-17 15:45:37
6125
原创 Centos生产环境编译安装LNMP
一、环境准备1、操作系统安装:CentOS 6.564位最小化安装。2、配置好IP、DNS、网关、主机名3、配置防火墙,开启80、3306端口vim /etc/sysconfig/iptables-A RH-Firewall-1-INPUT -mstate --state NEW -m tcp -p tcp --dport 80 -j ACCEPT #允许80端口通过防火墙
2016-11-15 14:10:13
497
grafana-3.0.4-1464167696.x86_64
2016-12-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人