自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 收藏
  • 关注

翻译 VLLM参数解释-中文表格形式

vllm参数-中文

2024-06-21 11:43:41 11810 1

原创 超好用的edge侧边工具-gpt4!

这个AI工具超好用,每天都有免费额度,写文章、总结长视频、画图等,都几秒搞定!快去下载Sider Chrome或Edge插件,薅羊毛!https://sider.ai/invited?c=a7af8c8f3f5dd1ac52be08fbc03d5c55

2024-05-07 19:23:06 319

原创 DB-GPT: Empowering Database Interactions with Private Large Language Models 导读

DB-GPT是一个智能且开放源代码的数据库对话系统,它能够解决各种任务,并在多个基准测试中表现出色。DB-GPT采用了多种技术手段来提高其性能和效率,如知识构造、知识检索、文本到SQL微调等。DB-GPT还具有隐私保护功能,可以在没有互联网连接的情况下运行,并通过代理去识别化技术保护用户数据的安全。

2024-05-07 19:21:42 632

原创 DB-GPT: Empowering Database Interactions with Private Large Language Models 导读

DB-GPT是一个智能且开放源代码的数据库对话系统,它能够解决各种任务,并在多个基准测试中表现出色。DB-GPT采用了多种技术手段来提高其性能和效率,如知识构造、知识检索、文本到SQL微调等。DB-GPT还具有隐私保护功能,可以在没有互联网连接的情况下运行,并通过代理去识别化技术保护用户数据的安全。

2024-01-29 15:40:28 1737

原创 The Rise and Potential of Large Language Model Based Agents: A Survey 中文翻译

长期以来,人类一直追求与或超越人类水平的人工智能(AI),而人工智能代理被视为实现这一目标的有希望的方式。人工智能代理是感知环境、做出决策并采取行动的人工实体。已经有很多关于开发智能代理的努力,但它们主要集中在算法或训练策略方面的改进,以提高特定任务的能力或性能。实际上,社区缺乏一个通用且强大的模型,可以作为设计适应各种情况的人工智能代理的起点。由于它们所展示的各种能力,大型语言模型(LLMs)被认为是人工通用智能(AGI)的潜在火花来源,并为构建通用人工智能代理提供了希望。

2024-01-29 11:02:50 2127

原创 The Rise and Potential of Large Language Model Based Agents: A Survey 导读

论文系统地介绍了基于预训练模型的语言模型(LLM)在智能体研究中的应用,并探讨了其与传统决策框架的结合。提出了将LLM应用于智能体的研究中可以提高任务效率、增强协作能力等优势,并指出了存在的挑战和风险。在评价方面,提出了评估LLM代理人的四个维度:效用、社会性、价值观和持续进化能力,并讨论了如何量化这些特征以及如何解决相关问题的方法。

2024-01-26 16:27:09 1491

原创 大语言模型-幻觉

1、Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Modelshttps://arxiv.corg/pdf/2309.01219.pdfAI海洋中的女妖之歌2、Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedbackhttps://arxiv.o

2024-01-26 15:48:25 741

原创 Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automate

本文提出了一种名为LLM-AUGMENTER的方法,通过使用外部知识和自动化反馈来增强大型语言模型(如ChatGPT)的能力。该方法利用外部知识作为LLM提示的一部分,帮助生成更接地的知识相关的响应,并使用自动化反馈激发模型(如ChatGPT和Instruct-GPT)的“后续纠正”能力以产生排名更高的修订响应。实验结果表明,LLM-AUGMENTER在信息检索对话任务和开放领域维基问答任务中显著减少了ChatGPT的幻觉,并提高了其生成响应的流畅性和信息量。

2024-01-26 15:47:01 899

原创 Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models AI海洋中的女妖之歌导读

本文综述了大型语言模型(LLM)中的幻觉问题,并介绍了当前解决该问题的方法和挑战。文章首先介绍了LLM的基本原理和应用场景,然后详细阐述了幻觉问题的定义、影响以及相关研究背景。接着,作者列举了幻觉问题的来源并探讨了解决方案,包括数据清理、模型调整和评估等方法。最后,文章提出了未来的研究方向和发展趋势。本文的优点在于系统地总结了LLM中幻觉问题的研究现状,全面梳理了相关的研究成果和技术手段。同时,文章也深入剖析了幻觉问题的本质和根源,为后续的研究提供了重要的参考和启示。

2024-01-26 15:29:52 691

原创 Meta-Transformer: A Unifeid Framework for Multimodal Learning 导读

提出了Meta-Transformer框架,能够同时处理12种不同的数据模态,并使用同一组参数来提取表示。实验结果表明,在各种多模态学习任务中,Meta-Transformer表现出了优异的性能,并且比现有方法具有更好的泛化能力。论文提出了一个统一的映射函数F,将来自任何模态的数据x映射到预测值ˆy,并探讨了如何在不同模态之间共享参数以提高模型效率的问题。

2024-01-26 15:14:39 531

原创 MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models 导读

本文提出了一个名为MiniGPT-4的新型视觉语言模型,该模型利用了先进的大型语言模型LLM Vicuna,并结合BLIP-2的视觉感知能力,实现了与GPT-4类似的多种高级视觉语言能力。通过在图像描述数据集上预训练Vicuna并对其进行微调,作者成功地使MiniGPT-4能够生成详细的图像描述、构建网站、解释视觉现象等任务。

2024-01-26 14:31:10 427

原创 大语言模型-任务规划与分解论文

1、Chain-of-Thought Prompting Elicits Reasoning in Large Language Models https://arxiv.org/abs/2201.11903Chain-of-Thought Prompting Elicits Reasoning in Large Language Models2、Tree of Thoughts: Deliberate Problem Solving with Large Language Models https://a

2024-01-26 14:06:30 1601

原创 ART: Automatic multi-step reasoning and tool-use for large language models 导读

本文提出了一种名为ART的框架,可以自动地为大型黑盒语言模型生成多步推理过程,并使用工具库中的外部工具来提高性能。该框架通过检索任务库中与新任务相关的演示文稿,从而实现零样本分解和工具使用。ART提供了一个灵活但结构化的查询语言,使得解析中间步骤、停止生成以调用外部工具以及在包括这些工具输出后继续生成变得容易。此外,用户可以通过更新任务和工具库来修复任何错误或添加新工具,而无需重新训练模型。实验结果表明,ART在多个测试任务上表现优异,特别是在需要算术和算法推理的任务上表现出色。

2024-01-26 13:56:53 2176

原创 Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读

论文提出了一种简单而广泛适用的方法——链式思维提示(chain-of-thought prompting),用于增强大型语言模型的推理能力。通过实验证明,链式思维提示能够显著提高大型语言模型在算术、常识和符号推理等任务上的表现,并且比传统的提示方法具有更强的泛化能力和更小的数据需求。研究结果表明,链式思维提示是一种有效的工具,可以扩展大型语言模型的能力范围,进一步激发了使用自然语言处理技术解决复杂问题的研究方向。

2024-01-26 11:40:54 1582

原创 大语言模型-大模型基础文献

1、Attention Is All You Need https://arxiv.org/abs/1706.03762attention is all you need2、Sequence to Sequence Learning with Neural Networks https://arxiv.org/abs/1409.3215基于深度神经网络(DNN)的序列到序列学习方法3、Neural Machine Translation by Jointly Learning to Align and Tr

2024-01-26 11:36:45 1669

原创 equence to Sequence Learning with Neural Networks 导读

该研究使用了深度学习中的LSTM模型来解决序列到序列的问题,并在WMT’14英法翻译任务中取得了优异的表现。与传统的SMT系统相比,LSTM模型具有更好的性能表现,尤其是在小词汇量的情况下。研究者还通过反转源句子中的单词顺序来改进模型性能,这是一个简单而有效的技巧。

2024-01-26 11:32:07 955

原创 attention is all you need 导读

本文提出了一种新的序列转换模型——Transformer,该模型完全基于注意力机制,取代了在编码器解码器架构中常用的递归层。与使用递归或卷积层的架构相比,对于翻译任务,Transformer可以训练得更快,并且在WMT 2014英语到德语和WMT 2014英语到法语翻译任务上取得了新的最佳表现。此外,作者还计划将注意力机制应用于其他任务,并将其扩展到涉及输入和输出模态的问题,例如图像、音频和视频等。

2024-01-26 11:31:05 1017

原创 Emergent Abilities of Large Language Models 机翻mark

证明通过扩大语言模型可以可靠地提高性能和样本效率在广泛的下游任务。相反,本文讨论了我们称之为大型语言模型的新兴能力的一种不可预测的现象。我们认为如果一个能力不存在于较小的模型中,但在较大的模型中存在,则该能力就是新兴的。因此,仅仅通过外推小模型的性能无法预测新兴的能力。这种涌现的存在提出了一个问题:是否有可能进一步扩展语言模型的能力范围。近年来,语言模型已经彻底改变了自然语言处理(NLP)。

2024-01-26 11:28:31 1508

原创 星火发布之后大家在干嘛?

s

2023-05-06 17:16:29 130

原创 分阶段代码保护思路

对于python代码,首先编写一个源码.py文件,在我们运行的时候会在内存中编译py代码,在内存中表示为pyCodeProject对象,有可重用的模块会编译成.pyc可重用模块,运行结束后写入到磁盘。pyCodeProject和可重用的.pyc文件代码会在python虚拟机上经过python解释器,逐步解释生成机器码用于控制pc。经过上述的过程代码就运行起来了,所以基本上每一个步骤都可以作为代码保护的切入点

2023-04-24 16:22:23 477

原创 AutoML paper following

在传统深度学习的模型构建中,主要包含以下步骤:数据处理、特征工程、模型架构选择、超参数优化、模型后处理、结果分析。这些步骤往往会耗费大量人力和时间。在 AutoML 中,则可以对大部分步骤进行自动处理。自动学习方法已经足够成熟,可以与人类机器学习专家竞争,有时甚至超过他们。简而言之,AutoML可以提高性能,同时节省大量的时间和金钱,因为机器学习专家既难找又贵。因此,近年来对AutoML的商业兴趣急剧增长,一些主要的科技公司和初创公司现在正在开发自己的AutoML系统。其中一些的概述比较可以总结为下表。

2023-04-24 15:16:29 142

原创 什么是MLOps?

MLOps是用于数据科学家和专业运维人员之间协作和交流的一系列实践。应用这些实践可以提高质量,简化管理流程,并在大规模生产环境中自动部署机器学习和深度学习模型,更容易使模型与业务需求以及监管要求保持一致。MLOps正在慢慢演变成一种独立的机器学习生命周期管理方法,它适用于整个生命周期——数据收集、模型创建(软件开发生命周期、持续集成/持续交付)、编排、部署、健康、诊断、治理和业务指标。

2023-04-21 13:55:00 806

原创 如何使用python进行hdfs的操作

使用python进行hdfs的基本操作

2023-01-14 09:48:51 761

原创 Scala中不能使用log

Scala log 报错:error:constructor Logger is in class Logger cannor accessed in class XXX

2022-07-29 17:20:30 197

原创 Python代码混淆技术

Python代码混淆技术

2022-07-05 14:34:56 5026

原创 python code 保护(二)

文章(一)中比较了各python加密方法的优缺点,综合来说通过代码混淆的方式较为常用,其优点是可以兼容平台和不同的Python版本。因此,接下来将介绍较为常用的混肴工具以及其优缺点。pyminifier是一个对Python文件进行压缩、混淆的工具,项目地址 https://github.com/liftoff/pyminifier优缺点pyminifie只能处理单个的文件,部分脚本混肴后可能不可运行,需要手动测试Oxyry Python Obfuscator简介Oxyry Python Ob

2022-06-06 17:18:38 1061

原创 实现精确一次消费

每间隔5s消费者会自动从poll方法获得的最大的偏移量提交到主题中,再均衡之后可能出现重复消费和丢失数据的可能,重复消费:数据丢失:提交偏移量的周期要小于,消费者处理的时长,会出现数据的丢失​使用提交由poll方法返回的最新的偏移量,如果成功提交马上返回结果,提交失败就会跑出异常使用提交由poll方法返回的最新的偏移量,频繁提交在broker响应之前,应用程序会一直阻塞,降低了吞吐量,单一但发生再均衡的情况,会增加重复的数量​ 一步提交还有回调的功能很难确定自动提交偏移量的时机、同步提交和异步提交会出现吞吐

2022-06-06 15:39:59 276 1

原创 Python code 保护方式(一)

  Python优点很多,比如简单易学,代码量少,能做的事很多等等,和其他语言一样,Pyhton也有一些不可掩盖的缺点,版本不兼容,运行效率不高等等。  其中一个缺点,让不少开发者头疼不已,由于Python解释器开源的关系,导致Python代码无法加密,代码的安全性得不到保障。  主流的加密方式主要有使用字节码、创建可执行文件、使用Cython和代码混肴的方式###1)使用字节码  Python解释器在执行代码的过程中,会首先生成.pyc文件,然后再解释执行.pyc中的内容,当然,解释器也能直接执行.py

2022-06-06 15:39:01 507

原创 Spark数据倾斜

Spark数据倾斜一、定义不同的Key对应的数据量不一样,少量的Task被分配到了绝大多数的数据可能会发生数据倾斜数据倾斜的表现:Spark的大部分Task作业正常,只有几个比较慢Spark的某个Task在运行过程中出现了OOM,作业无法正常运行定位数据倾斜问题:检查Shuffle算子的逻辑有没有问题,会不会出现数据倾斜的问题检查Spark的Log文件,会定位到代码的某一行,根据报错去检查对应的Stage的shuffle算子二、解决方案一:聚合原始数据避免Shuffle过程

2021-08-05 21:44:40 135

原创 Spark Shuffle机制

Spark Shuffle在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce;而Reduce阶段负责从Map端拉取数据并进行计算。在整个shuffle过程中,往往伴随着大量的磁盘和网络I/O。所以shuffle性能的高低也直接决定了整个程序的性能高低。一、HashShuffle机制1.1 HashShuffle概述Spark1.6版本之前使用的是HashShuffle。Spark运行分为两个部分:一是

2021-08-02 17:05:33 190

原创 Kafka相关面试题

Kafka一、为什么要使用Kafka削峰:上游的数据下游可能扛不住,Kafka在中间起到调剂的作用,将消息暂存,下游自行拉取解耦和扩展性:消息队列可以作为一个接口层,解耦重要的业务流程异步通讯:不需要上下游同时处理数据,在需要时才回去发布(生产者)或者消费数据(消费者)健壮性:消息队列可以堆积请求,及时消费端业务短时间死掉,也不会影响到业务的正常运行二、Kafka消费过的数据怎么再消费​ Kafka消费信息的offset信息是定义在Zookeeper中的,若果想要重复消费Kafka的消

2021-07-25 16:54:23 202

原创 Scala基础

Scala及函数式编程一、函数式编程的特点函数式编程中,函数作为一等公民,就是说函数的行为和普通变量没有区别,可以作为函参进行传递,也可以在函数内部声明一个函数,那么外城的函数就被称为高阶函数。函数式编程需要定义“变量”都为常量,,但是并不要求必须是常量,这样的特性提高了编程的复杂度,但是可以大大简化并发编程Java中常用的并发模式是共享内存模型,依赖于线程与锁,代码编写不当可能出现死锁和竞争条件,随着线程的增加可能暂用大量的系统资源。Scala这样的函数式编程都是常量,不需要考虑并发性一次赋值

2021-07-23 10:37:32 140

原创 Spark相关面试题(Spark Core)

Spark一、Hadoop和Spark的区别hadoopspark类型基础平台:存储、计算、调度分布式计算框架场景大规模数据集的批处理迭代计算,交互式计算,流计算价格对机器相对要求比较低,廉价对内存要求较高,相对较贵编程范式Map+Reduce,API较为底层,算法适应性差RDD组成的DAG有环无向图,API较为顶层,方便实用数据存储结构存储在HDFS磁盘上,延迟大RDD中间运算结果存储在内存之中,延迟小运行方式Task以进程方

2021-07-22 22:08:41 282 1

原创 Spring Boot基础面试题

Spring Boot一、 @SpringBootApplication**@SpringBootApplication**是三个注解的集合注解@Configuration@EnableAutoConfiguration@ComponentScan作用允许Spring Boot在上下文中注册额外的bean或导入其他配置类启动Spring Boot的自动配置类扫描@Component(@Service,@Controller)注解的Bean,默认扫描该类所在的包下的所有类

2021-07-08 14:03:23 523

原创 JVM相关面试题

JVM一、双亲委派机制概念当某个类加载器需要加载.class文件的时候,它首先把这个任务委托给他的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才回去加载这个类。类加载器的类别BootStrapClassLoader(启动类加载器)java 的核心库java*,构造ExtClassLoader和AppClassLoader。由于引导类加载器设计到虚拟机本地的实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作ExtClassL

2021-07-08 10:43:31 117

原创 Java并发

并发一、线程和进程(JVM)进程是程序的一次执行过程,是系统运行程序的基本单位,系统运行一个程序就是,就是一个进程的创建,运行到消亡线程是相比进程更小的执行单位,一个进程在执行期间包含多个线程,多个线程之间共享堆和方法区每个线程都独立的拥有自己的虚拟机栈、本地方法栈和程序计数器二、 程序计数器为什么是私有的(1)程序计数器的作用字节码解释器通过改变程序计数器来依次读取命令,实现程序的顺序执行,循环、选择、异常处理在多线程的情况下,使用程序计数器来记录当前程序执行的位置,等到程

2021-07-08 10:41:02 124

原创 java集合

Java集合Java集合概述一、List、Set、Map之间的关系List 存储的元素是有序的,可以重复的Set 存储的元素是无序的,不可重复的Map 存储的元素是键值对​ key是无序的,不可重复的​ value是无序的,可以重复的二、 HashMap:jdk1.8之前是数组加链表的形式来存储,数组是HashMap的主体,链表是为了解决Hash冲突问题的。jdk1.8之后采用的就是数据+链表+红黑

2021-07-08 10:37:17 118

原创 JAVA基础

JAVA 基础一、equals 和 == 的区别对于基本的数据类型来说** 是比较的值**,对于引用类型来说==比较的是内存地址equals()不能用于比较基本数据类型,只能判断两个对象是否相等类没有覆盖equals方法:通过比较两个类对象的时候,相当于使用==比较这两个对象是否相等类被覆盖过之后,使用equals()判断两个对象中的属性是否相等二、hashcode() 与equals()方法hashcode()的作用使用hashcode()来计算哈希码,比如在HashSet中

2021-07-08 10:33:34 124

原创 配置多队列的容量调度器配置文件capacity-scheduler.xml报错

项目场景:提示: :问题描述:配置完capacity-scheduler.xml之后启动集群,resourcemanager报错。ERROR: Cannot set priority of resourcemanager process 5501 原因分析: 一般遇到这种情况,第一反应应该是去查看日志,因为bing得到的信息可能大家的情况并不是都一样,比如我这个小问题基本上就不会有人写出来。解决方案:首先查看出错的信息在哪一台服务器上,我的是在hadoop103上,就去这台服务器

2021-06-14 17:29:07 890

原创 CentOS6.5 SSH无密登录 分布式集群环境配置

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档SSH无秘钥登录前言一、关闭防火墙二、ssh无密码登录1. 集群节点修改sshd的配置文件(root权限)2. 集群节点从root切换回要免密码登录的用户Travis(你自己的用户名),执行命令3. master节点 进入/root/.ssh目录,把公钥导入到认证文件4. master节点 执行把另外两台机器公钥导入到认证文件(先要在另外两台机器上创建公钥和私钥)5. master节点 执行把authorized_keys远程c

2021-06-02 13:06:53 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除