自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Everyday try to become better -Kobe Bryant

发上等愿结中等缘享下等福;向高处立就平处坐从宽处行;-左宗棠

  • 博客(279)
  • 资源 (10)
  • 收藏
  • 关注

原创 DataGen:通过LLM生成更好的合成数据(ICLR 2025)

LLM生成数据集

2025-03-23 10:42:21 119

原创 simpleGRPO实现分享)

simpleGRPO

2025-03-11 19:39:34 114

原创 deepseek-r1及相关研究

两篇文章的核心特点是:用很小的数据做SFTLIMO:突破了原有假设,SFT需要很多数据;转向了高质量数据下的SFT,进需要少量的样本;Base具有这个能力,SFT只是激活这个能力;s1: 使用的策略并不关键(budget forcing)

2025-03-03 17:11:20 423

原创 unsloth配置

【代码】unsloth配置。

2025-02-28 11:37:12 147

原创 Cursor编程助手-10分钟做项目:从下载到快速上手个人经验分享

Cursor选择数据偏好(就是隐私问题,你是否同意使用你的数据用于优化软件体验,包括你自己的开发,有隐私问题的可以考虑关掉,否则开着就好,后期可以改)以及无限制的初级模型调用(20250217 给的是免费的gpt-4o-mini 无限次调用,很良心

2025-02-17 16:38:57 730

原创 MAC一套键鼠同时控制其他windows设备

sharemouse mac和windows共享一套键鼠

2024-12-24 15:30:47 232

原创 windows安装vmware

同样的aliyun平台中的ubuntu 24.04.1这个版本实测可行。无法ping通 google.com。centos7这个版本实测可行。

2024-12-24 11:26:28 237

原创 阿里云新用户服务器配置

创建实例,点击左侧标签栏总的实例,找到链接帮助根据帮助中的ip信息,然后启用vscode的ssh链接ctrl+p选择配置,输入公网的ip即可passwd修改root密码。

2024-12-23 22:19:53 364

原创 macbook外接2k/1080p显示器调试经验

电脑满足电脑和显示器要求的hdmi线或者转接头或者扩展坞betterdisplay软件。

2024-11-19 01:22:22 1455

原创 群晖NAS-经验分享

因此我们选择同步任务中的单向上传,而且删除本地文件后,服务器端的文件仍然保留,当我们需要找已经被删除的文件的时候,只需要去nas当中找就好了。由于我们的目标是删除本地任务后,远程端仍然有备份。保证我们可以自由决定本地端留下什么,存储需要多少。创建同步任务,选择需要备份的本地磁盘以及远程存储的位置。macbook中安装并启动:SynologyDrive。

2024-10-30 14:34:16 246

原创 Git使用教程

对git中的文件进行修改之后,会发现文件出现了不同的状态变化;

2024-10-22 17:57:46 369

原创 LLM Inference Scaling Law

paper address:https://arxiv.org/abs/2408.00724

2024-10-17 14:36:36 201

原创 openai_api和doc文档的实验笔记和内容解读

错误原因:openai.ChatCompletion.create(proj:MAD)api调用的问题,以及一些旧版的api的内容,可以在api 应用程序接口 中找到。大多数的内容都可以从官方文档的搜索当中找到。最新的调用代码应该参考官网为。

2024-10-17 00:04:57 809

原创 MAC备忘录空白解决方案

取消勾选同步此MAC后再次勾选,然后点击完成即可。打开icloud->备忘录。

2024-10-05 12:17:21 971

原创 介绍GPT-o1:一系列解决困难问题( science, coding, and math )的推理模型

这里有一个问题,就是,所招募的专家测试结果是找的各个专业的phd做完整的测试,然后取精确率的平均值作为对比数值,还是请他们分别做自己所属专业的部分试题,然后将结果汇总作为专家结果。我们认为,使用思维链可以在安全性和一致性方面取得重大进展,因为(1)它使我们能够以清晰的方式观察模型思维,(2)关于安全规则的模型推理对分布外的场景更稳健。然而,为了实现这一点,模型必须能够以不变的形式自由表达其思想,因此我们无法将任何政策合规性或用户偏好训练到思想链上。例如,在未来,我们可能希望监控思维链,寻找操纵用户的迹象。

2024-09-23 11:29:26 1274

原创 textattack工具报错分析

【代码】textattack。

2024-08-29 21:41:30 325

原创 KAN vs MLP

KAN基于表示定理:任意一个多元函数,可以用多个单元函数复合(例如+法)表示出来。不需要用特别深的神经网络。定理的不好的点:没有描述单元函数本身有多复杂。

2024-08-27 11:20:48 428

原创 PaddleNLP 3.0 支持大语言模型开发

huggingface不支持模型并行。张量并行,不满足大规模预训练的需求。1、组网部分 2、数据流 3、训练器 4、异步高效的模型存储。

2024-08-22 21:23:59 590

原创 ReFT: reasoning with reinforced Fine-Tuning

用influence function来衡量新增一条数据对于模型训练的整体的影响。对比随即筛选和reward model筛选(开源的,用于对齐人类便好)。从一个question中看到多种多样的cot,都可以从中学习。思考增加或者减少一条数据,对于模型训练的影响。高质量的数据能够对主题产生正向的支持/反对。高质量的数据能够对模型产生正向的影响。使用最后一层MLP的梯度,聚类找出。数据的质量是模型自己来定义的。

2024-08-20 20:56:21 446

原创 预训练语言模型实践笔记

在使用像BERT或RoBERTa这样的transformer模型时,和是两个不同的概念。: 这是一个布尔值,决定了模型是否应该返回所有隐藏层的输出。如果设置为True,模型将返回一个元组,其中包含每一层的隐藏状态。这对于某些任务(如特征提取或fine-tuning)可能是有用的,因为不同的隐藏层可能会捕获不同类型的信息。: 这是模型的最后一个隐藏层的输出,通常用作下游任务的输入(如文本分类或命名实体识别)。这是模型的主要输出,通常包含了输入序列的高级表示。在大多数情况下,您只需要。

2024-07-22 14:35:56 1366

原创 计算机顶会论文检索途径和方法

计算语言协会有一个专门的网站,ACL系列的论文都会包括在其中,如果检索自然语言相关的论文,可以直接来ACL当中通过关键词检索就可以了。点击click to fetch all获取本次会议所有论文的标题,然后根据ctrl+f,利用浏览器根据标题检索论文即可。进入网站之后,选择会议以及会议年份,会显示每一年的官方网站,或者直接有论文列表。网址中会有会议年份选择和论文列表选择,进入论文列表之后直接根据关键词检索即可。如果没有论文列表,则考虑进入此页面中的会议官方网址,选中对应会议,进入检索论文即可。

2024-07-17 16:31:48 5316 1

原创 基于Pushdeer(类似于Server酱)的任务完成提醒+wandb可视化模型训练结果

然后在代码运行的主文件夹中,引入当前程序的跟路径(一般是程序所在的主文件夹);然后倒入pushdeer模块,并调用该模块下的push_deer()方法,发送消息推送。.py文件是模块 含有.py文件以及__init__.py文件的文件夹是包。会得到设备的key,目前没有推送限制,一天50条。

2024-07-15 23:07:15 399

原创 LLM驱动的产品开发(AI大模型创意训练营)

机遇机遇1:LLM通用数据分析能力,降低函数/借口的开发门槛机遇2:LLM的强大知识问答能力,打破开发者的专业壁垒机遇3:LLM的格式化内容生成能力,提升数据的供给效率机遇4:LLM的函数编排能力,重塑产品的自动化程度机遇5:LLM对数据飞轮的天然要求,增强产品的价值说服力

2024-07-15 17:04:33 1020

原创 贝叶斯公式、先验概率、后验概率、似然

先验概率:在观察数据之前,我们对某一事件或参数的初始信念。似然:在给定参数的条件下,观察到某一数据的概率。后验概率:在观察数据之后,结合先验概率和似然更新后的信念。贝叶斯公式将先验概率和似然结合起来,提供了一个更新信念的系统方法,从而得到后验概率。通过这种方式,我们可以在有新数据时不断更新和改进我们的模型和预测。

2024-07-01 23:43:04 3106 2

原创 小红书2024LLM论文分享

什么样子的模型是强模型?是一个直观比较的结果:Acc在这个任务上越好,则认为它越强。随着各大机构的模型越来越强,评估任务越来越复杂,如何在未来更加复杂的任务下评估LLM的能力。

2024-06-27 20:35:06 463 1

原创 弱监督学习

弱监督学习(Weak Supervision)是一种利用不完全、不精确或噪声数据进行模型训练的方法。

2024-06-26 22:53:15 823

原创 大模型应用开发实践:RAG与Agent

planning是任务拆解的一些方法。

2024-06-20 21:34:01 415

原创 2024北京智源大会——以大模型为核心主题

2023是LLM的元年,2024看起来是LLM的全行业泛化阶段。

2024-06-14 10:19:57 292

原创 少样本学习&元学习

首先是机器学习:然后,什么是元学习(what is meta learning?之前,Component都是让人自己设置的。在Meta Learning中,我们期望它能够自己学出来。不同的meta learning方法就是想办法去学learning algorithm中不同的component。在一般的ML里,L是用训练资料进行计算的。而在meta-learning里面,l是用测试资料进行计算的。

2024-06-13 16:43:50 1044

原创 强化学习-tutorial

当你发现收集有标注的数据困难,正确答案人类也不知道是什么的时候,往往是考虑使用RL的时候。尽管机器不知道答案是什么,但是机器会知道什么好,什么不好,通过与环境互动获得奖励。

2024-06-13 13:51:49 276

原创 Macbook Air M1配置双屏或三屏显示-基于Displaylink软件

Dell D3100扩展坞及其配件(海鲜市场扩展坞D3100、Dell 65W电源、B-C数据线 = 130元左右)

2024-06-12 13:43:45 2298

原创 Workshop on Argument Mining (ArgMining) 历届会议信息

论点挖掘,作为一个自然语言处理当中的重要任务,伴随着各大NLP顶会已经组织了11届workshop(2024年第11届跟随着ACL2024主会开办)

2024-06-11 15:18:26 988

原创 Huggingface-tutorial总结

【代码】Huggingface的Transformer库经验总结。

2024-06-08 11:23:55 481

原创 人工智能模型的结构化代码分析与复现方法(pytorch深度学习类、LLM类)

(模型架构)定、数、模、训、测、上;(数据挖掘)分、理、洗、构、选、提;

2024-06-06 20:52:44 340

原创 AI音乐生成流程

suno.com。

2024-06-04 21:43:13 567

原创 PPT设置为本框的默认格式以及固定文本框

双击文本框之后勾选如下三个位置。

2024-06-04 15:00:45 2123

原创 NLP课程笔记-基于transformers的自然语言处理入门

于是学习的问题就拆解为:1. 什么是seq2seq模型?2. 基于RNN的seq2seq模型如何处理文本/长文本序列?3. seq2seq模型处理长文本序列时遇到了什么问题?seq2seq模型的输入可以是一个(单词、字母或者图像特征)序列,输出是另外一个(单词、字母或者图像特征)序列。seq2seq是一种常见的NLP模型结构,全称是:sequence to sequence,翻译为“序列到序列”。顾名思义:从一个文本序列得到一个新的文本序列。潜在的答案:基于循环神经网络(RNN)一类的seq2seq模型,

2024-05-31 17:25:09 698

原创 生成式AI导论2024-李宏毅

当你用类神经网络(模型)来表达这上万个参数的时候,你做的事情就是深度学习。生成式人工智慧是什么?生成式AI的入门课程。

2024-05-26 21:02:00 843 1

原创 ACL文献分享:DiaASQ : A Benchmark of Conversational Aspect-based Sentiment Quadruple Analysis

Aspect-based sentiment analysis (ABSA) 是一种细粒度的情感分析方法,旨在确定文本中不同方面的情感。具体来说,它不仅识别出文本的整体情感(如正面或负面),还识别出针对特定方面或属性的情感。例如,在一篇关于手机的评论中,ABSA 可以识别出用户对电池续航、屏幕质量、价格等不同方面的情感态度。ABSA 的应用非常广泛,可以用于产品评论分析、客户反馈分析、社交媒体监控等领域,帮助企业更好地理解客户对不同产品或服务方面的满意度和不满之处,从而做出更有针对性的改进。

2024-05-23 19:49:36 394

原创 ACL论文分享:从零开始生成多模态共情回复

王培东:多模态大模型的架构与训练。

2024-05-22 18:45:07 308 1

sharemouse-window v6.0.62(实际安装后显示v6.0.60,与官方一致)

sharemouse-window v6.0.62(实际安装后显示v6.0.60,与官方一致)

2024-12-24

sharemousemac v6.0.62

sharemousemac v6.0.62

2024-12-24

芯片检测数据集(三列:x1,x2,y)是一个分类数据集,适用于逻辑回归模型

芯片检测数据集(三列:x1,x2,y)是一个分类数据集,适用于逻辑回归模型。 标签y是0或1

2022-07-19

BibTeX Export using EN Label Field

https://blog.youkuaiyun.com/adreammaker/article/details/123934243 https://zhuanlan.zhihu.com/p/135217810 资源使用参考该链接

2022-05-21

Endnote参考文献输出格式完整版 发布时间2021年7月15日 由于网络原因,下载慢,因此上传一下 只需5个积分

BibTeX Export Citation Style: None Date: Thursday, July 15, 2021 Discipline: Export File Name: BibTeX Export.ens Publisher: Oren Patashnik URL: Based On: Bibliography Sort Order: Author-Year-Title BibField1: Label BibField2: Author BibField3: Title Indent: N

2022-05-21

BlackHole 2ch 和 16ch压缩包 macbook M1

BlackHole 2ch 和 16ch压缩包 macbook M1 用于建立录制电脑内置音频的通道

2022-04-28

codeblocks-20.03-setup.exe

官方正版开源软件,windows版本,如需要其他版本请去官网http://www.codeblocks.org/下载即可。

2020-04-24

Fences+v3.0.8桌面管理工具安装包+教程.zip

Fence是一款占用内存极少,运行效率极高的电脑桌面管理工具。尤其适合桌面十分杂乱的办公室人群。该软件一定不会让你失望的。

2020-01-31

starUML工具

StarUML3.0.2版本替换文件,到安装目录的sources直接替换即可,建议备份原文件,其他版本没试过,可以换换试试,具体原理看我的文章。

2019-01-19

Matlab中各种神经网络算法的使用实例

自己做实验的时候用到的一个资源,感觉还不错,分享出来,希望对你有所帮助,顺表捞点资源,无用不会发,放心下载。

2019-01-04

javax.servlet api.chnm中文版

2016-12-30

SDUST_java实验题目汇总

实验1结构化程序设计(2学时) 一、实验目的 1. 掌握使用JDK和记事本开发Java程序的方法和步骤; 2. 熟悉Java语言的基本语法。 二、实验内容 使用记事本和命令行程序编写以下Java应用程序。 1. 编写一个类的方法,判断某一年是否为闰年。闰年的条件是符合下面二者之一:能被 4 整除,但不能被 100 整除;能被 4 整除,又能被 100 整除。 2. 编写程序打印出所有的水仙花数。 3. 编写程序打印出100以内的素数。 4. 编写程序求1!+2!+……+20! 5. 编写一个类的方法,其输入参数为一个整数,输出为该整数各个位上的最大数字。 6. 编写程序输出九九乘法表。 三、实验要求 完成程序并提交代码。

2016-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除