自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hallo128的博客

R语言技术分享

  • 博客(98)
  • 收藏
  • 关注

原创 大模型基础:8节课速通语言模型【Deepseek理解必备】

大模型(LLM)的基础:2小时速通语言模型(LM)Deepseek理解必备大模型基础:8节课速通语言模型(LM)

2025-04-03 21:24:25 115

原创 英文学术会议海报poster模板【可编辑】

希望这些模板能够帮助您在国际学术会议上展示您的研究成果,祝您会议顺利!提供了一套学术海报的PPT模板,适用于学术会议、研讨会等场合。竖版,包含11个不同的设计模板。横版,包含4个不同的设计模板。

2024-12-26 23:36:23 788

原创 ElegantBook:优美的 LATEX 书籍模板(中文的latex模版)

ElegantBook 是为 LaTeX 书籍写作而设计的模板,由 Ethan Deng 和 Liam Huang 创立,现在主要由 Ethan Deng、乙醇和死抠维护。直接在overleaf模版里搜elegantbook就有了。

2024-10-27 09:31:25 641

原创 回归模型的增量学习的经典文章和方法

以下内容来自chatgpt:回归模型的增量学习是机器学习的一个重要分支,尤其在处理数据不断到来且无法一次性处理全部数据的场景时,经典方法和文章通常围绕解决灾难性遗忘和模型高效更新展开。

2024-10-24 15:26:58 1165

原创 常见的跨境电商平台对比【总结表】

常见的跨境电商平台对比【总结表】平台目标市场费用结构物流服务支付方式推广工具适合卖家亚马逊全球销售佣金、月租费、FBAFBA支持全球配送多种支付方式广告工具、促销活动有一定资金实力的品牌和卖家eBay全球上市费、成交费第三方物流支持PayPal、信用卡广告工具、促销活动中小型卖家、二手商品卖家速卖通俄罗斯、欧洲、拉美平台佣金、年费AliExpress物流服务支持支付宝等广告工具、促销活动中小卖家、批量销售Wish北美、欧

2024-10-24 15:16:49 569

原创 扩散模型学习顺序推荐

非常建议大家先从VAE(变分自动编码器)到DDPM,VAE可以帮助大家了解扩散目标提出的思路。DDPM是扩散模型最经典和基础的,务必了解。在前期了解DDIM可以先跳过,可以在学了部分后面的内容再了解。目前,我已经进行了不少扩散模型的论文精读,涉及到的论文系列如下,大家也可以按照这个顺序来学习。后续有时间,我再把手写的笔记整理为电子版,再分享给大家。剩下这3块是不同的方向,可以任选一块开始。每块关键的学习内容,见上述。(1)从同一视角理解扩散模型(VAE)(从统一视角理解扩散模型)

2024-10-23 21:47:09 309

原创 扩散模型学习顺序推荐

非常建议大家先从VAE(变分自动编码器)到DDPM,VAE可以帮助大家了解扩散目标提出的思路。DDPM是扩散模型最经典和基础的,务必了解。在前期了解DDIM可以先跳过,可以在学了部分后面的内容再了解。目前,我已经进行了不少扩散模型的论文精读,涉及到的论文系列如下,大家也可以按照这个顺序来学习。后续有时间,我再把手写的笔记整理为电子版,再分享给大家。剩下这3块是不同的方向,可以任选一块开始。每块关键的学习内容,见上述。(1)从同一视角理解扩散模型(VAE)(从统一视角理解扩散模型)

2024-10-23 21:44:49 987

原创 SCI英文文献阅读工具【全文翻译】【逐句翻译】

【代码】SCI英文文献阅读工具【全文翻译】【逐句翻译】

2024-10-19 17:34:51 439

原创 与数据开发或者数据平台搭建有关的数据结构算法(Python实现)

由于 Paxos 和 Raft 的实现比较复杂,面试中更多的是测试对这些算法的理解,而不要求实现。

2024-10-16 10:42:59 763

原创 Python 数据结构和算法面试题,使用 Jupyter Notebook 编写

【代码】Python 数据结构和算法面试题,使用 Jupyter Notebook 编写。

2024-10-16 10:35:43 591

原创 数据结构和算法的常见面试题

这些问题不仅覆盖了常见的数据结构(数组、链表、栈、队列、树、图等),还考察了重要的算法技巧(排序、动态规划、贪心算法、递归等)数据结构和算法是技术面试中的重点,尤其在软件工程师岗位。

2024-10-16 10:23:21 1170

原创 tmux使用

【代码】tmux使用。

2024-10-14 12:22:09 381

原创 703. 数据流中的第 K 大元素 【Python实现:使用heapq完成小顶堆逻辑】

链接:https://leetcode.cn/problems/kth-largest-element-in-a-stream/solutions/2950007/shi-yong-heapqwan-cheng-xiao-ding-dui-lu-dsmv/来源:力扣(LeetCode)

2024-10-14 12:21:14 351

原创 4个步骤搞定远程访问Linux上的Jupyter Notebook(本地浏览器访问)

【代码】4个步骤搞定远程访问Linux上的Jupyter Notebook(本地浏览器访问)

2024-10-12 13:41:25 983

原创 一条代码解决:远程访问Linux上的Jupyter Notebook【创建一个 SSH 隧道:将本地端口转发到远程服务器】

这条命令创建了一个 SSH 隧道,将你本地的 localhost:8889 端口与远程服务器 106.52.196.100 上的 localhost:8889 端口连接起来。使用了 ssh(Secure Shell)来创建一个 SSH 隧道,将本地端口转发到远程服务器。这是 Secure Shell(SSH)协议的命令行工具,用于通过加密通道在本地计算机和远程计算机之间建立安全连接。也就是说,SSH 连接不会打开远程终端或运行任何命令,通常用于配合端口转发,使得你可以不必持续保持一个打开的终端。

2024-10-12 10:48:19 516

原创 机器人研究不同模态之间的融合方法

例如,视觉图像可以帮助机器人定位和识别物体,而触觉数据可以补充视觉的不足,特别是在光线不足或视野受限的情况下。:通常使用时空信息的对齐技术,结合视觉和听觉信号的时序特征,以增强机器人对动态场景的理解。:在机器人导航、物体定位和人机协作任务中,视觉和听觉的融合帮助机器人处理复杂的环境。视觉提供环境和物体的全局信息,而触觉感知物体的局部特征,如材质、温度、摩擦力等。:视觉和触觉的数据通常在空间上不对齐(例如,视觉感知整个场景,而触觉只能感知物体的局部),如何弥合这种差异是研究的重点。

2024-10-11 11:56:06 3552 1

原创 Connecting Touch and Vision via Cross-Modal Prediction【论文十问】

论文的关键解决方案是引入了一种新的条件对抗生成网络(GAN)模型,利用视觉和触觉的配对数据,进行视觉和触觉之间的跨模态预测。尽管跨模态学习已有许多研究,之前的研究主要集中在视觉与听觉、视觉与文本等模态之间的转换,而视觉与触觉的跨模态学习由于数据规模及获取方式的困难性,研究较少。作者面临的主要挑战是视觉和触觉数据之间存在显著的尺度差异:视觉信息覆盖整个场景,而触觉只能感知物体的一小部分。论文提出的科学假设是:通过构建适当的模型,能够从视觉信息生成逼真的触觉信号,反之亦然,即触觉信息能够预测视觉场景。

2024-10-11 11:36:51 635

原创 SCI论文快速排版:word模板一键复制样式和格式【重制版】

再次进入“模板和加载项”中的“管理器”对话框中,这时在“到Normal”列表中可以看到刚才导出的样式和格式,将所有样式和格式选中。功能和用法:本质上讲,模板和普通文档都是 Word 文件,但是模板用于批量生成与模板具有相同格式的数个普通文档,普通文档则是实实在在供用户直接使用的文档。在“参考版式”列表框中显示的是当前文档所使用的样式和格式,将需要的样式选中或全部选中(当引用后再进行修改或删除)。单击“复制”按钮,将“参考版式”中的样式和格式复制到“Normal”中。”按钮,打开“管理器”对话框,单击“

2024-10-10 16:10:39 2521

原创 5分钟英文论文降重工具:DeepL【翻译、改写、缩写】

官方网址:https://www.deepl.com/zh/translator/l/en/en。

2024-10-09 21:29:51 668

原创 Turnitin查重报告的解读方法

关注B站可以观看更多实战教学视频:hallo128的个人空间Turnitin查重报告的解读方法打开Feedback Studio视图,查看查重报告。报告页面显示相似比总分,并按相似度高低列出来源,重复源设有超链接,可点击查看。可在报告页面设置排除某重复源,排除参考文献等。不同颜色标出重复源的位置和比例,例如:黑色表示原创文本紫色表示自我引用蓝色表示0%重复绿色表示1-24%重复黄色表示25-49%重复橙色表示50-74%重复红色表示75-100%重复下载的zip包中包

2024-10-08 16:36:58 852

原创 英文论文安全的免费查重网站

不过请注意,免费工具通常只能提供基础查重功能,对于学术论文的全面查重,付费工具(如Turnitin)会更加准确和可靠。特点: 提供简单易用的免费查重服务,支持英文文本查重。特点: 免费查重工具,可以通过粘贴文本或上传文件进行查重。特点: 集成了语法检查和查重功能,免费版查重不支持大篇幅的文档,可以用来初步检测论文的相似度。特点: 免费版允许每天进行一次查重(限1000字),可以通过复制粘贴或上传文件的方式来检测。安全性: 网站声明不会存储用户的文档,但出于安全考虑,建议在提交前进行适当处理。

2024-10-06 12:58:38 13286

原创 常用的英文论文查重网站

如果需要检测最终版本的论文,最好使用可信赖的付费工具(如 Turnitin),或者先咨询学校是否提供官方查重工具,以确保论文的安全性和隐私性。Unicheck 主要用于学术机构,能够进行大范围的查重,支持与互联网资源、学术数据库以及内部资料库的对比。在使用这些工具时,请注意一些查重工具可能需要付费才能访问完整的功能,建议根据具体需求选择合适的查重平台。这是一个免费的在线工具,适合进行基础的论文查重。Plagramme 是一个多语言支持的查重工具,用户界面友好,提供详细的相似度分析报告。

2024-10-06 12:50:26 825

原创 Binding Touch to Everything: Learning Unified Multimodal Tactile Representations【主要工作】

统一多模态触觉表示模型:通过将触觉嵌入与预训练的视觉嵌入对齐,利用对比学习,实现了触觉与其他模态的共享多模态嵌入空间。任务统一与扩展:UniTouch统一了许多现有的触觉感知任务,并显著扩展了触觉感知可以应用的任务范围。共享多模态嵌入空间:通过将触觉嵌入与预训练的视觉嵌入对齐,利用对比学习,实现了触觉与其他模态的。本文提出了一个名为UniTouch的统一多模态触觉表示模型,专门用于基于视觉的触觉传感器。探索更多的跨模态任务:除了已经涉及的任务,未来的工作可以探索更多的跨模态任务,如。

2024-09-29 20:15:18 741

原创 vscode环境迁移

查看浏览器地址 最后那一串字符串就是你的 gist Id https://gist.github.com/{username}/{gist_id}快捷键Ctrl+Shift+P 打开命令面板,输入download setting(下载配置命令为download setting)快捷键Ctrl+Shift+P 打开命令面板,输入upload setting。gists id : XXX【自己的】即可打开settings.json。setting.json文件中增加。解决方法:登陆GitHub。

2024-09-29 17:57:13 1040

原创 How FAR ARE WE FROM AGI?(ICLR AGI Workshop 2024)概览

这些模型显示了非凡的能力,有时在特定领域与人类的能力相当,甚至超过人类的能力,暗示着图灵测试的某种形式正在通过。我们正在看到这些模型扩展的有希望的迹象,如人工智能代理利用工具,从外部数据库检索,显示推理能力,通过编写代码竞争复杂的任务,多模态学习与文本和图像等。影响的关键问题变得至关重要,例如,将 AGI 的价值观与人类的多样化信念集合相一致,导航道德困境,确保 AGI 能够做出道德决策,并解决生成性 AI 的安全风险。然而,尽管这些进展很有希望,但目前的 LLM 和真正的 AGI 之间的差距仍然很大。

2024-09-29 11:13:30 1281

原创 华为综合面试算法1题

有两个城市A与B,相距50 km,我们有100根胡萝卜希望由A地运送到B地;有1头小毛驴,每次最多可以承载50根胡萝卜,且其每行走1 km就要吃掉1根胡萝卜;请问最终可以运送到B地的胡萝卜个数最多为多少?关键在于一次性毛驴只能带 50 根,所以毛驴必须返回,每次按最大载重 50 带。(1)假设一公里就折返带,那么“来+回+来”,1 公里就得消耗 3 根胡萝卜。(2)直到能一次性只剩

2024-09-27 10:43:10 876

转载 【转载】Flow Matching: 一种新兴的生成模型训练框架

Flow Matching是近年来兴起的一种连续正规化流(Continuous Normalizing Flow, CNF)模型训练框架,由Yaron Lipman等人于2022年首次提出。训练过程更简单,不需要复杂的采样和反向过程生成质量和扩散模型相当,在某些任务上甚至更优推理速度更快,可以实现一步生成理论基础更加扎实,与最优传输理论密切相关这些特点使得Flow Matching受到学术界和工业界的广泛关注,成为生成模型领域的研究热点之一。

2024-09-25 11:50:13 1590

原创 【最详细公式推导:表 1】Elucidating the Design Space of Diffusion-Based Generative Models 【论文精读】

【公式推导表 1】Elucidating the Design Space of Diffusion-Based Generative Models 【论文精读】

2024-09-22 20:30:17 1783

原创 model_flops: 计算模型的浮点运算数(FLOPs)

【代码】model_flops: 计算模型的浮点运算数(FLOPs)

2024-09-21 22:55:06 549

原创 【LLM】吴恩达『微调大模型』代码笔记(03_Instruction_tuning_lab_student)【如何进行推断函数定义】

通过 AutoTokenizer 从预训练模型 EleutherAI/pythia-70m 加载分词器(tokenizer)。# 通过 AutoModelForCausalLM 从同样的预训练模型 EleutherAI/pythia-70m 加载因果语言模型(Causal LM),该模型用于生成文本# 定义一个函数 inference,用于进行推理。

2024-09-21 20:51:17 823

原创 面向开发者的LLM入门教程(学习笔记02):提示原则

提示词执行以下操作:首先,用一句话概括三个反引号限定的文本。第二,将摘要翻译成英语。第四,输出包含以下键的 JSON 对象:英语摘要和人名个数。要求 GPT 生成三本书的标题、作者和类别,并要求 GPT 以 JSON 的格式返回给我们,为便于解析,我们指定了 Json 的键。如果任务包含不一定能满足的假设(条件),我们可以告诉模型先检查这些假设,如果不满足,则会指出并停止执行后续的完整流程。将Prompt加以改进,该 Prompt 前半部分不变,同时。虚假知识:模型偶尔会生成一些看似真实实则编造的知识。

2024-09-18 15:37:59 526

原创 面向开发者的LLM入门教程(学习笔记01)

大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序。

2024-09-18 14:48:52 691

原创 kaggle竞赛(Deepfake检测)的核心流程【notebook 运行演示】

(1)首次开启代码,需要等待notebook远程下载数据,预计等待15分钟。(3)output下载提交文件submit.csv,平台提交。(2)Run All,等待40分钟左右。(1)点击右上角:Edit。

2024-09-17 12:24:31 376

原创 从kaggle竞赛零基础上手CV实战(Deepfake检测)

随着人工智能技术的迅猛发展,深度伪造技术(Deepfake)正成为数字世界中的一把双刃剑。这项技术不仅为创意内容的生成提供了新的可能性,同时也对数字安全构成了前所未有的挑战。Deepfake技术可以通过人工智能算法生成高度逼真的图像、视频和音频内容,这些内容看起来与真实的毫无二致。然而,这也意味着虚假信息、欺诈行为和隐私侵害等问题变得更加严重和复杂。为了应对这一挑战,我们举办了“外滩大会 - 全球Deepfake攻防挑战赛”。该挑战赛旨在邀。

2024-09-17 12:01:58 1078

原创 深度学习中常见的损失函数

损失函数是衡量神经网络输出与真实标签之间差距的指标。在训练过程中,神经网络的目标是最小化损失函数的值。常见的损失函数包括均方误差(MSE)损失函数、交叉熵(Cross-Entropy)损失函数等。损失函数的选择取决于任务的需求和输出数据的类型。这些损失函数各有特点,适用于不同的场景和问题。在实际应用中,需要根据具体任务和数据集的特点来选择合适的损失函数。

2024-09-09 10:51:47 411

原创 《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》【阅读笔记】

Efficientnet论文原文:https://arxiv.org/abs/1905.11946。

2024-09-09 09:11:17 440

原创 python计算AUC

使用的是sklearn中的roc_auc_score () 方法。要保证真实标签和预测标签是一一对应的。

2024-09-09 08:54:41 475

原创 【公式推导】EDM利用Fourier傅里叶变换求解热方程【公式6】【附录B.5.1】【论文精读】

傅里叶变换的性质:https://blog.youkuaiyun.com/qq_45732223/article/details/109104813。热方程|齐次初值问题:Fourier变换法:https://zhuanlan.zhihu.com/p/535610518。高斯分布的傅里叶变换两种不同解法:https://zhuanlan.zhihu.com/p/667898170。傅里叶变换的优势:https://zhuanlan.zhihu.com/p/35062896。(1)由于边缘密度为卷积,故找到一个PDE。

2024-09-04 16:37:49 484

原创 The Llama 3 Herd of Models【论文原文下载】

现代人工智能(AI)系统由基础模型驱动。本文介绍了一组新的基础模型,称为 Llama 3。它是一群原生支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个密集型 Transformer,具有 405    B {405}\mathrm{;B}405B 参数和高达 128    K {128}\mathrm{;K}128K 个令牌的上下文窗口。本文对 Llama 3 进行了广泛的实证评估。我们发现 Llama 3 在众多任务上与 GPT-4 等领先语言模型相比质量相当。

2024-09-04 16:25:56 560

原创 Seaborn无法加载数据集,URLError: <urlopen error [Errno 61] Connection refused>

seaborn.load_dataset加载本地数据时往往会报错,本地没有该数据,而尝试联网下载数据,但是seaborn在国外,国内很难连上网。如果这个地址也打不开,那就网盘:https://pan.baidu.com/s/1Emx4J2KeDAS3yOIRkUG4Ag?load_dataset预留了通过本地来加载数据的接口,只需要提前将数据下载下来,然后从本地加载。地址:https://github.com/mwaskom/seaborn-data。

2024-08-20 13:08:52 435

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除