- 博客(18)
- 收藏
- 关注
原创 Intern大模型训练营(十):评测 InternLM-1.8B 实践
通过以下命令评测 InternLM2-Chat-1.8B 模型在 C-Eval 数据集上的性能。由于 OpenCompass 默认并行启动评估过程,我们可以在第一次运行时以 --debug 模式启动评估,并检查是否存在问题。在 --debug 模式下,任务将按顺序执行,并实时打印输出。可以看到以下结果中intern2.5-latest大模型在各个数据集上的评分。命令列出所有跟 InternLM 及 C-Eval 相关的配置。按照教程中所示安装相关软件包,然后将数据集下载到本地,通过运行。
2024-11-24 15:19:38
228
原创 Intern大模型训练营(九):XTuner 微调实践微调
本节课程的和都相当清晰,尤其是教程,基本只要跟着文档,在开发机上把指令都相同地输出一遍,就可以完成任务(大赞),相当顺利。因此,这里的笔记就不重复赘述步骤,更多侧重于将教程的知识进行。
2024-11-20 20:45:00
1074
原创 Intern大模型训练营(八):Llamaindex RAG 实践
首先在Intern Studio中申请30% A100的开发机。进入开发机后,创建新的conda环境,命名为llamaindex复制完成后,在本地查看环境。运行conda命令,激活llamaindex然后安装相关基础依赖安装python 依赖包安装 Llamaindex和相关的包下载 Sentence Transformer 模型,运行以下指令,新建一个python文件打开之后下载 NLTK 相关资源:我们在使用开源词向量模型构建开源词向量的时候,需要用到第三方库nltk的一些资源。
2024-11-14 16:05:38
1309
1
原创 Intern大模型训练营(七):LangGPT结构化提示词编写实践
明天上午9:00,市长要来市委党校视察工作情况,请你帮忙写一份开场报告,描述市委党校一年来的政绩情况包括 党课开设、外来领导接待工作、日常培训班开展三方面工作。通过前后对比,可以看到使用了langgpt模块的prompt,产生的公文报告更加贴合场合,内容更加充实丰富,层次鲜明有条理。此处对比可以看到, 加了langgpt的prompt产生的效果更丰富,但是效果并没有太好,langgpt的模块质量不高。prompt如下,有很多冗余的部分(之前的不断的尝试,真正有用的是最后一句)
2024-11-12 00:00:20
756
原创 Intern大模型训练营(五):书生大模型全链路开源体系笔记
综上述,有不少感慨:本人接触ai(或者说大模型领域)较晚,主要由于本科专业并非人工智能领域的,因此对当今的大模型发展的各方面细节和前沿情况了解的不是很多。站在一个ai大模型菜鸟的角度,我发自内心地觉得书生大模型是伟大的!书生大模型全链路的开源力度和广度更是一般的大模型无法比拟的,包括了数据集、预训练框架、微调框架、部署框架、评测体系 、多领域应用。不得不说,书生大模型这一年取得的开源成就斐然!
2024-11-08 19:02:57
366
原创 Intern大模型训练营(四):使用Hugging Face下载模型
通过CLI上传 Hugging Face同样是跟Git相关联,通常大模型的模型文件都比较大,因此我们需要安装git lfs,对大文件系统支持。在 intern_study_L0_4 上传之前下载好的config.json,然后新建一个README.md,粘贴以下内容。创建项目,注意这里不要在之前的intern_build仓库里面创建,本人在这里踩了坑,没注意父文件夹。运行该文件,可以看到,已经从Hugging Face上下载了相应配置文件。进行创建,在创建页面中,输入项目名为。
2024-11-07 23:40:26
1447
原创 Intern大模型训练营(三):自我介绍+构建个人项目
首先在中fork仓库,注意取消勾选“仅选择fork 某个仓库”。来到自己的仓库,选择class分支。在icamp4文件夹下创建新文件,命名为 报名问卷UID.md。填写对应内容,然后点击“commit changes”。回到自己的仓库主页,可以点击“contribute”按钮创建pr,一路点击确定即可。
2024-11-06 23:55:12
242
原创 Intern大模型训练营(二):leetcode习题+Vscode连接InternStudio debug
可知,res不为空,在解析时发生了错误,应该是头部的```json和尾部的```多余了,使得json.loads无法成功解析。然后将需要debug的python代码复制到开发机中,命名为python_debug.py。思路:使用两个数组存储两个字符串中出现的字符,然后一一比较数量。直接运行代码会提示缺少openai库,使用pip命令进行下载。目录下,并成功在一个新建的python文件中引用。新建一个代码文件,输入以下代码引用numpy库。调整以下代码,如下图,方便debug。执行文件,成功输出结果。
2024-11-06 23:21:39
649
原创 Intern大模型训练营(一):InternStudio开发机+Conda环境激活
意味着 SSH 客户端不会记录任何新的主机密钥,也不会检查已有的主机密钥。打开本地的vscode,打开“远程资源管理器”,新建ssh连接,将刚才复制的登录命令输进去。这在自动脚本中常用,但在安全敏感的环境中不推荐使用,因为它会使 SSH 连接容易受到中间人攻击。在开发机中,新建demo文件夹,创建hello_world.py,输入示例代码。在vscode远程连接后,启用终端,首先输入以下内容进行换源,以防下载依赖包太慢。来到InternStudio网站的开发机页面,点击SSH连接,复制登录命令。
2024-11-01 20:08:24
1024
原创 模糊测试学习笔记
这是一个很重要的概念,参考为gcc的一个包装。在gcc编译流程的Assemble阶段,将as替换成afl-as插桩的基本逻辑:在程序代码段中的每个插入了桩代码,并最终再调用as进行真正的汇编。主要调用如下函数,其中trampoline_fmt_64和trampoline_fmt_64是定义的汇编代码,也就是桩代码,MAP_SIZE定义为64K,R(x)定义为(random() % (x)) ,故R(MAP_SIZE))为0~64K的一个随机数。fuzzer程序通过fork()一个子进程,作为。
2024-11-01 18:52:29
991
原创 数据库系统原理复习:难点与总结
恢复系统保证事务的原子性与持续性,并发控制保证事务的一致性与隔离性。可串行化的调度是正确的调度冲突可串行化调度是可串行化调度的充分条件,不是必要条件。举例:串行调度L1=W1(Y)W1(X)W2(Y)W2(X)W3(X)与不满足冲突可串行化的调度的执行结果是一致的,所以L2是可串行的。视图的作用:视图能够简化用户的操作视图使用户能以多种角度看待同一数据视图对重构数据库提供了一定程度的逻辑独立性视图能够对机密数据提供安全保护。
2024-05-27 10:31:54
252
原创 从零开始学diffusion modles
卷积是通过将一个小的卷积核滑动到输入图像上,然后计算卷积核与图像局部区域的元素乘积之和。(一个本子-AI实验室,里面既有前置知识的普及,又有入门学习和深入学习两个理论基础讲解,还有很详细的代码实践教程,在机器学习中,特别是在卷积神经网络(CNN)中,卷积通常用于处理图像数据。2.反向扩散过程(Reverse Diffusion Process) → 去除图片中的噪声。(讲的很详细,有具体过程和详细的公式推导,看不懂是我的问题)(讲的很全面且补充了很多前置知识,但是具体内容比较简要)
2024-05-25 10:56:06
388
原创 软件安全复习(漏洞分析部分)
共同的基本原因:软件在设计、编码、测试和运行阶段,没有发现软件中的各种安全隐患,导致软件的不安全。(1)软件的生产没有严格遵守软件工程流程。(2)大多数系统软件和商业软件结构庞大且复杂,无法持续安全运行(3)编码者没有采用科学的编码方法。(4)测试不到位(不过有时是无法到位)。主要是测试用例的设计无法涵盖尽可能典型的安全问题。错误是指软件实现过程出现的问题,大多数的错误可以很容易发现并修复,如缓冲区溢出、死锁、不安全的系统调用、不完整的输入检测机制和不完善的数据保护措施等;
2024-01-12 16:47:22
1883
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人