- 博客(99)
- 资源 (2)
- 收藏
- 关注
原创 Web前端技术详解(JavaScript篇)
学习网址:https://wangdoc.com/javascript/index.html1. JavaScript特点动态类型语言:变量类型无限制,可随时改变类型。 变量提示(hoisting):JavaScript引擎工作时,先解析代码,获取所有被声明的变量,然后一行行运行。结果导致所有的变量声明语句被提升到代码头部,即变量提升。2. 基本语法语句与表达式: 语句(s...
2018-07-09 23:49:36
1400
原创 【Java核心技术/IO】35道Java IO面试题与答案
Java IO是Java提供的用于输入输出操作的API,主要处理文件、网络连接等数据的读取和写入,核心是“流”(Stream)的概念。缓冲流是包装普通流的“增强流”(如 BufferedReader 、 BufferedOutputStream ),内部维护一个缓冲区(内存数组)。作用:减少IO与磁盘/网络的直接交互次数,提升读写效率(内存操作比硬件操作快得多)。节点流:直接连接数据源/目标的流(如 FileInputStream 直接读文件),是IO操作的“基础流”,必须存在。
2025-10-07 16:16:12
99
原创 【Java核心技术/多线程】35道Java多线程面试题与答案
答案:线程是进程内的执行单元,是CPU调度的最小单位;进程是资源分配的最小单位,一个进程可包含多个线程。核心区别:进程间资源独立,线程共享进程的内存/文件句柄等资源,线程切换成本远低于进程。Java中创建线程的3种方式是什么?答案:继承 Thread 类,重写 run() 方法;实现 Runnable 接口,重写 run() 方法,将实例传给 Thread;实现 Callable 接口,重写 call() 方法(可返回结果、抛异常),结合 FutureTask 使用。
2025-10-06 15:54:49
86
原创 【Java核心技术/集合】30道Java集合框架面试题及答案
摘要:本文整理了Java集合框架30道核心面试题及答案,涵盖了集合框架的主要组成部分、List/Set/Map区别、ArrayList/LinkedList/HashMap等常用集合的实现原理与区别、线程安全方案、排序机制、扩容策略等核心知识点。内容还包括ConcurrentHashMap、CopyOnWriteArrayList等并发集合的实现原理,以及Stream API、LRU缓存设计等高级应用场景,全面总结了Java集合框架的关键面试考点和技术要点。
2025-10-05 20:13:37
181
原创 【Java核心技术/基础】25道Java基础面试题及答案
本文整理了25道Java核心技术面试题及答案,涵盖基本语法、面向对象、集合框架、多线程、JVM等核心内容。重点包括:Java基本数据类型、JDK/JRE/JVM区别、OOP特性、final/static关键字作用、集合框架接口、HashMap原理、线程创建方式、synchronized/volatile区别、JVM内存结构、GC机制、字符串类比较、反射机制等。每个问题提供简明答案,并引用相关技术点(如类型擦除、类加载过程等),适合系统复习Java核心概念,为面试提供可靠参考。
2025-10-03 21:56:51
168
原创 AOP常见面试题
AOP(Aspect-Oriented Programming,面向切面编程)是一种编程范式,核心思想是**“将与核心业务无关、但多个模块共有的逻辑(如日志、事务、权限)抽取为‘切面’”**,在不修改原有业务代码的前提下,通过“动态织入”的方式作用于核心业务方法,实现代码解耦。4. Spring AOP的切入点表达式有哪些常用类型?1. AOP的织入时机有哪几种?Spring AOP用的是哪种?1. Spring AOP和AspectJ的区别是什么?2. AOP中的核心术语有哪些?1. 什么是AOP?
2025-09-07 16:59:27
218
原创 Java设计模式面试题
Java设计模式是一套反复验证、用于解决特定场景下代码设计问题的“最佳实践”,核心作用是提高代码的可复用性、可维护性和可扩展性,降低模块间耦合。1. “Spring中的Bean默认是单例,它是如何保证线程安全的?2. 设计模式的六大原则(SOLID原则)分别是什么?1. 什么是Java设计模式?它的核心作用是什么?
2025-09-07 16:50:46
95
原创 AI大模型应用研发工程师面试知识准备目录
一、大模型核心基础理论二、大模型应用开发技术栈(一)开发语言与工具(二)模型部署与优化三、大模型应用场景与实战四、数学与算法基础五、工程化与系统设计六、业务理解与产品思维
2025-09-06 10:18:36
236
原创 大模型预训练提示词数据来源与样例概述
大模型的预训练阶段的提示词(Prompt)数据作为引导模型学习的关键输入,其来源与质量直接影响模型性能。本文从数据来源、典型样例及技术挑战三个维度,系统梳理大模型预训练提示词数据的生态体系。
2025-08-20 17:00:35
111
原创 LLaMA-Factory 微调 Qwen2-VL 进行人脸情感识别(二)
本文详细介绍了微调后的Qwen2-VL人脸情感识别模型的调用方法。主要内容包括:1) 环境准备与依赖安装;2) 加载微调模型和图片处理器;3) 图片预处理流程;4) 模型预测函数实现;5) 结果输出方式。文中提供了完整的Python代码示例,涵盖从模型加载到情感预测的全流程,并特别强调了注意事项,如模型路径设置、标签一致性等。该代码可直接应用于实际场景,实现对图片情感状态的识别功能。
2025-06-06 11:15:20
274
原创 Deepseek核心技术:模态穿透技术的实现原理与过程
其核心在于通过共享表征空间和跨模态知识迁移,打破模态壁垒,实现跨模态的语义对齐与协同推理。尽管面临模态对齐、计算效率和数据稀缺等挑战,但通过对比学习、稀疏注意力和模态压缩等技术,模态穿透技术已在智能教育、机器人控制和医疗诊断等领域展现出巨大潜力。未来,随着全模态统一模型和边缘计算优化的推进,模态穿透技术有望推动AI技术从云端向终端渗透,开启普惠AI的新纪元。,打破不同模态(如文本、图像、音频)之间的信息壁垒,实现跨模态的语义对齐与协同推理。模态穿透技术的实现过程是一个从。
2025-05-05 16:52:45
215
原创 DeepSeek技术发展详细时间轴与技术核心解析
DeepSeek技术发展详细时间轴与技术核心解析2023年2024年2025年模型架构创新训练与推理优化多模态与通用能力拓展开源生态与硬件协同
2025-05-05 16:38:33
4273
原创 视觉标记token:解锁AI视觉理解新维度的钥匙
视觉标记token是计算机视觉模型中用于编码和解码图像或视频信息的基本单元。它们将连续的、高维的图像数据转换为离散的、低维的token序列,使AI模型能够高效处理、存储、传输和分析视觉内容。这一概念类似于自然语言处理中的“词”或“子词”,但专为视觉数据设计。视觉标记token作为连接图像与高级AI理解的“精密钥匙”,正引领计算机视觉领域的新变革。它不仅提升模型对视觉数据的理解和处理能力,还为多模态AI的发展奠定基础。
2025-04-30 15:04:20
249
原创 专家微调 2:专家微调技术详解(附代码与实战策略)
专家微调通过针对性优化,使预训练模型成为特定领域的“专家”。结合代码实践与关键技术(如LoRA、Adapter Tuning),可显著提升模型在垂直领域的性能。未来,随着自动化工具和多模态技术的发展,专家微调将进一步推动AI工业化落地。
2025-04-30 14:45:31
300
原创 专家微调 1:让AI模型成为特定领域的“行家里手”
专家微调是一种针对特定领域或任务,对预训练模型进行优化调整的技术。领域适配:通过引入特定领域的数据和知识,使模型更好地理解该领域的术语、逻辑和规则。性能提升:在保持模型通用能力的同时,显著提升其在特定任务上的表现。资源高效:相比从头训练模型,微调成本更低、效率更高。专家微调是连接通用AI能力与垂直行业应用的桥梁。通过针对性优化,它能够让模型在特定领域表现出色,同时大幅降低训练成本。随着技术的不断发展,专家微调将在医疗、法律、金融等领域发挥越来越重要的作用,推动AI技术的工业化落地。
2025-04-30 14:41:50
155
原创 一些常用的深度学习可视化平台:TensorBoard、Weights & Biases (wandb)、VisualDL
VisualDL是百度开发的深度学习可视化平台,支持PaddlePaddle、PyTorch和MXNet等主流框架。TensorBoard是TensorFlow自带的可视化工具,支持实时监控训练指标、模型计算图、嵌入可视化等。wandb是一个功能强大的实验跟踪和可视化平台,支持超参数搜索、模型存储、团队协作等。运行代码后,可以通过VisualDL的界面查看训练过程中的指标变化、模型结构等。运行代码后,可以在wandb的仪表盘上查看训练过程中的指标变化、模型性能等。,然后在浏览器中输入。
2025-04-29 17:31:20
312
原创 大模型时代:主流训练、微调、推理与部署框架深度解析及对比
在大模型时代,选择适合的框架对于模型的训练、微调、推理和部署至关重要。本文将介绍几种常用的框架,并通过代码示例和表格对比,帮助读者了解这些框架的特点和使用场景。
2025-03-17 14:37:03
225
原创 模型评测:基于Python和PyTorch的深度学习模型性能评估
数据准备:收集并预处理评测所需的数据集,确保数据的质量和一致性。模型加载:加载预训练的深度学习模型,或者从训练好的模型检查点恢复模型。评测指标选择:根据任务类型(如分类、回归、检测等)选择合适的评测指标,如准确率、召回率、F1分数、均方误差等。模型评估:使用评测数据集对模型进行评估,计算并记录评测指标。结果分析:对评测结果进行深入分析,识别模型的优点和不足,提出改进建议。
2025-02-20 16:29:54
896
原创 ModelScope竞品分析:在面对Hugging Face Hub和百度PaddleHub等竞品时
ModelScope的竞品主要包括Hugging Face Hub、百度PaddleHub等知名的MaaS平台。这些平台同样提供了丰富的预训练模型、数据集、工具以及社区支持,帮助开发者快速构建和部署AI应用。:Hugging Face Hub是一个开源的机器学习模型和数据集共享平台,提供了大量的预训练模型和数据集,涵盖了自然语言处理、计算机视觉等多个领域。此外,Hugging Face还提供了详细的文档、教程和社区支持,帮助开发者更好地理解和使用平台上的资源。百度PaddleHub。
2025-02-20 16:23:03
1490
原创 Qwen大模型的深度解析:原理、架构、代码实现与微调
Qwen,作为阿里巴巴集团推出的高性能多模态人工智能模型,自发布以来便以其卓越的性能和广泛的应用前景吸引了业界的广泛关注。Qwen作为阿里巴巴集团推出的高性能多模态人工智能模型,在原理、架构、代码实现以及微调等方面都展现出了卓越的性能和广泛的应用前景。其核心原理在于通过大规模数据的预训练和特定任务的微调,使模型能够理解和生成多种模态的信息,包括文本、图像、音频等。这包括使用标注数据进行训练,以优化模型在特定任务上的性能。:使用标注数据进行模型训练,监控训练过程中的损失和指标,以及进行必要的模型保存和验证。
2025-02-20 16:18:56
2499
原创 大模型训练微调工具对比:Megatron-DeepSpeed、Axolotl、DeepSpeed、Accelerate和Unsloth
在对比微调工具时,还需要了解几种常见的微调技术,包括prompt tuning、prefix tuning、LoRA、p-tuning等。这些技术可以在不改变预训练模型大部分参数的情况下,通过添加额外的参数或编码层来实现对特定任务的适应。:固定预训练参数,为每一个任务额外添加一个或多个embedding,之后拼接query正常输入LLM,并只训练这些embedding。:与prompt tuning类似,但利用多层感知机编码prefix,不再像prompt tuning继续输入LLM。LoRA。
2025-02-20 16:06:55
1344
原创 DeepSeek的微调及其与其他模型的区别
LoRA(Low-Rank Adaptation)是一种针对大型语言模型的微调技术,旨在降低微调过程中的计算和内存需求。通过引入低秩矩阵来近似原始模型的全秩矩阵,LoRA能够显著减少需要更新的参数量,从而加快训练速度并降低计算成本。这些优势使得DeepSeek在多个应用场景中具有独特的竞争力,特别是在需要处理大规模文本数据、跨模态任务或中文环境下的应用场景中。DeepSeek的微调过程是一个复杂但高效的过程,旨在通过调整模型参数来提升模型在特定任务上的性能。这些参数的选择将直接影响模型的训练效果和速度。
2025-02-20 15:59:42
578
原创 多模态微调框架对比与介绍:CLIP, UNITER, Aurora
CLIP是一种基于对比学习的方法,通过大规模图像-文本对数据集进行预训练,学习图像和文本之间的语义对应关系。在微调阶段,CLIP可以通过固定预训练权重或微调部分权重来适应特定任务。# 加载CLIP模型和预处理函数# 准备图像和文本数据# 计算图像和文本特征,并计算余弦相似度# 打印最相似的文本索引UNITER采用多任务学习的方法,将图像-文本匹配、图像描述生成、视觉问答等多个任务结合起来进行预训练,学习更通用的多模态表示。在微调阶段,UNITER可以根据特定任务调整模型结构,如添加额外的解码器。
2025-02-20 15:42:06
462
原创 LLaMA-Factory 微调 Qwen2-VL 进行人脸情感识别
为了提升人脸情感识别的准确性和鲁棒性,本文采用LLaMA-Factory框架对Qwen2-VL大模型进行微调,以实现对人脸情感的高效识别。通过数据准备、模型配置、训练和评估等步骤,我们成功地构建了一个高效的人脸情感识别模型。在微调之前,需要配置模型参数和数据集路径。注意:上述代码中,加载模型和预测的部分被省略了,实际应用中需要使用合适的代码加载微调后的模型,并进行预测。注意:上述代码中,标签的读取部分被省略了,实际应用中需要从labels.csv等文件中读取标签信息,并添加到labels列表中。
2025-02-20 15:36:03
1625
4
原创 大数据治理中的数据安全:以类脑科学研究为背景的探讨
特别是在类脑科学研究领域,大数据不仅为模拟人脑工作原理提供了丰富的素材,还为探索智能科学的奥秘开辟了新途径。本文将从概要、整体架构流程、技术名称解释、技术细节及小节分析等角度,深入探讨大数据治理中的数据安全在类脑科学研究中的应用与挑战,特别是侧重于数据安全在保障类脑科学研究数据完整性、机密性和可用性方面的作用。通过加强数据加密与访问控制、完善数据脱敏与隐私保护机制、提升数据审计与监控能力以及强化分布式存储系统的安全性等措施,我们可以有效应对数据安全面临的挑战,为类脑科学研究提供更加安全、可靠的数据支撑。
2025-02-20 15:27:57
1029
原创 【2024年1月】python日常记录
如果你想打印出斜杠(在Windows上用作路径分隔符),你可以使用os.altsep或os.path.sep。os.altsep在大多数情况下是空的,但如果你正在处理一个使用了非标准路径分隔符的文件,它可能会有值。os.path.sep是更常用的方式,因为它明确表示路径分隔符。在Windows上,这通常是\,而在Unix和Linux上,这通常是/。在Windows上,这通常是\,而在Unix和Linux上,这通常是/。在Python中,你可以使用os模块来获取和打印系统文件夹斜杠或目录分隔符。
2024-01-05 11:07:25
505
原创 Java面试集锦-共计4题
String创建时,对应值放置于String Pool中,String则表示值的引用。因此值相同时,新创建的String所代表的引用地址是一样的。如果String可以改变,那么其他指向此地址的对象也发生改变,因此不安全。String的hashcode使用频繁,设计为不可变可使程序运行更加高效。不可变可满足效率与安全的需求。无法从外部更改value[]...
2022-08-24 00:31:44
303
原创 常见java后端调试问题
jdk运行时内存占用情况查看?日志切片aop?用户权限认证如何实现?项目微服务模块的结构?设计模式:工厂模式是怎样的呢?开源代码或框架有哪些?如何进行性能优化,微服务切换,nginx有哪些算法转换?...
2022-02-09 17:24:42
285
原创 2021-11-11
1按键盘上的windows+R,然后在输入框中输入cmd,既可以启动命令窗口2进入windows命令窗口之后,输入命令,输入netstat -ano然后回车,就可以看到系统当前所有的端口使用情况。3通过命令查找某一特定端口,在命令窗口中输入命令中输入netstat -ano |findstr “端口号”,然后回车就可以看到这个端口被哪个应用占用。4查看到对应的进程id之后,就可以通过id查找对应的进程名称,使用命令tasklist |findstr “进程id号”5通过命令杀掉进程,或者是
2021-11-11 19:18:30
1219
原创 学习日志 2021-11-07
windows下cmd切换目录切换到盘符时(直接输入盘符名):D:切换到具体目录下:cd blog/resource文件夹内容:dir
2021-11-07 07:34:17
184
原创 Java问题汇总20200113
数据类型1. long与Long的区别Java的数据类型分两种:基本类型:long,int,byte,float,double,char对象类型(类): Long,Integer,Byte,Float,Double,Char,String,其它一切java提供的,或者你自己创建的类。其中Long又叫 long的包装类。而Byte和Float也类似,一般包装类的名字首写是数值名的大写开头...
2020-01-13 17:44:23
236
原创 mysql常见问题
1. IDEA连接数据库错误:[08001] Could not create connection to database server.参考:https://blog.youkuaiyun.com/qq_35389417/article/details/98944551
2020-01-13 17:22:56
249
翻译 idea各个版本区别
导航目录版本类型CommunityUltimateEAP版本类型Community社区版,免费,但是功能有限制,Android Studio就是基于这个版本定制的。Ultimate终极版,收费,功能无限制。EAP终极版的免费版,免费,功能无限制,但是每隔30天要重装一次。...
2020-01-07 07:18:37
26246
2
原创 常见服务端简答题汇总
1.JDK、JRE、JVMJDK,Java Development Kit,Java开发工具包。包含JRE、一堆Java工具和Java基础的类库。JRE,Java Runtime Environment,Java运行环境。JVM,Java virtual machine, Java虚拟机。解释java程序编译而成的.class类文件,并交由本地系统执行。解释过程需要JRE中的lib类库。J...
2019-09-11 18:01:26
590
原创 Spring boot/cloud常见报错整理(一直更新...)
1.Failed to introspect annotated methods on class org.springframework.cloud.ne…spring boot和spring cloud版本不合适**Tips:**spring boot 1.4以后 FilterRegistrationBean的位置换到了 org.springframework.boot.web.servl...
2019-07-05 15:48:32
735
2
原创 多线程与并发程序设计
并发(Concurrency):以可独立执行的进程集合的方式编程。并行(Parallelism):以可同时执行的(可能相关的)计算指令方式编程。并发与并行的区别:并发是同时处理(dealing)很多的事情,并行是同时做(doing)很多的事情。不同,但也相关。一个是关于代码结构,一个是关于代码执行。并发为可能的(不是必须的)并行问题提供了一种解决方案。Java并发包:JDK中的JUC。该工具...
2019-07-01 15:56:30
471
原创 OpenGL学习记录
关于OpenGLOpenGL(全写Open Graphics Library)是指定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像(二维的亦可),是一个功能强大,调用方便的底层图形库。OpenGL具有七大功能:建模:OpenGL图形库除了提供基本的点、线、多边形的绘制函数外,还提供了复杂的三维物体(球、锥、多面体、茶壶等)以及复杂曲线和曲面绘制函数。变换:Op...
2018-10-21 09:36:33
342
《算法珠玑》数组_题1
2021-07-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅