自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 python拉取大视频导入deepseek大模型解决方案

scaler = torch.cuda.amp.GradScaler() 混合精度。通过上述方案,可高效处理大视频与大模型的结合任务,同时确保系统稳定性。- 使用云存储:如AWS S3直接读取视频流,避免本地存储。- 模型轻量化:使用ONNX或TensorRT加速推理。使用流式下载将视频保存到本地,避免一次性加载到内存。使用OpenCV或PyAV逐帧读取视频,生成迭代器。2. 生成器逐帧读取:防止视频数据一次性加载。将视频帧分批次输入模型,优化GPU利用率。1. 流式下载与存储:避免大文件内存占用。

2025-03-16 13:18:01 868

原创 TiDB删除大量数据需要注意什么

问题:直接执行 `DELETE FROM table` 会导致超大事务,可能触发 TiDB 事务限制(默认单事务限制为 `txn-total-size-limit=100MB`),导致失败或性能问题。- 开启 TiDB 异步提交(`tidb_enable_async_commit`)或 1PC(`tidb_enable_1pc`)提升事务提交效率。1. 评估数据量:确认待删除数据范围(如 `WHERE create_time < '2023-01-01'`)。

2025-03-15 10:44:47 485

原创 训练大模型LLM选择哪种开发语言最好

生态系统丰富:主流深度学习框架(PyTorch、TensorFlow、JAX)均以 Python 为主要接口,提供完整的工具链(数据处理、模型训练、评估部署)。- 分布式训练支持:库如`DeepSpeed`、`Megatron-LM`、`Hugging Face Accelerate`简化了多GPU/TPU训练。- 与Python结合:通过`PyTorch`的`torch.cuda`或`Numba`库无缝调用。- 数据处理便捷:库如`NumPy`、`Pandas`、`Dask`高效处理大规模文本数据。

2025-03-11 23:16:17 784

原创 【AI大模型】LLM训练deepseek如何识别视频

数据集:Kinetics-400/700(动作识别)、MSR-VTT(视频描述)、ActivityNet。- 视觉编码器:使用预训练模型(如ResNet、ViT、CLIP-ViT)提取每帧的视觉特征。- 使用大规模视频-文本数据集(如WebVid-10M、HowTo100M)进行对比学习。1. 多模态数据:视频包含视觉(图像帧)、时序(动作)、音频等多维度信息,需统一处理。- 对比学习:通过CLIP-style对比损失,拉近匹配视频-文本对的距离。

2025-03-11 12:31:38 934

原创 LLM训练deepseek如何识别语音

要让类似 DeepSeek 的大型语言模型(LLM)具备语音识别能力,需要通过多模态扩展或与专用语音处理模块结合。步骤2:连接DeepSeek进行语义理解。步骤1:扩展模型架构。

2025-03-10 22:31:16 973

原创 lua如何写出高性能的kong网关插件

实际开发中建议使用Kong-Plugin-Template脚手架快速初始化优化项目结构。local json_preparse = cjson.decode(cjson.encode({})) -- 预热解析器。local opts = { jo = true } -- JIT优化模式。cache_key = { "name" }, -- 确保缓存命中率。-- 避免在header_filter阶段做复杂计算。-- 耗时操作使用定时器异步处理。- 日志记录使用log阶段。-- ...处理逻辑...

2025-03-09 11:27:43 510

原创 MySQL配置优化大幅提升性能和稳定性

缓存命中率:`Innodb_buffer_pool_read_requests` / (`Innodb_buffer_pool_read_requests` + `Innodb_buffer_pool_reads`)。- `slow_query_log = 1`:开启慢查询日志,记录执行时间超过 `long_query_time`(如 2 秒)的查询。- 临时表与磁盘临时表:`Created_tmp_tables` 和 `Created_tmp_disk_tables`。建议 `2048` 或更高。

2025-03-09 10:48:56 712

原创 Manus即将颠覆哪些行业?

颠覆点:Manus可分析患者病历与基因数据,生成个性化治疗方案,辅助医生决策效率提升60%。在药物研发中,其全流程管理临床试验数据,将周期缩短40%。- 岗位替代与升级:70%基础岗位(如文职、客服)面临替代,但“AI指令工程师”“数字流程架构师”等新职业需求激增320%。- 行业影响:传统分析师的基础工作(如数据清洗、模型搭建)被替代率超过73%,催生“AI量化分析师”等新岗位。- 全球竞争格局:Manus在“一带一路”国家市占率达68%,推动中国从技术“跟随者”转向“规则制定者”。

2025-03-07 22:27:36 423

原创 LLM训练如何从图片提取信息存入向量数据库

使用LLM(大语言模型)结合多模态技术从图片提取信息并存入向量数据库的完整技术方案,包含关键步骤、工具链和典型应用场景

2025-03-07 14:58:06 1332

原创 【AI训练】如何提高LLM的训练速度

模型并行(Model Parallelism):拆分模型到多个设备(如Megatron-LM的Tensor并行、Pipeline并行)。- 数据并行(Data Parallelism):在多GPU或多节点上拆分数据批次,同步梯度(如PyTorch DDP、Horovod)。- 使用即时编译(JIT)技术(如PyTorch的TorchScript、JAX的JIT)。- 使用稀疏注意力(Sparse Attention)或滑动窗口(如Longformer)。

2025-03-06 19:46:34 758

原创 2025年最好的RAG工具包

‌企业用户‌:优先考虑‌Google Vertex AI RAG‌或‌Meta RAG Suite‌,注重算力、合规性和多语言支持;‌开发者/初创公司‌:‌OpenAI RAG Engine‌或‌LangChain‌,依赖成熟API和社区资源;2. 自适应增强架构‌:动态选择检索策略(向量搜索、关键词匹配、图网络检索),结合混合模型优化生成质量。‌1. 多模态统一处理‌:支持文本、图像、音频、视频的联合检索与生成,跨模态语义对齐能力成为关键。‌适用场景‌:开发者友好型API服务、中小型应用快速集成。

2025-03-06 14:41:22 651

原创 nginx+lua实现网关api加密解密示例

在实际项目中需要将api加密解密,如果想不侵入业务代码,可以将加密解密功能集成到基于Nginx的网关中。

2025-03-05 14:02:08 610

原创 【AI编程】cursor AI自动编程,独立开发者躺着赚钱时代来临

AI编程工具Cursor已集成Claude 3.7 Sonnet推理模型,在编程领域,Claude3.7Sonnet的表现尤为突出。在一项编程测试中,Sonnet以70.3%的高分领先于其他知名模型,如OpenAI的o1、o3-mini和DeepSeek R1,后者的得分仅在49%左右。这一结果表明,Anthropic有意将Sonnet定位为一款强大的编码AI,专注于提升编程能力,以满足开发者在复杂代码库处理和全栈更新方面的需求。

2025-03-05 11:07:23 448

原创 mysql自动化配置工具开发探讨

通过结合Shell/Python的快速开发能力和Go的部署便利性,配合完善的异常处理机制,可构建出适应复杂生产环境的MySQL自动化配置工具。建议优先保证核心流程的健壮性,再逐步扩展高级功能。

2025-03-04 13:57:21 483

原创 哪种姿势学习deepseek效率最高?斜躺,仰卧,趴床,趴桌,坐着 or 站着?

高效学习 ‌DeepSeek‌(或任何知识工具)的姿势选择需平衡 ‌认知效率‌ 和 ‌健康可持续性‌

2025-03-04 11:04:50 471

原创 php程序员如何3天完成python学习

作为PHP程序员,你已具备编程思维和逻辑能力,3天内掌握Python基础语法和核心特性是完全可行的。关键在于利用已有编程经验进行知识迁移,同时聚焦Python独有的特性。

2025-03-04 10:19:55 1142

原创 golang程序员如何3天完成python学习

有Golang经验的程序员,想要在三天内快速学习Python,如何分配三天时间。将时间分为基础语法、核心库和框架、项目实战。第一天突破语法差异,第二天学习关键库,第三天实战项目。以下是针对Golang程序员定制的‌。

2025-03-03 20:00:00 836 1

原创 Go与PHP性能对比分析

Go在‌高并发、低延迟、资源敏感型场景‌的性能优势可达PHP的3-50倍,但PHP在‌开发效率、生态成熟度、学习成本‌方面仍具竞争力。建议通过‌混合架构‌实现技术栈优势互补,而非非此即彼的选择。

2025-03-03 15:26:34 1316

原创 Go 语言在秒杀系统中的高并发处理

Go 语言凭借其轻量级协程(Goroutine)、高效的调度器(Scheduler)和原生并发支持,成为秒杀系统高并发场景的理想选择。

2025-03-02 13:48:53 310

原创 Go 语言HTTP服务高并发优化方法

通过优化方案,配合压力测试工具 (wrk, vegeta) 持续验证,可在 8 核服务器上实现 10 万级 QPS 的稳定处理能力。建议根据实际业务场景选择组合优化策略,优先处理性能瓶颈最大的环节。

2025-03-02 09:41:41 660

原创 Go 语言大数据处理应用

通过合理运用 Go 的并发特性与内存管理机制,结合分布式系统设计原则,可构建高性能、易维护的大数据处理系统。

2025-03-01 17:06:00 1171

原创 Go协程的特点和使用注意事项

Go 协程(Goroutine)是 Go 语言并发模型的核心,具有独特的设计和优势,但在使用时也需要注意一些关键问题。- 协程若因阻塞(如未关闭的 Channel、死循环)无法退出,会导致内存泄露。通过合理利用 Goroutine 的特性并规避其陷阱,可以高效构建高并发、高可靠的 Go 程序。:优先使用 Channel 通信、控制并发量、确保资源释放、防范竞态和死锁。- 创建和销毁由 Go 运行时管理,资源消耗极低,可轻松支持百万级并发。- 确保 Channel 的发送和接收成对出现,避免协程永久阻塞。

2025-03-01 09:01:55 1047

原创 Python+AnythingLLM训练DeepSeek可直接运行的完整示例

一个可直接运行的Python+AnythingLLM训练DeepSeek完整示例。

2025-02-28 14:53:35 408

原创 Redis+Golang实现的简单消息队列系统

这个实现提供了一个基础的消息队列框架,可以根据具体需求进行扩展和优化。使用Prometheus收集队列长度、处理耗时等指标。:使用BRPop进行阻塞式消息获取,支持优雅关闭。:将消息序列化为JSON后推送到Redis列表。使用Redis Streams和消费者组功能。使用RPOPLPUSH将消息移到处理中队列。添加/metrics端点暴露监控数据。:封装Redis客户端和队列操作。处理成功后删除,失败时移回主队列。使用Redis列表作为队列存储。阻塞式消息获取(BRPop)实现更复杂的消息分发模式。

2025-02-28 10:40:33 454

原创 百亿级别数据存储与查询方案

百亿级数据方案需平衡性能、成本与复杂度,核心在于‌分层存储‌、‌分布式架构‌和‌查询优化‌

2025-02-27 17:44:28 968

原创 go语言golang高并发需要注意哪些核心要点

golang处理高并发是不可避免的一件事,如果要支持10万级QPS的高并发系统,同时保证内存安全与执行效率,我们需要注意几个核心要点。

2025-02-27 10:33:33 365

原创 tidb和mysql性能优化有哪些区别

MySQL的优化核心是单机资源最大化利用,通过索引、事务、配置调优实现。TiDB的优化核心是分布式系统协同,需关注数据分布、调度策略、网络开销,并利用分布式计算能力(如 MPP)。实际优化时,需结合业务场景(OLTP 或 OLAP)、数据规模、分布式特性综合权衡。

2025-02-26 21:51:29 1164

原创 Ollama+AnythingLLM+Deepseek,调用api大批量导入数据,快速构建本地知识库

如何调用api大批量导入数据,快速构建本地知识库?生成回答:LLM结合检索结果生成最终响应。检索增强:根据用户问题检索相关文档片段;

2025-02-26 18:21:26 692

原创 ollama与deepseek是什么关系

网上搜索本地化部署deepseek的教程,大概率都能看到ollama,到底他们之间有什么关系呢?‌‌

2025-02-25 18:15:29 1550

原创 AnythingLLM+Deepseek的正确训练方法

‌主要包括以下几个步骤:‌‌:大规模的数据集是构建高效LLM的基础。AnythingLLM的训练需要数百万甚至数十亿级别的语料库来进行预训练。高质量、多样化的文本数据有助于提升最终模型的表现。‌1‌‌:由于LLM的参数量极大,合理的初始权重设置至关重要。一般会采用随机正态分布等方式完成这一工作,并通过超参调整优化器的学习率等关键因素以加速收敛速度并防止过拟合现象的发生。‌‌:利用无监督学习的方式,在大量未标注的文本上进行初步训练。

2025-02-25 16:44:11 1566 1

CursorUserSetup-x64-0.46.8.exe, cursor AI自动编程,集成Claude 3.7 Sonnet推理模型

AI编程工具Cursor已集成Claude 3.7 Sonnet推理模型,在编程领域,Claude3.7Sonnet的表现尤为突出。在一项编程测试中,Sonnet以70.3%的高分领先于其他知名模型,如OpenAI的o1、o3-mini和DeepSeek R1,后者的得分仅在49%左右。这一结果表明,Anthropic有意将Sonnet定位为一款强大的编码AI,专注于提升编程能力,以满足开发者在复杂代码库处理和全栈更新方面的需求。

2025-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除