- 博客(97)
- 资源 (1)
- 收藏
- 关注
原创 详解DeepSeek模型训练优化及数据处理
DeepSeek是由杭州深度求索公司推出的一款创新大语言模型,具有高效推理、多任务兼容、持续进化等核心优势,支持智能问答、代码生成、数据分析等应用场景。其技术架构包括多模态深度Transformer、动态稀疏激活机制、超长上下文建模等,采用混合精度训练、强化学习对齐等优化手段。DeepSeek通过数据蒸馏、领域微调、模型压缩等技术,大幅降低训练成本,提升推理效率,推动AI技术民主化。
2025-04-01 15:38:34
230
原创 DeepSeek语言模型训练方法
DeepSeek的模型是基于Transformer架构的大语言模型,类似GPT的结构。训练这样的模型通常需要大量的数据、分布式训练、强大的计算资源。如果是企业级训练,需要分布式训练和大量GPU;如果是个人使用,可以进行微调,或者使用云服务。要准备数据,比如数据清洗、预处理、分词等。同时,训练过程中的技巧,如学习率调整、正则化、防止过拟合的方法。比如用PyTorch或TensorFlow实现训练循环,或者使用Hugging Face的库进行微调。
2025-04-01 15:22:06
821
原创 DeepSeek 与 ChatGPT的主要区别
DeepSeek与ChatGPT作为当前主流的两大AI语言模型,在性能和模型效率、语言和内容审查、成本和可达性等方面存在显著差异,本文从多个维度进行对比分析。
2025-03-07 17:26:33
2821
1
原创 Deepseek 使用攻略
人工智能飞速发展的时代,新的技术和工具不断涌现,Deepseek 便是其中备受瞩目的存在。它以强大的功能和出色的表现,吸引了众多用户的关注。今天,就让我们一起来深入了解一下 Deepseek 究竟是什么,以及如何使用它。
2025-03-07 17:17:44
2207
原创 如何用模拟抓取获取优质内容?10个技巧教你
在当今信息化时代,信息的获取和传播变得越来越容易。作为自媒体从业者,如何获取更多优质内容并在自己的平台上展示,成为了一项重要的任务。本文将从以下10个方面,详细讨论如何抓取模拟内容并在自媒体上呈现。
2025-03-06 16:33:53
286
原创 Python网络爬虫代码,高效采集数据!
Python编写网络爬虫代码是一项非常重要的技能,可以帮助企业快速、准确地获取所需数据。在编写网络爬虫代码时,需要注意遵守相关规定和道德规范,并尽量避免被反爬机制封禁。
2025-03-06 16:15:40
1606
原创 DeepSeek Chat:AI对话助手 - 使用教程
DeepSeek Chat,基于DeepSeek-V2 模型,是一款集成了 2 千亿参数量的MoE(Mixture of Experts)模型的AI技术产品。它在中文综合能力(AlignBench)和英文综合能力(MT-Bench)的评测中表现卓越,与GPT-4-Turbo等闭源模型并驾齐驱。DeepSeek Chat支持128K上下文的开源模型,而其对话官网/API则支持32K上下文,提供即刻接入、能力卓越、价格低廉的服务,并且兼容OpenAI API接口,为用户带来丝滑的体验。
2025-02-11 08:55:54
462
原创 Java线程的生命周期包括哪几种状态?
在java中,任何对象都要有生命周期,线程也不例外,它也有自己的生命周期。当Thread对象创建完成时,线程的生命周期便开始了,当run()方法中代码正常执行完毕或者线程抛出一个未捕获的异常(Exception)或者错误(Error)时,线程的生命周期便会结束。线程的整个生命周期可以分为5个阶段,分别是新建状态(New)、就绪状态(Runnable)、运行状态(Running)、阻塞状态(Blocked)和死亡状态(Terminated),线程的不同状态表名了线程当前正在进行的活动。
2025-01-16 17:21:48
982
原创 Windows 11开发版截图曝光:新增 “Windows Intelligence”选项
内置“Windows Intelligence”功能(和功能设置选项)的新版Windows 11什么时候会发布?预计还早,因为如果微软真的调整了AI战略,决定启用“Windows Intelligence”品牌,预计在正式推出发布之前会进行预热,而目前这些都尚未发生。
2025-01-15 11:27:48
356
原创 10个高级的SQL查询方法技巧
SQL 是管理和分析关系数据库的基本工具。掌握基本的SQL命令能够完成简单的数据查询和操作,但是如果想从数据中提取更有价值的信息,数据分析工作者和开发人员应该深入学习和掌握高级的SQL技巧。
2025-01-14 17:43:04
242
原创 何写出一个高质量的技术文档?
写文档的水平,是需要锻炼的,多看好的文档,理解它的构造,再结合上一些相应的标准要求,循序渐进,才可以逐步提升文档的编辑能力,进一步提高技术文档的质量。
2024-12-09 14:55:27
172
原创 携程数据报表平台查询效率治理实践
本文概述了面对公司数据报表平台遇到的查询性能挑战,数据平台组围绕数据缓存、物化视图、查询策略、SQL质量等方向所做的一系列治理工作,以提升平台的查询效率和稳定性。
2024-11-22 23:29:33
780
原创 glibc 内存分配与释放机制详解
本文以一次线上故障为基础介绍了使用 glibc 进行内存管理可能碰到问题,进而对库中内存分配与释放机制进行分析,最后提供了相应问题的解决方案。
2024-11-20 16:51:20
1311
原创 数据库工具全指南:2024年20款必备系统盘点
市场上的数据库工具种类繁多,各具特色。在选择数据库工具时,企业应根据自身的业务需求和技术架构进行综合考虑,选择最适合自己的解决方案。希望本文能够为您提供一些有益的参考和建议,帮助您更好地管理和利用数据库资源。
2024-11-18 14:11:01
952
原创 AI在零售业中的应用及消费者数据分析提升购物体验的策略
在AI加持下,如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?
2024-11-18 13:56:10
1415
原创 PostgreSQL“平替”Oracle:应用和基础架构改造技巧经验分享
数据库替换已经是很多企业必须面对或者正在面对的问题,在数据库迁移替代工作中,能够“平替”肯定会大大节约迁移的成本,但是我们不能因为两者业务代码和迁移的高兼容性,忽视和轻视应用和基础架构、运维改造工作,否则就会为今后的长期应用与运维埋下不稳定的因素。本文总结了PostgreSQL替换Oracle过程中,一些常用的应用的改造技巧和PostgreSQL索引的选择场景,以及二者运维中的差异,希望能为大家提供参考。
2024-11-14 16:00:05
1064
原创 金融行业国产数据库容灾建设五大难点及解决方案
虽然国产数据库在容灾建设上面临挑战,但通过合理的设计、工具选择和运维管理,可以有效提升容灾能力和数据安全性。
2024-11-14 15:49:37
1229
原创 深度学习 PyTorch 中的 logits 和交叉熵损失函数
在本文中,我们深入解释了 PyTorch 中 logits 和交叉熵损失函数的工作原理,并展示了如何调整张量的形状以确保正确计算损失。这是分类任务中标准的损失计算步骤,有助于优化模型的参数。通过理解这些概念,你可以更好地调试和优化你的深度学习模型。
2024-11-13 22:27:09
1183
原创 AI 产品的四层架构:开启智能未来的密码
在人工智能飞速发展的今天,AI产品正逐渐渗透到我们生活的方方面面,从智能助手到自动驾驶,AI的应用正不断拓宽我们的想象边界。但构建一个成功的AI产品并非易事,它需要深入理解AI产品的架构和开发流程。
2024-11-13 16:28:12
1571
原创 Python零基础项目实战:从菜鸟到小能手的编程之旅
本文系统性地引导读者从Python基础编程,进阶至数据抓取与分析、文本处理与情感分析,以及基本的web应用开发。通过三个实践项目,覆盖从环境配置到具体实现的详细步骤,以助编程新手快速上手Python,并通过实际项目积累经验,深入学习Python在数据科学、文本分析和Web开发领域的应用。
2024-11-11 14:55:57
1518
原创 未来已来:AI编程——重塑软件开发的新纪元
欢迎与我们一起,从 AI 大模型的定义、应用场景、优势以及挑战等方面,探讨 AI 是如何重塑软件开发的各个环节以及带来的新的流程和模式变化,并展望未来的发展趋势~
2024-11-07 16:16:23
467
原创 AI大模型重塑软件开发:流程、优势、挑战与展望
欢迎与我们一起,从 AI 大模型的定义、应用场景、优势以及挑战等方面,探讨 AI 是如何重塑软件开发的各个环节以及带来的新的流程和模式变化,并展望未来的发展趋势~
2024-11-07 16:14:37
759
原创 Nmap 使用指南
Nmap(Network Mapper)是一个开源的网络扫描工具,广泛用于网络发现和安全审计。它能够扫描网络中的主机、探测端口、检测服务、识别操作系统,并提供关于网络的详细信息。本文将详细介绍Nmap的安装方法、基本使用、优缺点,并提供一个Nmap备忘单,帮助用户更有效地使用这个强大的工具。
2024-11-06 10:20:40
1176
原创 Autodesk AutoCAD教程:绘制创意,构建世界
Autodesk AutoCAD是一款广泛应用于工程、建筑、制造等领域的计算机辅助设计(CAD)软件。它拥有强大的绘图和建模功能,能够帮助用户创建精确、高质量的设计和图纸。本文将为您提供一份详细的AutoCAD教程,帮助您入门并掌握这款强大的设计工具。
2024-11-05 15:33:15
553
原创 12 款适合网络工程师的杀手级免费工具
有许多出色的工具可以帮助网络工程师完成永无止境的任务,其中许多工具都是免费的,本文列出了 12 种价格实惠的杀手级网络工具。
2024-11-05 14:05:28
989
原创 Ubuntu系统使用体验如何?
Ubuntu 是一个基于 Debian 的开源操作系统,广泛应用于个人电脑、服务器以及云计算环境。自2004年首次发布以来,Ubuntu 以其易用性和强大的社区支持,迅速成为全球最受欢迎的 Linux 发行版之一。本文将深入探讨 Ubuntu 的特点、优缺点、使用场景以及安装与配置等方面。
2024-11-01 12:02:15
1305
原创 替代 CentOS 的四款最佳操作系统
CentOS 是基于 Red Hat Enterprise Linux (RHEL)源代码编译而成的,经过了大量的测试和稳定性验证,具有高度的稳定性与可靠性,更长周期的支持,更高的安全性,更好的兼容性以及强大的社区支持,集众多优点于一身的 CentOS 也就成了互联网各大企业的首选服务器操作系统。
2024-10-31 21:52:02
842
原创 什么是人工智能(AI)?
人工智能AI(即Artificial Intelligence)是计算机科学的一个分支,旨在让计算机模仿人类的决策能力、像人类一样思考和行动,来解决如自然语言处理、推荐、智能数据检索、预测等方面人类无法处理或难以处理的复杂工作。
2024-10-31 10:51:51
1240
原创 ArcGIS入门教程
ArcGIS Desktop是一个集成了众多高级GIS应用的软件套件,它包含了一套带有用户界面组件的Windows桌面应用(例如ArcMap,ArcCatalog,ArcTooboxTM以及ArcGlobe)。可以实现从简单到复杂的GIS任务,如制图、地理分析、数据编辑、数据管理、可视化和空间处理等。
2024-10-30 17:02:09
1057
原创 大数据技术的前景如何?
在当今数字化迅猛发展的时代,大数据技术的前景显得尤为广阔。随着数据量的激增,如何有效利用这些数据成为了各行各业关注的焦点。未来五年,大数据技术的发展趋势可以从市场规模、技术融合、行业应用和政策支持等多个方面进行深入分析。
2024-10-30 16:50:13
924
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人