自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 OpenAI全新发布o1模型 - 人类即将迈入了下一个时代。

在 2024 年的国际信息学奥林匹克竞赛(IOI)中,"o1" 在有限的提交次数下取得了 213 分,如果放宽提交次数限制,它的得分甚至可以达到 362.14 分,足以获得金牌。目前,"o1" 的思考时间仅为一分钟,但设想一下,如果它达到了真正的通用人工智能(AGI)水平,那么它的思考速度可能会变得更慢,而这种慢思考可能会带来意想不到的惊喜。OpenAI 表示,这款新模型在技术上实现了重大突破,与以往的大型模型有着根本的不同,因此它被视为一个全新的系列,从 "1" 开始编号。

2024-09-14 12:03:42 748

原创 浅谈Trae产品的快速入门

Trae通过极简安装流程和中文友好交互大幅降低使用门槛,其AI原生特性尤其适合快速原型开发和跨职能团队协作。建议开发者优先体验Builder模式和设计稿转代码功能,探索AI编程的高效边界71318。

2025-03-25 14:36:49 742

原创 10个SQL Server常见问题及解决方案

启用混合验证模式:在SQL Server配置管理器中,将“安全性”选项卡的验证方式改为“SQL Server和Windows身份验证”并重启服务。验证服务状态:通过“服务管理器”确认SQL Server服务(如MSSQLSERVER)是否已启动。重写低效查询:避免嵌套循环过多,改用JOIN优化或分页查询(如OFFSET-FETCH)。检查备份路径权限:确保SQL Server服务账户有写入权限,必要时清理旧备份释放空间。检查网络协议:确保TCP/IP协议已启用,端口(默认1433)未被防火墙拦截。

2025-03-21 18:12:09 457

原创 AI扫盲贴:Token是什么?Token如何计算?

TokenToken的核心价值在于标识与验证身份认证(替代密码验证)代码解析(结构化编程语言)文本处理(量化语言模型输入输出)。其本质是通过数字化标识提升效率和安全性。

2025-03-21 16:24:25 384

原创 Python数据处理必备十大技巧

Python数据处理

2025-03-21 16:04:07 550

原创 DeepSeek重塑产品经理角色:从“需求翻译者”到“智能决策架构师”

人工智能的进化正以前所未有的速度重构软件行业的生产关系,而DeepSeek作为新一代AI技术的代表,已深度渗透产品经理的核心工作场景。风险预警:自动监控用户评论情感值波动,提前14天预测产品口碑滑坡风险某银行通过AI生成的智能营销方案,使客户转化率提升34%,但需警惕数据偏差——当工具建议“降低价格以提升销量”时,需结合品牌战略进行人工校准。战略创新组:聚焦0到1的创新探索,人均产出效率达传统团队的3倍这种模式下,产品经理需具备“跨组翻译”能力,确保AI输出与战略目标的一致性。

2025-03-18 11:29:13 278

原创 DeepSeek重塑软件行业:研发工程师的机遇与挑战

代码生产的效率革命DeepSeek通过自然语言指令生成可运行代码的能力,显著缩短了开发周期。例如,研发工程师输入“用Python实现数据可视化”等需求,系统可快速生成基础代码框架,甚至自动优化算法参数。这种能力尤其适用于标准化功能模块(如CRUD操作)的开发,使工程师能将精力集中于复杂业务逻辑和架构设计。此外,其“全局改写”功能可自动调整代码结构,帮助团队统一编码规范,降低技术债务积累风险。质量保障的智能化升级。

2025-03-17 14:17:08 711

原创 2025年DeepSeek的发展前景及行业影响力研究报告

为此,我们详细分析了公司在前景、行业影响力、技术创新以及市场拓展等多个方面的表现。在前景方面,deepSeek公司凭借在人工智能领域的深厚积累,以及持续的技术创新和市场拓展,展现出强劲的发展势头。公司推出的基于深度学习的问答系统,通过模型能力的增强,不断助力金融机构实现数字化转型,提高服务效率和质量。在行业影响力方面,deepSeek公司凭借其在金融科技领域的领先地位,以及不断的技术创新和应用场景拓展,赢得了广泛的认可和市场份额。公司市场份额逐年攀升,技术影响力也日益增强。

2025-03-11 15:43:45 1067

原创 DeepSeek新手指南——快速掌握智能助手核心功能

DeepSeek新手指南—快速掌握智能助手核心功能

2025-03-10 14:24:10 309

原创 用户量7天破亿的DeepSeek到底是何方神圣?

消息传到硅谷,那些平日里镇定自若的大佬们也坐不住了,纷纷揉了揉眼睛,不敢相信眼前发生的一切,仿佛在怀疑自己是不是出现了幻觉。复工后的打工人,靠着键盘上高频次的 “Ctrl+V” 艰难维持工作效率,而就在这时,DeepSeek 在年前惊艳登场,宛如一颗科技核弹,在全球范围内掀起了惊涛骇浪。新增了Deepseek-R1个1.5b,7b,8b,14b的版本。这是因为人工智能模型的训练需要消耗大量电力,随着 DeepSeek 的技术突破,市场对美国传统电力供应商在人工智能产业链中的作用产生了新的思考。

2025-02-10 14:10:19 1506

原创 谷歌Gemini数学反超o1!成本仅1/10

MATH和HiddenMath基准测试中,两种模型均提升了约20%,其中Pro版本以86.5%的成绩略胜o1-preview(85.5%)。价格调整方面,1.5pro型号的输入token价格下调64%,输出token价格下调52%,增量缓存token价格下调64%,新价格将于10月1日生效。最终,还有Gemini 1.5 Flash-8B的实验版本更新,它在文本处理和多模态交互能力上都取得了显著进步。此次更新包括两款型号:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。

2024-09-27 09:44:47 228 1

原创 一款可以离线使用的本地大模型

AI已经在各个领域展示出了惊人的能力,很多人通过各种渠道也都已经体验了AI产品,从最早爆火的ChatGPT,到后来的Gemini,再到最近刷屏的Kimi。今天我们要向大家介绍的就是一款开箱即用的搭载本地知识库的私有化大模型工具集。,选择要使用的大模型,然后下载对应的安装包。目前支持9款大模型下载,可以根据自己电脑的配置选择对应的大模型。FlashAI是什么?FlashAI是⼀款私有化本地运⾏的⼤模型⼯具集的应⽤,⽆需联⽹,⽆需配置,开箱即可体验⼤语⾔模型提供的各种⾼效,功能⻬全的效率⼯具应⽤。

2024-09-23 19:58:31 2168

原创 讨论:单张4090能运行的最强开源大模型?

这88G的显存足以支持全精度的Yi-1.5-34B模型,或者在Qwen2-72B的量化模型中实现更长的上下文。这些显卡的128G显存不仅能够运行int8量化的Qwen2-72B模型,还能利用HBM显存和张量并行技术,提供比单块4090 48G更快的性能(假设存在这样的型号)。GPU的真正优势在于其对prompt的评估速度,也就是处理输入的速度。例如,使用12代i7 CPU运行7亿参数的模型,速度大约是每秒10个token,而使用2060 GPU可以达到每秒30个token,两者之间的差距并不大。

2024-09-14 14:12:52 3242

原创 史上最强开源模型llama3.1

在模型设计上,Meta选择了传统的仅解码器(decoder-only)transformer架构,而非更为复杂的混合专家模型,这样做是为了确保训练过程的稳定性。Meta公司对Llama 3.1进行了深入的综合评估,测试范围广泛,包括超过150个不同的基准数据集,这些测试覆盖了众多语言和多样化的任务类型。此外,他们还采用了迭代式的后训练策略,每一轮都结合了监督微调和直接偏好优化技术,利用高质量的合成数据来持续提升模型的性能。在训练数据的准备上,Meta通过优化数据处理和筛选机制,显著提升了数据的整体质量。

2024-09-13 13:54:16 571

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除