- 博客(485)
- 收藏
- 关注
原创 DeepSeek引爆递归开发大爆炸!
DeepSeek R1 的发布意味着 AI 的普及是必然的,因为它让人们能轻松创建新的推理数据集,并用这些数据训练强大的 AI 模型。具体来说,SYNTHETIC-1 包含了 77.7 万个数学问题、14.4 万个编程问题(包括 Python、JavaScript、Rust 和 C++)、7 万个真实世界的软件工程问题、6.1 万个合成代码理解任务,以及 31.3 万个开放式的 STEM(科学、技术、工程、数学)问题。现在,一家初创公司正在用这个新发布的 AI 模型来增强现有的数据集,从而提高它们的质量。
2025-02-11 07:47:08
269
原创 深挖DeepSeek:知识蒸馏才是核心!
我觉得当模型在互联网上进行预训练时,它其实已经学到了大部分数学推理的能力,但因为它的任务是预测互联网上文本的下一个词,而互联网上大多数文本并不是这种需要推理的内容,所以它通常不会用到这种能力。举个例子,就像几年前的图像生成模型,如果你在提示词里加上“虚幻引擎”,生成的图片质量会明显提高,因为互联网上带有“虚幻引擎”标签的图片通常都是高质量的游戏截图,模型就会偏向生成更高质量的图片。推理其实就是一种预测的艺术。现有的那些高级模型的测试,通常都是考一些特别专业的“博士级别”的知识,普通人根本搞不懂。
2025-02-10 11:21:57
949
原创 AI教父蒸馏论文曾被拒,如今DeepSeek引爆AI革命!
我们在MNIST上取得了一些令人惊讶的结果,并且展示了通过将一个模型集合中的知识蒸馏到一个单独的模型中,可以显著改进一个广泛使用的商业系统的声学模型。8、有趣的是,这篇论文当初因为“缺乏创新”被拒了。它是个超强的AI,价格还特别便宜,最重要的是——完全开放!3、我把这个故事告诉了一个6岁的孩子,一个聪明的小家伙说,“所以当他们理解我建造的东西的时候,我已经16岁了”:)(真实的故事!一个非常简单的方法来提升几乎所有机器学习算法的性能,就是在相同的数据上训练许多不同的模型,然后对它们的预测结果取平均[3]。
2025-02-08 16:30:20
378
原创 什么是氛围vibe编码?
每次AI给我建议,我都直接全部接受,连看都不看改了啥。如果出错了,我就把错误信息复制粘贴给AI,啥也不说,通常问题就解决了。有时候代码太复杂,我都得花点时间才能看懂。如果AI搞不定错误,我就随便改点东西,或者让AI再试试,直到错误消失。我现在在搞一个项目或者网站,但这其实不算是真正的编程——我就是看到啥说啥,运行一下,复制粘贴一下,结果大部分时候还真能用。有一种新的编程方法,我管它叫“氛围编码(vibe coding)”,意思就是你完全跟着感觉走,不用太在意那些复杂的代码规则,甚至可以忘掉代码这回事。
2025-02-07 13:18:29
640
原创 DeepSeek让英伟达狂跌三年?
随着高效、低成本的开源模型普及,AI开发的门槛大幅降低,更多企业和个人可以绕过昂贵的GPU服务器,直接构建AI应用。尽管NVIDIA的GPU仍然是训练AI模型的核心硬件,但随着开源模型的普及,市场对高性能GPU的依赖可能逐渐减弱。最后一点:有可能基于英伟达芯片运算的超级模型已经存在,比如chatgpt5,只是没有对外开放,因为这需要更多硬件才能提供在线服务,但是openAI使用这个超级模型蒸馏各种专业博士生模型,超级大学教授指导各个专业博士生,这些博士生模型再对外开放,这样的模型更便宜成本更低。
2025-02-02 07:36:14
919
原创 DeepSeek极端榨取硬件性能被曝光
的 H800 GPU 训练 V3 时,对 GPU 的核心计算单元(SM,流多处理器)进行了定制化调整:DeepSeek V3利用了NVIDIA的H800 GPU,该GPU具有132个SM(Streaming Multiprocessor),每个SM有20个SMG(Streaming Multiprocessor Group)。另一种可能是,DeepSeek V3通过优化PTX代码,使得通信内核非常高效,以至于可以用更少的SM处理更多的通信任务,从而释放更多的SM用于计算。这些任务将在SM上运行。
2025-01-30 09:45:24
933
原创 Deepseek两项关键发现:无需人类专家介入SFT、有自己
R1-Zero展示了在没有人类专家标注的情况下,通过强化学习也能实现有效的推理能力,这对于减少人类数据生成的瓶颈具有重要意义。o3(低):75.7%的准确率,使用SFT,搜索+采样,平均335K tokens,成本20美元。R1-Zero:14%的准确率,无SFT,无搜索,平均11K tokens,成本0.11美元。o1(低):20.5%的准确率,使用SFT,无搜索,平均7K tokens,成本0.43美元。R1:15.8%的准确率,使用SFT,无搜索,平均6K tokens,成本0.06美元。
2025-01-30 09:43:30
937
原创 杨立昆退休?中国Deepseek超Llama 4触发Meta
我可以自信地说,在我使用它完成的任务中,R1 与 o1 非常接近,接近到我取消了 chatgpt 订阅。在我非常重要的工作中,我们经常开玩笑说 Gemini 比 Deepseek 差远了,因为 Gemini 需要试 5-6 次才能做到 Deepseek 一次就能搞定的事情。这个组织本应该是一个专注于工程的小团队,但因为很多人想加入并争夺影响力,导致招聘人数被人为地扩大了,结果大家都输了。这真的太神奇了,我感觉自己像是在和其他智慧生物一起生活在地球上,因为我真的能看到这个模型是怎么一步步想出最终答案的。
2025-01-29 13:51:58
1093
原创 DeepSeek核心贡献:将SFT和RL统一的数学公式
也就是说:从发散到趋同,DeepSeek 的公式把梯度上升这个概念重新解释了一下,让它成了 SFT(监督微调)和 RL(强化学习)技术(比如 DPO、PPO、GRPO)之间的一个共同主线。更重要的是,这种创新可能会推动算法改进的“比例律”(即算法性能随着规模增长而提升的规律),让 AI 的能力随着数据量和计算资源的增加而更快地提升。此外,统一的方法简化了“令牌化奖励”(用明确的规则奖励 AI 的行为),使 AI 的输出更符合社会目标(比如公平、正义等)。其他所有论文要么是事后显而易见的,要么是巧妙的优化。
2025-01-29 13:22:56
1086
原创 DeepSeek-R1如何用极简参数实现OpenAI级推理?
DeepSeek R1里的老师模型会先示范如何一步步思考问题(就像写解题过程),然后把这些示范当作题目提示交给学生模型,学生模型就能学着像老师那样回答问题,但需要的资源少超多!DeepSeek-R1更像进阶打怪:先掌握思考方法 → 专项提升核心能力 → 查漏补缺 → 最终打磨这种"分阶段重点突破"的策略,让它用更小的脑容量(参数少),花更少的补习费(成本低),考出了学霸成绩!神奇的是,经过这样"浓缩"的DeepSeek R1版本,虽然参数少了一大截,但表现比现在很多最先进的模型都要厉害!
2025-01-26 09:59:07
1108
原创 DeepSeek成功背后是宽客精神
但是,DeepSeek这家公司特别厉害,他们用很少的钱做出了比Meta(一家很大的外国公司)更好的AI模型,还把模型免费给大家用。中国在深度学习(Deepseek)和游戏开发(Black Myth:Wukong)方面取得快速进步的秘诀在于,他们已经发现,雇佣拥有相关技能的年轻人,胜过雇佣那些拥有令人印象深刻的简历但在技术上没有跟上的婴儿潮一代。”(GPU集群就是一堆很厉害的电脑,可以处理很多复杂的事情。我们想了想,突然有个人说:“不知道啊,也许我们可以训练一些大型语言模型(LLM),就当是个副业,玩玩看?
2025-01-25 09:53:13
382
原创 人工智能正在创造一代文盲程序员
如果建议不管用,我就调整一下问题,再问 AI。我感觉自己和代码的联系更紧密了,有了一种归属感,而这种感觉在 AI 出现后逐渐消失了。每当我们让 AI 解决我们自己能解决的问题时,我们就是在用长期的理解换取短期的效率。我正在开发一个 AI 驱动的开发工具,但我却觉得自己在加剧侵蚀我们集体技能的问题。到目前为止,AI 还不足以完全取代程序员,但随着 AI 的进步,情况只会变得更糟。我变成了一个人体剪贴板,只是在我的代码和 AI 之间传递信息。现在,如果 AI 不能在 5 分钟内给我答案,我就会觉得烦躁。
2025-01-25 07:55:09
279
原创 11款恶作剧Chrome插件扩展
你可以改朋友的 Twitter,让它看起来像是 Ryan Gosling 在跟他们打招呼,说“你好”,或者把新闻标题改成搞笑的内容。如果你想用它搞个超有效的恶作剧,那就趁朋友离开房间的时候,偷偷把这个插件装到他们的电脑上,然后打开一个满是独角兽的页面。不过,你得在朋友的电脑上装这个插件,或者用自己的设备给他们看,因为改完的内容不会保存,所以没法直接发链接给他们。想象一下,如果你的朋友读到一篇文章或者搜任何跟“千禧一代”有关的东西,他们会一脸懵地发现,文章里写的全是“蛇人”!所以,玩归玩,别把人吓坏啦!
2025-01-23 10:30:06
381
原创 用Zig开发Web后端独特好处
总的来说,使用 Zig 的竞技场分配器在 Web 后端开发中可以提供高效且易于管理的内存分配方式,特别适合需要处理大量请求的场景。尽管他在Golang(Go语言)社区中有很大的影响力,并且用Go语言开发了许多工具,但他最近的一些言论表明他对Go语言的使用和选择有了一些变化,特别是在涉及性能关键型系统和需要与GPU交互的项目时。考虑到他想在那里实现的目标(例如,使用 GPU 进行大量低级工作,需要通过 Swift 等其他语言导入),这对我来说有点道理。米切尔对 Golang 的选择发生了变化,这真的很有趣。
2025-01-20 11:06:02
948
原创 虚拟线程JDK与Spring Core Reactor
尽管基于 JDK 的实现需要更长的 CPU 时间来进行 GC 活动,但它不会对应用程序性能产生任何负面影响。两种虚拟线程对比:JDK vs. Spring Core Reactor性能对比。发处理列表中以下数量的对象。
2025-01-14 09:30:14
955
原创 比尔·盖茨最喜欢的一本AI书籍
它不会给你简单的答案,但会帮助你提出正确的问题,让你做好更充分的准备,迎接即将到来的浪潮,而不是被浪潮卷走。我的意思是,这绝对是荒谬的东西。鉴于《即将到来的浪潮》假设是:技术一波一波地涌来的,而且这些浪潮是由内部人员推动的,它提出的解决方案是遏制——政府应该(通过监管)决定谁可以开发技术,以及他们应该将技术用于什么用途。的雄心勃勃的议程:从技术解决方案(比如为人工智能系统建立一个紧急关闭开关)到全面的制度变革,包括新的全球条约、现代化的监管框架以及政府、公司和科学家之间的历史性合作。但这个按钮并不存在。
2025-01-07 11:13:24
930
原创 ChatUML:AI自动生成UML图表
有趣的是,AI 提出了行级安全性,这是 PostgreSQL 内置的安全功能,可确保用户只能访问属于他们的数据库行。我们可以将它用于我们的应用程序!通过利用 ChatUML 的强大功能,我们将模糊的想法转变为“聊天到文档”应用程序的明确架构。使用ChatUML ,您可以利用大型语言模型的强大功能,通过直观的聊天 UI 与PlantUML协同工作,而不必自己编写代码。) 是一种流行的开源建模语言,使您能够从简单的基于文本的描述(又名。序列图概述了将聊天转换为文档所涉及的步骤,为开发提供了清晰的路线图。
2025-01-02 07:58:21
876
原创 2025年8个热门Python Web开发框架
相比之下,Django 是一个功能更全面的框架,它内置了许多常见 Web 开发任务的解决方案,例如身份验证和管理界面。这使得 Flask 成为中小型项目或使用 Python 构建 Flask API 的绝佳选择,而 Django 则在更大、更复杂的应用程序中大放异彩,在这些应用程序中,一体化解决方案非常有用。得益于其活跃的社区和强大的生态系统,开发人员在构建 Web 应用时拥有广泛的选择。是一个成熟的“功能齐全”的框架,拥有庞大的生态系统,提供用于附加功能(如身份验证、管理界面、内容管理系统等)的插件。
2024-12-24 08:27:59
2009
原创 VSCode推出免费的GitHub Copilot
这些说明可以轻松与您的团队共享,因此每个人都可以在同一页面上 - 包括 GitHub Copilot。这为您提供了聊天的对话流程,并结合了 Copilot 的代码生成功能。如果您发现需要更多 Copilot,付费 Pro 计划是无限制的,并可以访问其他型号,如o1和Gemini(将于新年推出)。这些指令会随每个请求传递给模型,让您可以指定您的偏好以及模型需要了解的详细信息,以便按照您想要的方式编写代码。GitHub Copilot 将根据您所做的更改和最近的几条提交消息为您建议提交消息。
2024-12-19 08:43:06
928
原创 什么是Web极简架构
相反,本文的目的是提供实用的、基于经验的指南,演示如何通过简单、强大的架构以及实现这一目标的团队结构将您的 HTML 从 A 点传输到 B 点。如果你需要购买办公设备,它们是最安全的选择。在堆栈的另一端,我们需要一个集成团队将领域团队的工作“粘合”到一个有凝聚力的网站,使其在用户看来就像一个网站,即使不同的团队贡献了独立的页面。有一篇关于 SCS 细节和优势的文章,但为了简化,您可以将 SCS 视为大型 Web 应用程序的一个小的垂直部分,它独立运行,包含用户界面、业务逻辑和特定域(如“发现”)的持久性。
2024-12-16 08:07:53
1118
原创 JDK HTTP 服务器:真实世界后端开源演示
通过 maven 运行它( ./mvnw exec:java -Dexec.mainClass="dev.mccue.jdk.httpserver.realworld.Main")创建此代码库是为了演示使用JDK HTTP Server构建的完全成熟的全栈应用程序,包括CRUD操作,身份验证,路由,分页等。请注意,一般来说,这是一个坏主意/做法,但这里唯一的秘密是本地数据库连接,所以没问题。JDK HTTP Server代码库包含真实的世界的示例(CRUD,auth,高级模式等),这是由几个组件组成的。
2024-12-07 08:01:08
839
原创 JEP 491解决了虚拟线程和synchronized同时使
当虚拟线程执行synchronized实例方法并获取与实例关联的监视器时,JVM记录的是虚拟线程的载体平台线程持有监视器,而不是虚拟线程本身。对于平台线程,JDK依赖于操作系统的调度器。通过允许在synchronized方法和语句中阻塞的虚拟线程释放其底层平台线程,供其他虚拟线程使用,从而提高Java代码在使用synchronized时的可扩展性。虚拟线程在执行阻塞操作(如I/O)时会卸载,当阻塞操作准备完成时,操作将虚拟线程重新提交给JDK的调度器,调度器将虚拟线程重新安装到平台线程上以继续运行代码。
2024-11-24 09:28:16
349
原创 Spring框架5.3.x现新DoS漏洞
如果你还在使用旧版本,Spring Framework 5.3.x不再受社区支持。社区支持版本将不会收到任何更新来解决此问题。重要提示: Spring Framework 5.3.x 不再接受社区支持更新。如果您在生产环境中运行此版本,您需要尽快规划升级路径。受影响的包:spring-framework-core、spring-framework-web。升级到受支持的 Spring Framework 版本。受影响的版本:5.3.0、5.3.0或5.3.41。,似乎 6.xx 及以上版本不受影响。
2024-11-19 10:28:01
751
原创 JDK 24:Java 24 中的新特性
该提案的目标包括用与平台无关的 API 清晰简洁地表达各种向量计算,在 x64 和 AArch54 架构上提供可靠的运行时编译和性能,当无法在运行时表达向量计算时可以优雅地降级并仍然运行,并与Project Valhalla保持一致,利用对 Java 对象模型的增强功能。该计划的目标包括将 JNI 保留为与本机代码互操作的标准方式,为默认不允许与本机代码互操作的未来版本准备 Java 生态系统,并协调 JNI 和 FFM API 的使用,以便库维护者可以从一个迁移到另一个,而无需开发人员更改命令行选项。
2024-11-15 08:49:07
1397
原创 Mill:比Maven快10倍的JVM构建工具
,但这些都是次要的。当老进程死亡、新进程启动时,会有一个新的 Task 实例,它具有相同的执行代码,在构建层次结构中也处于相同的位置:这个新的 Task 可以加载 out/foo/bar/baz.json 文件,并从上一个进程离开的地方继续运行。重新构建是通过编译的层次结构来完成的:每个任务 foo.bar.baz 在编译层次结构中都有一个固定的位置,因此在磁盘 out/foo/bar/baz.json 上也有一个固定的位置。)的人来说,这些概念已经很熟悉,但足以回答上面列出的所有复杂的构建相关问题。
2024-11-06 07:12:32
1154
原创 JavaScript真的应该一分为二吗?
最新的 Stack Overflow 调查显示,虽然62% 的开发人员使用 JavaScript,但只有 58% 的人表示欣赏它,而 Rust 用户的比例为 82%,使用 Python 的比例为 68%。硅谷,加州 - 本地网页开发者Alex Chen,28岁,以其前所未有的稳定性让科技界震惊,据报道,他已经连续三周坚持使用同一个JavaScript框架,令人难以置信。Chen承认自己遭受了“戒断症状”,包括无法控制地想要创建新的npm包的冲动,以及看到稳定、维护良好的代码时持续的眼跳。
2024-11-02 07:02:33
624
原创 ChatGPT搜索引擎推出Chrome插件
网站所有者现在面临一个艰难的选择:他们要么允许 ChatGPT 通过 robots.txt 免费使用他们的内容,并获得最低限度的流量,要么冒着在 ChatGPT 搜索结果中不可见的风险。OpenAI 表示,搜索功能使用了经过微调的GPT-4o版本,该版本通过合成数据和该公司新推出的o1-preview“推理”模型的输出进行了优化。出版商现在面临着越来越大的压力,要么与 OpenAI 达成许可协议,要么随着越来越多的用户转向使用 ChatGPT 进行搜索,他们的网络流量可能会下降。g foobar)。
2024-11-01 12:06:01
1361
原创 Clace和sqlite-fs:使用SQLite替代文件系统
另一个原因可能是历史原因:在出现良好的进程内关系数据库之前,人们使用的是文件系统。当稍后添加多节点支持时,计划使用共享 Postgres 数据库,而不是使用本地 SQLite 来存储元数据和文件数据。即使在不同的应用程序中,也会有内容相同的文件。跨应用程序的文件也会被去重。在更新应用时,由于可能会更新大量文件,因此使用数据库将允许在事务中原子地完成所有更改。这意味着即使应用程序的多个版本具有相同的文件,文件内容也只会存储一次。决定使用 SQLite 进行文件存储提供了许多额外的好处(有些是意料之外的)。
2024-10-29 06:30:26
959
1
原创 WebStorm 和 Rider 现可免费用于非商业用途
通过消除成本障碍,JetBrains 让更广泛的开发者(包括业余爱好者、学生和开源贡献者)能够使用强大的开发工具。这一举措意义重大,因为调查显示,超过三分之二的开发者在专业职责之外从事编码工作,通常是为了教育或个人成长。通过收集非商业用户的匿名使用情况统计信息,JetBrains 旨在不断改进其产品,同时与开发者社区保持联系。JetBrains 的决定受到调查数据的影响,该数据表明,大量开发人员在其专业职责之外从事编码工作。通过免费提供这些工具,JetBrains 旨在支持开发人员的专业成长和创造力。
2024-10-25 09:06:26
887
原创 重新架构:从 Redis 到 SQLite 性能提升
最重要的是,如果您处于云环境中,那么您需要考虑网络延迟。因此,尽管我们付出了艰辛的努力和编写代码以尽可能快地获得 v1 客户端,但我们经常会遇到这样的情况:尽管我们尽了最大努力,但由于应用所配置的网络速度很慢,我们仍然会减慢应用的速度。我见过的每一个翻转数据库基准测试都被一层星号和限定词所覆盖,HN 上的评论充满了“如果你在编译时设置这个标志,你的读取速度就会提高 3%,而运行这个的人没有这样做这一事实证明他们得到了贿赂,并且他们积极出售疯狂的游艇摇滚 Harambe 模因的阴暗 NFT 骗局。
2024-10-25 08:03:02
1369
1
原创 Java中并行流处理约10GB大日志文件
使用并行流时,Java 会将数据拆分为多个部分,并在不同的线程上同时处理它们,从而利用 CPU 的多个核心。以并行方式读取文件: 你可以使用 Files.lines() 来读取文件,这样就可以懒散地将文件中的各行数据流化(而不会一次性将整个文件加载到内存中)。您的任务是处理该文件,过滤掉金额高于 10,000 的交易,然后计算总金额。使用并行流是 Java 中处理大型文件的有效方法,尤其是对于可以轻松并行化的任务,例如汇总大于一定金额的银行交易。// 并行处理文件,过滤大于 10000 的事务并求和。
2024-10-25 07:14:04
731
原创 Postgres中7个有用插件扩展
时间序列和搜索等功能大约相当于目前同类最佳选项的 80%,但 pg_search 更进一步,使其成为 elastic 的全面竞争对手,但 Postgres 却并非如此。这些都是较大的问题,但您也有很多小问题需要关注。有人问过其他扩展怎么样,它们的作用类似但不完全相同,但也做了很多其他的事情。Postgres 中的扩展与大多数其他数据库不同,它允许您修改或很好地扩展标准 Postgres 行为。在 Citus 时创建,是一个小型扩展,其功能类似于在 Postgres 中运行计划作业。
2024-10-20 11:01:14
373
原创 微信安全吗?微信MMTLS加密协议安全性分析
这个长寿命的 Longlink 连接在微信应用程序的持续时间内都是打开的,任何需要发送的加密数据都通过同一连接发送。由于微信发出的请求是双重加密的,这些问题只影响内部业务层加密,因此我们没有找到立即利用它们的方法。然而,在仅使用业务层加密的旧版微信中,这些问题是可以被利用的。其次,从业务层加密暴露未加密的内部请求 URI 的事实来看,微信的可能架构之一是托管不同的内部服务器来处理不同类型的网络请求(对应不同的“requestType”值和不同的 cgi-bin 请求 URL)。我们将这个问题留待将来研究。
2024-10-17 07:06:23
1757
原创 Java中使用指数退避和抖动实现重试
指数退避计算:等待时间使用 计算INITIAL_BACKOFF_MILLIS * 2^(attempt-1)。尝试执行该performTask()方法,直至达到最大重试次数(MAX_ATTEMPTS)。INITIAL_BACKOFF_MILLIS:初始退避时间,以毫秒(1 秒)为单位。MAX_BACKOFF_MILLIS:最大退避时间,以毫秒为单位(10 秒)。每次重试后退避时间都会增加,并且会添加抖动以防止同时重试导致服务器不堪重负。如果任务失败,重试机制将等待使用抖动指数退避算法计算的退避时间。
2024-10-16 08:54:43
936
原创 17条建模实践与原则
建模时,遵循最佳实践和原则很重要。建模者应小心谨慎,并始终牢记图表将展示和发布给其他受众。建模工件应一目了然。因此,在建模时,专注于美学方面很重要。有一些有价值的做法和非常基本的原则会大有帮助。事实上,只需遵循几条规则即可使图表更具吸引力。对于大多数商务人士来说,模型很难理解。除了架构师之外,其他人认为模型图太麻烦了。这就是为什么创建这种一眼就容易理解的图表很重要。元素大小相同,处于同一水平,彼此对齐,并且它们之间有正交线。
2024-10-16 08:08:27
702
原创 学习C4模型的新网站
总之,您可以将 C4 模型视为底层概念的简化版本,旨在 (1) 使软件开发人员更容易描述和理解软件系统的工作原理,以及 (2) 尽量缩小软件架构模型/描述与源代码之间的差距。虽然确切的日期很难确定,但 C4 模型的根源可以追溯到 2006-2009 年左右,图表类型(“上下文”、“容器”、“组件”、“类”)于 2010 年初命名,而“C4”名称于 2011 年初首次使用。一个常见的误解是,团队的设计过程应该遵循 C4 模型层次结构中的级别,也许团队中的不同人员负责不同级别的图表。
2024-09-22 11:21:54
692
原创 新提案:C++将变得内存安全
这一需求从未像现在这样迫切,因为在过去两年里,私营和公共部门组织一直在推动程序员使用 C#、Go、Java、Python 和 Swift 等内存安全语言编写新应用程序和重写旧程序,尤其是 Rust,因为它是一种性能优异的低级系统语言。Safe C++ 目标是解决传统 C++ 编程中常见的问题,例如内存管理错误和未定义行为,这些问题可能导致安全漏洞。在遭受内存安全棒的打击两年后,C++ 社区发布了一项提案,以帮助开发人员编写更不容易受到攻击的代码。有出色的借用检查和初始化分析,这是健全性保证的基础。
2024-09-18 20:31:27
629
原创 比GPT-4o更聪明:OpenAI的o1已上线
从知识中分解出推理是可能的,即一个小的“推理核心”,它知道如何调用浏览器和代码验证器等工具。然后,一个递归循环就可能开始了:他们可以用强化学习训练新的基础模型进行推理,用它生成一个更高质量的数据集,用该数据训练一个新的基础模型,训练它进行推理,用它生成一个更高质量的数据集,在该数据上训练一个新的模型......由于这一新数据集的规模没有限制,在有效的推理阐述方面质量非常高,或许还因为他们甚至可以将其结构化,使其作为指导课程逐步提高复杂性,因此在此基础上训练的新基础模型学习效率会更高,规模也会更大。
2024-09-13 10:47:09
1435
原创 5本学习Rust顶级书籍
如果您是一名软件工程师,并且有使用现有编译语言的经验,或者您一直在努力将对 Rust 语法的基本理解转化为可运行的程序,那么本书就是为您准备的。通过关注 Rust 与其他编译语言之间的概念差异,并提供程序员可以轻松遵循的具体建议, Effective Rust 很快就会让您编写出流畅的 Rust,而不仅仅是翻译得很差的 C++。《Rust 编程语言》第 2 版是 Rust 2021 的官方指南:Rust 是一种开源系统编程语言,可帮助您编写更快、更可靠的软件。出版日期:2021 年 7 月 20 日。
2024-09-05 18:43:21
1208
原创 Tunalog:无需安装的开源博客系统
Tunalog 可以在许多操作系统上运行。您还可以访问 不同架构(例如 x86、x64 或 ARM)的 GitHub 发布页面。Tunalog 是一个用 Go 编写的无需安装、易于使用的博客系统。简单的 Markdown 编辑器(由SimpleMDE提供支持)。使用相对 URL,因此即使域名发生变化,链接仍然有效。可移植的、零配置的 SQLite 文件数据库。(或者使用-p :8123参数更改端口)
2024-09-04 08:48:40
410
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人