数据科学作品集、加速 Python、KANs 及其他 5 月必读文章

原创于 2025-11-27 00:01:56 发布 · 368 阅读

4 ·

CC 4.0 BY-SA版权

License CC BY-NC-SA 4.0 / 自豪地采用谷歌翻译

文章标签：

#榛樿鍒嗙被

榛樿鍒嗙被专栏收录该内容

771 篇文章

订阅专栏

原文：towardsdatascience.com/data-science-portfolios-speeding-up-python-kans-and-other-may-must-reads-b096bdd0382c?source=collection_archive---------6-----------------------#2024-05-30

https://towardsdatascience.medium.com/?source=post_page---byline--b096bdd0382c--------------------------------https://towardsdatascience.com/?source=post_page---byline--b096bdd0382c-------------------------------- TDS 编辑

·发布于 Towards Data Science ·以新闻简报形式发送 ·4 分钟阅读·2024 年 5 月 30 日

–

感到受启发，准备写下你的第一篇 TDS 帖子吗？ 我们始终欢迎新作者的投稿。

随着五月即将结束，夏天也即将到来，尤其是对我们北半球的人来说，现在是时候回顾一下过去一个月我们发布的那些突出的文章了：那些在数据科学和机器学习领域广泛的学习者和从业者中产生共鸣的故事。

我们很高兴看到一系列特别多元的文章引起了读者的共鸣。这证明了 TDS 作者带来的多样化兴趣和经验，也表明了对能够编写干净代码、跟上最新的 LLM 进展、并且在此过程中能够讲述好故事的全能数据专业人员的需求正在增加。让我们深入了解一下吧。

每月亮点

Python 十亿行挑战——从 10 分钟到 4 秒

由于长期以来声名狼藉的慢速性能，你可能认为 Python 在热门的“十亿行”挑战中毫无胜算。Dario Radečić的这篇病毒式文章旨在展示，通过一些灵活性和创新思维，你仍然可以从代码中获得显著的时间节省。
N-BEATS — 第一个适用于时间序列预测的可解释深度学习模型

任何喜欢深入了解模型内部运作的人都应该收藏Jonte Dancker关于 N-BEATS 的精彩解释文章，这一方法被称为“首个超越传统统计方法的纯深度学习方法”，专门用于时间序列预测任务。
使用 ChatGPT 构建数据科学作品集网站：完整教程在竞争激烈的就业市场中，数据科学家不能对自己的成就和专业知识保持低调。一个作品集网站是展示这两者的强大工具，而Natassha Selvaraj的耐心指南展示了如何借助生成式 AI 工具从零开始构建这样一个网站。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/cf99723b49ecec59f17123244fa58d2d.png

图片由Tim Mossholder提供，来自Unsplash

**BERT 完全指南（附代码）**为什么不稍微回顾一下那些为今天的创新铺路的先驱模型呢？Bradney Smith邀请我们回到 2018 年（或 AI 界几十年前的时光），深入了解开创性的 BERT（双向编码器表示从转换器）模型。
为什么 LLM 不适合编码——第二部分

回到现在，我们常常听到关于程序员即将被淘汰的论调，尤其是 LLM 不断进步的背景下。Andrea Valenzuela的最新文章为我们提供了一个“慢着！”的有益提醒，她聚焦于 LLM 在跟进最新库和代码功能方面的固有局限性。
Python 中的 PCA 与 K-Means 在交通数据中的应用在我们每月精选内容中，怎样能比一篇关于核心数据科学工作流的实践教程更好地收尾呢？在她的首次 TDS 文章中，Beth Ou Yang带领我们走进一个现实世界的例子——这次是来自台湾的交通数据，展示如何使用主成分分析（PCA）和 K-means 聚类。

KANs 在聚光灯下

如果我们必须选出最近几周最受关注的话题，KAN（Kolmogorov-Arnold 网络）无疑是最容易的选择。以下是三篇优秀资源，帮助你熟悉这种在广泛传播的论文中介绍的新型神经网络。

Kolmogorov-Arnold 网络：神经网络的最新进展，简单易懂的解释

如果你想了解一篇清晰易懂的 KAN 入门文章，Theo Wolf的这篇简明易懂的文章绝对是最佳选择。
Kolmogorov-Arnold 网络（KAN）在时间序列预测中的应用

从更专业的应用角度来看，Marco Peixeiro展示了 KAN 如何在时间序列预测的背景下应用。
理解 Kolmogorov–Arnold 网络（KAN）

最后，如果你想阅读一篇更完整（但仍然易读）的论文式讲解，可以参考Hesam Sheikh的 TDS 首篇文章。