数据科学独角兽、RAG 管道、新的相关系数,以及其他四月必读文章

原文:towardsdatascience.com/data-science-unicorns-rag-pipelines-a-new-coefficient-of-correlation-and-other-april-must-reads-b1325bf78fce?source=collection_archive---------4-----------------------#2024-05-02

https://towardsdatascience.medium.com/?source=post_page---byline--b1325bf78fce--------------------------------https://towardsdatascience.com/?source=post_page---byline--b1325bf78fce-------------------------------- TDS 编辑

·发表于 Towards Data Science ·发送至 新闻简报 ·4 分钟阅读·2024 年 5 月 2 日

感到受到启发,想写第一篇 TDS 文章吗? 我们始终欢迎新作者的投稿

有些月份,我们的社区似乎会聚焦在一小圈话题上:一种新的模型或工具出现,大家的注意力迅速集中在最新的热点新闻上。而在其他时候,读者们似乎在向多个不同的方向移动,深入探讨各种各样的工作流程和主题。上个月显然属于后一种情况,当我们回顾最受读者关注的文章时,我们被它们视角和焦点的多样性所震撼(并且印象深刻!)。

我们希望你喜欢我们精选的几篇四月最受欢迎、最被分享和讨论的文章,其中包括今年迄今为止最受欢迎的几篇文章,以及几篇高质量(且适合初学者的)解读文章。

月度亮点

  • 神经网络背后的数学到现在为止,几乎没有人需要介绍 Cristian Leo的机器学习核心概念系列指南。毫无疑问,其中没有比神经网络更重要的基础模块了,因此,这篇深入探讨其背后数学的文章在我们读者中取得了巨大成功也就不足为奇了。

  • Pandas:从杂乱到美丽看到一位作者的第一篇 TDS 文章能够引起广泛读者的共鸣,总是令人欣喜;这正是Anna Zawadzka关于如何优化 Pandas 代码的实用指南所取得的成就,为保持代码“简洁且万无一失”提供了可操作的建议。

  • 一种新的相关系数真正的统计学突破如今并不常见——这也解释了为什么Tim Sumner的文章引起了数据专业人士的广泛关注,因为这篇文章介绍了一种“全新的衡量两变量关系的方法,这种方法可能比相关性更好”。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/56d093019623ed813781324f75e63d50.png

照片来自micheile henderson提供,来源于Unsplash

  • **如何构建本地开源 LLM 聊天机器人(RAG)**几个月前,在机器学习领域初露锋芒的 RAG 方法似乎并未失去它的光彩。Dr. Leon Eversberg的教程便是一个例证:它为不断增长的工具列表增添了一个新颖的解决方案,使我们能够与 PDF 文档“对话”。

  • 深入了解手动构建 TransformerTransformer 的指南和技术演示并不难找到。Srijanie Dey, PhD的贡献之所以与众不同,是因为其易于理解和清晰的表达——这使得这篇文章成为初学者和视觉型学习者的强大资源,尤其是在配合精心设计的插图后。

  • 从数据科学家到 ML/AI 产品经理职业转型从来都不是一件简单的事情,尤其是在求职者面临艰难时期时更是如此。Anna Via分享了大量的灵感,同时结合了她个人成功转型为机器学习产品经理的经验,提供了许多可操作的建议和洞察。

  • 全栈数据科学家的四顶帽子成为一名真正的“全栈”数据专业人士需要具备什么?Shaw Talebi最近推出了一系列文章,详细探讨(并回答)这个问题;这篇文章是该系列中的第一篇,提供了关于数据科学家核心技能的高层次视角,能够“看到大局并根据需要深入项目的具体方面”。

  • 认识 NiceGUI:你即将最喜欢的 Python UI 库

    难以跟上每天发布的所有令人兴奋的新库、包和平台——这就是为什么一篇详细、充满见解的第一手评论如此有用的原因。Youness Mansar 正是通过他的 NiceGUI 介绍,旨在实现这一目标,NiceGUI 是一个基于 Python 的开源 UI 框架。

  • 线性回归与因果推断往往,简单就是成功的关键。Mariya Mansurova在她的产品分析因果推断指南中一再强调这一点,该指南避免了复杂的算法和方程式,转而采用了经过验证的线性回归方法。

我们最新的一批新作者

每个月,我们都很高兴看到一群新的作者加入 TDS,每个人都与我们的社区分享他们独特的声音、知识和经验。如果你正在寻找新的作家来探索和关注,只需浏览我们最新加入的作者作品,包括Thomas ReidRechitasinghAnna ZawadzkaDr. Christoph MittendorfDaniel Manrique-CastanoMaxime WolfMia DwyerNadav Har-TuvRoger NobleMartim ChavesOliver W. JohnsonTim SumnerJonathan YahavNicolas LupiJulian YipNikola Milosevic (Data Warrior)Sara NóbregaAnand MajmudarWencong YangShahzeb NaveedSoyoung LKate MinogueSean ShengJohn Loewen, PhDLukasz SzubelakPasquale Antonante, Ph.D.Roshan SanthoshRunzhong WangLeonardo MaldonadoJiaqi ChenTobias SchnabelJess.ZLucas de Lima NogueiraMerete LutzEric BoernertJohn Mayo-SmithHadrien MariacciaGretel TanSami MaameriAyoub El OutatiSamvardhan VishnoiHans Christian EkneDavid KyleDaniel Pazmiño VernazaVu TrinhMateus TrentzNatasha StewartFrida KarvouniSunila Gollapudi,以及Haocheng Bi等人。

感谢您支持我们作者的工作!我们热衷于发布新作者的文章,如果您最近写了一篇有趣的项目演示、教程或关于我们核心主题的理论反思,欢迎随时与我们分享

直到下一个变量,

TDS 团队

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值