- 博客(661)
- 资源 (1)
- 收藏
- 关注

原创 《算法岗面试宝典》重磅发布!
薪资真香、技术难度真大、要求真的很全面,但不是没有方法可循、可借鉴的。业务知识 + 专业知识 + 编程基础能力+刷题(LeetCode/剑指Offer) + 项目 + 实习 + 竞赛 +顶会/顶刊+学校针对岗位要求,我在知识星球和《算法面试宝典》中详细给大家介绍。让加入的朋友了解最前沿的知识点,有问题给予专业指导,少栽跟头。这份《算法面试宝典》,文档字数 30w+,我们也在一直更新,涵盖算法岗的方方面面,相信你读完并思考实践后,你一定能有所收获。
2024-10-02 14:20:43
563

原创 3.5万字,图解 Pandas
大家好,在 Python 各个工具包中,最频繁使用的应该就是 Pandas 了。今天我以图解的方式给大家介绍 Pandas 中各种常用的操作,内容有点长,
2023-03-31 10:16:01
1268
2

原创 终于盼到了,Python 数据科学速查表中文版来了
近几年以来,Python 的应用场景越来越多,几乎可以应用于自然科学、工程技术、金融、通信和商业等各种领域。究其原因在于 Python 的简单易学、功能强大。想系统地学点东西,发现很多不错的技术文档都是英文资料,发现英文竟然成为了学习的拦路虎。非常幸运的是,DataCamp 推出的 Python 数据科学速查表,已经翻译成中文啦!高清资料已打包。喜欢点赞支持、欢迎收藏学习。领取方式:资料已打包,获取方法有两种:方式一、发送如下图片至微信,长按识别,回复:资料;方式二、微信搜索公众号:Python
2021-11-30 09:04:15
3315
3

原创 爱了爱了,20个好用到爆的Python函数
大家好,今天分享20个日常工作中必不可少的Python函数,这些函数平时看到的不多,但是它们使用起来倒是非常的方便,它们可以大幅度地提高工作效率。内容较长,欢迎收藏学习,喜欢点赞支持,文末有技术交流群,欢迎加入。isin()方法isin()方法主要是用来确认数据集当中的数值是否被包含在给定的列表当中df = pd.DataFrame(np.array(([1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12])), index=['
2021-11-25 19:30:38
21690
13

原创 这次不迷路了!最全 Python 学习路线图+14张思维导图真香啊!
导图作者 | ZOE@数林觅风ZOE是一名医学生,在自己博客分享了很多高质量的思维导图。本文中所列的14张思维导图,是17年作者开始学习Python时所记录的,希望对大家有所帮助。原文:https://woaielf.github.io/2017/06/13/python3-all/呕心沥血用14张思维导图将 Python 编程的核心知识总结出来,现分享给大家。按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组,字典,集合),条件&
2021-10-19 17:11:02
2592
2

转载 实战案例!用 Python 绘制全国鸿星尔克门店分布图,最多的是你所在城市吗?
最近的鸿星尔克,频频上热搜!咱们今天就以某度地图 用Python爬虫看一下全国到底有多少家鸿星尔克门店?又到秋冬换季买衣服的时候了,可以考虑支持一波。喜欢本文点赞支持,文末提供技术交流群。需求分析首先我们打开地图搜索“鸿星尔克”:F12打开浏览器开发者模式,找到如下链接。复制该链接到浏览器,发现这是一个json格式的数据集。我们所需要的省份和对应数量还有各个城市对应的数量都在其中。发送请求我们首先模拟浏览器来发送请求获取到这个json数据集,然后获取各个城市鸿星尔克门店及其对应数量
2021-10-16 22:00:17
5230
5

原创 【视频+PPT】2021年李宏毅版40节机器学习课程已更新完毕,推荐收藏!
提起李宏毅老师,熟悉机器学习的读者朋友一定不会陌生。最典型的就是开局一言不合就“宝可梦”。李宏毅老师幽默风趣的教学风格也吸引力很多机器学习爱好者。李宏毅老师,是宝岛台湾大学电机工程系教授,他分别于2010年和2012年获得硕士和博士学位,主要研究机器学习尤其是深度学习、语言理解和语音识别。李宏毅老师的机器学习课程可以说是最具代表性的中文公开课之一,已经成为大量国内初学者的首选。截至目前,2021年版的机器学习40节课程已经全部更新完毕,全程中文讲解,覆盖的内容也非常丰富,视频均长约40分钟,内容较多,喜
2021-10-05 06:26:12
1286
1

原创 李航老师《统计学习方法(第二版)》课件 & 算法代码全公开了!
李航老师的《统计学习方法》第二版的代码实现更新完毕,本文提供下载。李航老师编写的《统计学习方法》全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。《统计学习方法》可以说是机器学习的入门宝典,许多机器学习培训班、互联网企业的面试、笔试题目,很多都参考这本书。我们将.
2021-03-14 21:33:39
3138

原创 Mac python matplotlib Glyph xxxxx missing from current font的解决方案
最近想使用matplotlib画图,发现plot出来的图无法显示中文,都是如下图的小方格,查找了很多资料,基本都是这样处理,其实这样处理基本上都是无用的(mac版本的),解决方案我在下面给出,如果你遇到相似的问题,请继续阅读。from matplotlib import font_manager as fm, rcParamsimport matplotlib as pltplt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签plt.rcParams['
2020-07-04 18:18:41
9472
9
原创 《算法岗面试宝典》重磅发布!
薪资真香、技术难度真大、要求真的很全面,但不是没有方法可循、可借鉴的。业务知识 + 专业知识 + 编程基础能力+刷题(LeetCode/剑指Offer) + 项目 + 实习 + 竞赛 +顶会/顶刊+学校针对岗位要求,我在知识星球和《算法面试宝典》中详细给大家介绍。让加入的朋友了解最前沿的知识点,有问题给予专业指导,少栽跟头。这份《算法面试宝典》,文档字数 30w+,我们也在一直更新,涵盖算法岗的方方面面,相信你读完并思考实践后,你一定能有所收获。
2025-03-29 22:48:19
259
原创 图解 Attention,从MHA到DeepSeek MLA,非常详细!
对于一个输入序列中的某个词,都会与序列中的所有词计算相关性。假设有一个输入序列:对于每个词 ,我们计算它与所有其他词的相关性,并赋予不同的权重,然后将这些信息进行加权求和,得到新的表示。当前这里的每个词都要在经过Embedding之后,再做权重转换。
2025-03-29 22:40:13
906
原创 北大DeepSeek使用手册来了,清北是在“神仙打架”吗?
清华之前出了 5 份 DeepSeek 的相关教程,北大近期了也出了两个,做个整理。。。
2025-03-03 22:23:24
275
原创 DeepSeek杀死了Excel!感觉我要失业了!
节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。2025开年相信大家都被DeepSeek刷屏了,DeepSeek以极地训练成本这么低,就获取了跟ChatGPT相近的性能,给美国科技圈一记暴击。有不少粉丝都问道DeepSeek应该怎么使用?只要你会将文字输入到AI对话框里,就能使用AI工具提高工作效率,下面就有把手教你如何使用DeepSeek解决Excel问题。
2025-02-12 21:14:16
347
原创 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
从避免AI幻觉的小窍门,到设计出色提示语的秘籍,每一页都凝聚着干货知识,让用户能够直接上手操作,快速掌握DeepSeek的精髓。这份文档不仅为用户提供了关于DeepSeek的全面知识,还体现了中国科技在人工智能领域的快速发展。《DeepSeek:从入门到精通》以通俗易懂的方式,全面介绍了DeepSeek的使用方法,为用户提供了极具价值的指导。这份文档内容丰富,篇幅长达104页,涵盖了众多实用技巧。
2025-02-12 21:12:00
461
原创 完整的671B DeepSeek R1本地部署,详尽教程来了!
节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经足够好用,但把模型部署到本地,才能真正实现独家定制,让 DeepSeek R1 的深度思考「以你为主,为你所用」。
2025-02-06 21:50:31
4628
原创 《大模型面试宝典》(2025版) 发布了
基于去年我们写的《大模型面试宝典》(2024版)的基础上,我根据自己实践经验和星球小伙伴的面经分享总结推出《大模型面试宝典》(2025版),共计52w+字。与去年相比,内容增加了星球成员面试真题分享、大模型最新考试要点总结、DeepSeek 项目实战、业内同行大模型实战项目总结,同时删除了一些老旧内容。相信读完后,无论你是学生还是在职人员,在求职面试和工程实践方面一定能会有所收获。
2025-02-06 21:40:59
536
原创 把 DeepSeek 部署在你的电脑上(保姆级教程)
如果是32b参数的,就需要32G显存啦,可以根据自己的电脑性能选择。最近做的一个视频,讲了DeepSeek的本地部署,在全网取得了600万+的播放量,大家对DeepSeek的本地部署很热情。如果安装半天没完成,容易打击到学习AI的热情,这也是为什么我做的视频里,没有讲Open-WebUI安装步骤的原因。Open-WebUI这部分的安装过程比较简略,如果出现报错,需要具备通过浏览器搜索问题原因,并修复的能力。本地部署首先要安装ollama,你可以把它理解为,一个装AI的盒子,把AI装在盒子里,方便管理。
2025-02-03 23:49:39
1577
原创 双非本 985 硕士,秋招上岸字节算法岗!
最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。背景:电子科技大学 985硕士 字节算法岗Offer我最近已有几次大厂面试经历,目前还在刷面经和复盘,想想面试的时候,什么地方回答的不好(主要是项目经历的部分)总结整个面试下来,基础题偏多,算法原理的内容也不少,工程方面偏向于工程落地实现。
2024-10-02 14:25:36
606
原创 Pandas AI:最棒的大模型数据分析神器!
暑期实习基本结束了,校招即将开启。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。想象一下,能够像和最好的朋友交谈一样与你的数据对话,这就是 Pandas AI 的功能!这个 Python 库具有生成式人工智能能力,可以将你的数据框变成会话者。它像一个超级英雄的助手,会帮助你解决问题,让你的生活更轻松。
2024-06-15 09:05:48
1163
原创 PyGWalker:Python 中最好的数据分析库
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对数据分析、数据挖掘、算法,新手该如何快手入门、该如何准备面试、面试常考点分享等热门话题进行了深入的讨论。你在 Jupyter Notebook 中有一堆数据需要分析和可视化。PyGWalker 就像一个神奇的工具,使这一过程变得超级简单。它将你的数据转换成一种特殊的表格,你可以像使用 Tableau 一样与之交互。你也可以直观地探索数据,随意操作,发现模式和见解,而不会迷失在复杂的代码中。
2024-06-01 16:28:35
900
1
原创 腾讯算法岗面试,问的贼细!
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法类的技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。暑期实习基本结束了,校招即将开启。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。
2024-05-31 00:00:21
694
原创 面试度小满机器学习算法岗,一面竟然挂了。。。
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法类的技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。上周我们星球上一位小伙伴跟我聊天,跟我分享了他面试度小满机器学习算法的面经。时间:不到1个半小时面试内容:自我介绍对项目的进行深度盘问做题:最长上升子序列,要求:空间O(n)、时间O(nlogn)、返回字典序最小的 (不会写,写了一个时间、空间都O(n^2)的算法)
2024-05-01 14:21:31
753
1
原创 这 6 个探索性数据分析(EDA)工具,太实用了!
当进行数据分析时,探索性数据分析(EDA)是一个至关重要的阶段,它能帮助我们从数据中发现模式、趋势和异常现象。而选择合适的EDA工具又能够极大地提高工作效率和分析深度。在本文中,我将介绍6个极其实用的探索性数据分析(EDA)工具,这些工具能够帮助您更好地理解数据、发现隐藏的信息,并为后续分析和决策提供有力支持。让我们一起来看看这些工具是如何帮助我们探索数据世界的吧!
2024-04-13 18:41:21
1330
原创 深度学习实战案例:使用 Transformers 进行概率时间序列预测实战
接下来,让我们实例化一个模型。该模型将从头开始训练,因此我们不使用 from_pretrained 方法,而是从 config 中随机初始化模型。我们为模型指定了几个附加参数:prediction_length (在我们的例子中是 24 个月) : 这是 Transformer 的解码器将学习预测的范围;context_length: 如果未指定 context_length,模型会将 context_length (编码器的输入) 设置为等于 prediction_length;
2024-04-13 18:09:00
1154
原创 面滴滴机器学习算法岗,居然被问到了大模型相关问题。。。
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法类的技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。上周我们星球上一位小伙伴跟我聊天,跟我分享了他面试滴滴机器学习算法岗的面经。让他惊讶的是,面试官居然问他是否使用大模型、如何让大模型提升自己的工作效率、大模型的微调、量化等问题,直言不会大模型相关内容,让自己的优势立马消失了。
2024-03-31 08:50:18
823
原创 《大模型面试宝典》(2024版) 正式发布!
2022 年11月底,OpenAI 正式推出 ChatGPT ,不到两个月的时间,月活用户就突破1亿,成为史上增长最快的消费者应用。目前国内已发布的大模型超过200个,大模型的出现彻底改变了我们的生活和学习方式。只要你想从事 AI 相关的岗位,无论是计算机视觉(CV)、自然语言处理(NLP)、搜广推、风控、机器学习算法等,大模型相关话题都是绕不开的。可能唯一的区别就是场景和问题难度上。最近我们星球群组织了一场AI技术&面试讨论会,邀请了一些互联网大厂朋友、最近参加社招和校招面试的同学。
2024-03-31 08:36:44
653
原创 最强、最全面、最频繁考的 SQL 面试题汇总(含答案)
年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂朋友、23年参加社招和校招的同学来分享:新人如何入门数据和算法岗,面经/面试题经验分享、大厂在算法场景的落地项目及经验分享等热门话题。结合讨论内容,今天我总结一下面试中最频繁被考的 SQL 面试题,
2024-03-20 23:38:41
2102
原创 面了几家大厂数据挖掘岗,题是一家比一家难。。。
年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂同学和23年参加招聘的同学来分享:新人如何入门数据和算法岗,面经/面试题分享、大厂在算法场景的落地项目及经验分享等热门话题。今天分享一位星球成员的上岸之旅,最终成功拿下。希望对后续找工作的有所帮助。如果你想加入我们的讨论群或者希望要更详细的资料,现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。先介绍一下我自己的情况,我本科211,硕士985。
2024-03-20 22:46:16
874
原创 成功上岸字节跳动数据分析岗,流程很快,分享面经!
年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂同学和23年参加招聘的同学来分享:新人如何入门数据和算法岗,面经/面试题分享、大厂在算法场景的落地项目及经验分享等热门话题。今天我整理一位小伙伴的面经验,分享给大家,希望对后续找工作的有所帮助。
2024-02-27 22:57:42
1066
原创 腾讯数据分析岗面经,面试时死板背答案不可取~
年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂同学和23年参加招聘的同学来分享:新人如何入门数据和算法岗,面经/面试题分享、大厂在算法场景的落地项目及经验分享等热门话题。今天我整理一位小伙伴的面经验,分享给大家,希望对后续找工作的有所帮助。
2024-02-27 22:52:02
1051
原创 滴滴风控机器学习算法岗面试题8道(含答案解析)
快速排序(QuickSort)的平均时间复杂度为O(n log n),最坏情况下的时间复杂度为O(n^2)。快速排序的稳定性取决于具体的实现方式。通常情况下,快速排序是不稳定的,因为在分区过程中,元素的相对顺序可能会改变。快速排序的不稳定性是由于分区过程中的元素交换操作引起的。在分区过程中,我们选择一个基准元素(通常是第一个或最后一个元素),将小于基准的元素放在基准的左边,大于基准的元素放在基准的右边。在交换元素的过程中,相等元素的相对顺序可能发生改变,从而导致排序结果的不稳定性。
2024-02-26 11:28:39
1781
原创 美团营销机器学习算法岗(实习)面试题9道(含答案解析)
一种评估模型性能的统计学方法,通常用于训练样本有限的情况。将数据集划分为多个子集,多次训练模型,并在每次训练中使用不同的子集作为验证集,其余作为训练集。常见的交叉验证方法包括k折交叉验证和留一法。
2024-02-26 11:00:26
1615
原创 100个 Python 小技巧,有效增强你的数据处理能力
Python 凭借其强大的工具库提供了一系列功能,简化了数据操作和分析。本文分享 100 个必备的 Python 代码,每个都经过精心设计,旨在增强您的数据处理能力。从基本的数据清洗技术到高级的数据转换和分析策略,这些一行代码旨在简化您的编码工作流程,提高处理速度,并从数据中解锁更深层次的洞察力。
2024-02-18 11:45:45
1035
原创 面了滴滴的数据分析师(实习),几道面试题都是原题啊。。。
年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。,以下是这位同学自述。
2024-02-12 21:47:59
777
原创 聊一聊国内大模型公司,大模型面试心得、经验、感受
这段时间面试了很多家,也学到了超级多东西。楼主这边背景是做基座预训练算法端为主的,对框架端和RL的内容有一定了解(面试能凑合),对于后端的知识比如ML compiler,kernel,cuda相关的了解就比较浅了(问到觉大概率挂)。硬件几乎不太懂。感觉一圈聊下来几点感悟:大模型这方向真的卷,面试时好多新模型,新paper疯狂出,东西出的比我读的快。Research岗位对工程也有要求,工程端也需要了解模型。感觉比较硬核的岗位,尤其初创公司都是对好几个点都有要求的(应用,模型,框架,底层后端,硬件)。
2023-09-29 14:43:33
1573
原创 这应该是最全的机器学习模型可解释性的综述
模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总 survey。
2023-09-09 08:07:25
792
原创 GPU安装指南:英伟达H800加速卡常见软件包安装命令
如果使用H800,CUDA版本要在11.8及以上,同时,PyTorch版本要在2.0.0以上。下面是我使用CUDA为11.7,同时PyTorch为1.13.1的报错信息。
2023-08-20 13:45:33
5234
2
原创 一文入门最热的LLM应用开发框架LangChain
假如我们想要用 openai api 对一个段文本进行总结,我们通常的做法就是直接发给 api 让他总结。但是如果文本超过了 api 最大的 token 限制就会报错。这时,我们一般会进行对文章进行分段,比如通过 tiktoken 计算并分割,然后将各段发送给 api 进行总结,最后将各段的总结再进行一个全部的总结。LangChain 很好的帮我们处理了这个过程,使得我们编写代码变的非常简单。# 导入os,设置环境变量。导入文本加载器、总结链、文本分割器及OpenAI模型import os。
2023-08-20 12:35:16
1807
1
mac版SimHei(黑体)
2020-07-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人