原文:
towardsdatascience.com/decoding-writing-success-on-medium-c78972d91375
快速成功数据科学
Medium 读者和收入(按作者)的折线图
如果你曾在 Medium 上写作,你可能会意识到该平台为你提供的大量关于你的故事和受众的统计数据。深入研究这些统计数据可以揭示关于你当前表现以及如何进一步提升的有用见解。
我从 2023 年 1 月开始在 Medium 上写作,创作了实用的 Python 编程教程,偶尔涉及物理学、超自然现象和数据分析。直到 2023 年 2 月底,我才获得了 100 名粉丝并加入了 Medium 合作伙伴计划(是的,我们这些老手不得不乞求和借来我们最初的 100 名粉丝以获得收入)。在 15 个月和 57 篇文章之后,我决定回顾并反思我的进步。
在这篇文章中,我分享了我的研究结果,并展示了如何通过彻底检查 Medium 的故事和受众指标来帮助你增加读者数量和收入。
主要问题
以下是我想要解决的主要问题:
-
基础或高级主题哪个更受欢迎?
-
哪些主题最受欢迎?
-
哪些内容被提升得最多?
-
提升如何影响收入?
-
读者数量如何影响收入?
-
文章长度如何影响收入?
-
我对未来 15 个月有什么期望?
-
我如何提高我的收入?
主要发现
以下是我根据我前 15 个月的写作经验得出的高级发现:
-
关于流行可视化库的入门级教程表现最佳。
-
被出版并推广的文章表现最佳。
-
提升并不保证成功。
-
基础和高级/细分文章的推广率相同。
-
可视化文章获得了最多的提升。
-
收入与文章的预估阅读时间之间存在正相关关系。
-
成功的文章往往(但并非总是)导致粉丝数量的激增。
-
粉丝数量对收入的影响很小。
-
通过专注于阅读时间超过 9 分钟的视觉化和基础编码入门级教程,我的收入可以显著增加。
数据集
Medium 提供的默认分析不足以评估影响提升和收入的因素。为了弥补这一点,并针对我的写作风格,我从故事和受众统计数据页面创建了一个自定义电子表格。这包括添加新的类别,例如文章的学习水平、主题和特色图书馆。(关于此过程的更多信息,请参阅文章末尾的“分析你自己的统计数据”)。
下面的部分通过图表总结了我的故事统计数据。这些图表是在 JupyterLab 中使用 Python(主要是 pandas、Matplotlib 和 seaborn 库)制作的。
下面的表格总结了我的部分关键 Medium 统计数据:
重要 Medium 统计数据表格总结(按作者)
这些数字令人失望,但我知道第一年会很困难。因此,这个项目的主要目标是根据当前趋势估计未来的表现,并寻找改进结果的方法。
下面是对文章类型及其是否代表基础(入门级)或高级主题的分解。教程类别包括代码和详细的描述。分析类别更侧重于数据分析的结果,而不是结果是如何获得的。
大部分文章是关于高级或专业主题的教程(按作者)
剧透警告:基础级别的文章收入更高,所以我专注于错误的事情。不幸的是,我非常喜欢写关于错误的事情。
我涉及的前三大主题是数据可视化(Viz)、数据分析,以及自然语言处理(NLP):
文章主题的分解(按作者)
我撰写最多的三个 Python 库是 Matplotlib、Plotly Express 和 seaborn:
特定库的分解(按作者)
我的大部分文章都发表在*数据科学走向*:
每个出版物发表的文章数量(按作者)
总体来说,我平均每月写四篇文章。这一点很重要,因为它意味着随着时间的推移,收入的改变是由除了简单地写更多故事之外的因素驱动的。
每月发表文章数量(按作者)
提升的影响
本节总结了我的文章的“提升”状态及其对我的粉丝数量和收入的影响。提升是 Medium 通过向广泛受众分发优质故事来推广好故事的方式。
您可以通过点击 Medium 合作伙伴计划页面上的文章名称来判断一篇文章是否已被提升。提升的文章在摘要行右侧有一个“向上箭头”图标:
在你的 Medium 合作伙伴计划页面上,提升图标出现在单个文章统计信息的最右侧(按作者)
除了提升,出版商可以通过将其添加到他们的阅读列表、通讯等来推广文章。我在数据集中将这个过程标记为“精选”。
虽然有可能在没有提升的情况下对文章进行精选,但我的文章中没有符合这一类别的,因此在图表中看不到,我无法评估其对收益的影响。
在我的 57 篇文章中,有 15 篇(26%)被提升:
57 篇文章的提升状态(按作者)
《数据科学向导》 发布了我大部分的已提升文章。最受欢迎的主题是数据可视化。不出所料,这与出版商和主题的文章分布相一致。
按出版物(按作者)提升的文章数量
按主题(按作者)提升的文章数量
下一个图表总结了我每月的总收益:
每月总收益(按作者)
后几个月的文章从出版物和提升中的收益更多,而不是从粉丝数量的增加中。
提升与精选与粉丝数量
下面的图表显示了随着时间的推移我的累计粉丝数:
带有提升状态的累计粉丝数与时间标注(按作者)
如您所见,提升和精选有可能增加粉丝,但没有保证。一些提升有显著影响,导致粉丝数量激增。其他提升则没有效果。
2023 年 11 月之后,线的斜率增加,表明粉丝数的积累速度更快。这可能与这一时期比 11 月之前的提升数量更多有关。
提升与精选与收益
下面的图表显示了随着时间的推移我的累计粉丝数和收益。在我写作的前 10 个月,我的收益与粉丝数量紧密相关。2023 年 11 月,当*揭秘 Matplotlib* 被提升和精选时,趋势发生了分歧。这导致收益激增。
带有提升状态的累计粉丝数与收益与时间标注(按作者)
从两条线中可以清楚地看出,提升对收入有显著影响。在 2023 年 11 月之前,收入和关注者的线条具有相似的斜率,这表明收入增加部分是由关注者数量的增加驱动的。之后,收入更多地受到提升的驱动。
提升与提升及编辑
平均而言,提升和编辑的文章比仅提升的文章收入更高(我没有关于仅编辑文章的数据)。同样,提升的文章也显著优于非提升的文章。
按提升状态平均收入(按作者)
结论是,提升是 Medium 上写作第一年成功的关键因素。
关注者数量对收入的影响
关注者数量对收入有影响吗?看起来不是,至少在第一年或更长时间内不是。
为了判断关注者数量对收入的影响,我从数据集中排除了提升文章。以下是结果:
排除提升文章后的收入随时间变化(按作者)
回归线是正的,但幅度不大。尽管在 15 个月内增加了近 2100 名关注者,但与提升相比,收入的影响微乎其微。
收入与时间
以下图表显示了收入与文章数量(时间的一个代理)的关系。标记按不同参数着色并按提升状态调整大小。
学习水平对收入的影响
通过绘制收入与文章数量(按学习水平着色)并按提升状态调整大小,揭示提升是收入成功的关键,并且基础级和高级故事提升的速度大致相同。然而,基础级文章的收入最高。
按学习水平着色并按提升状态调整大小的文章收入与文章数量(按作者)
为了量化上述内容,基础级教程的平均收入是高级和细分教程的 8 倍:
基础级教程比高级教程更有利可图(按作者)
主题对收入的影响
同样的图表按主题着色显示,可视化文章被提升最多,是唯一被编辑的文章,并且是收入最高的文章之一。一般“编码”主题显示出希望,因为关于Python 类的文章是第三高收入者。
按主题着色并按提升状态调整大小的文章收入与文章数量(按作者)
出版商对收入的影响
同一图表按出版商着色显示了Towards Data Science的统治地位,包括作为提升者/策展人。
收入与文章按发布时间和按作者状态提升级别着色的大小对比图
从之前的图表中得出的一个令人清醒的结论是,如果没有提升,我的文章在 15 个月内不会在收入上显示出显著的改善。
预测未来收入
在本节中,我根据过去的结果预测我的未来收入。由于这方面的不确定性很大,我决定放弃复杂的方法,坚持使用简单的线性回归技术。
作为对不确定性的承认,我生成了乐观和保守两种结果。一个关键假设是我将平均每月继续撰写四篇 Python 教程(我在 4 月份在这方面已经彻底失败了)。
本分析的目标不是准确预测未来 15 个月内我会赚多少钱,而是看看什么看起来是合理的。例如,虽然我不为了钱写作(感谢上帝!),但我仍然希望每月通过在 Medium 上写作赚取大约 1000 美元。如果即使是最乐观的情况看起来不可能实现,我可能需要重新思考我的整个策略。
方法论
我使用 Python 的statsmodels库来估计一个稳健的回归,其中异常值被降权以进行保守预测。由于我的异常值代表积极的结果,这将减少它们对未来收入的贡献。
我使用了普通最小二乘法选项,其中异常值有更大的影响力,以对更乐观的预测进行回归估计。
在图表中,保守的回归线被标记为“稳健线性模型”。乐观的线被标记为“普通最小二乘法”。
收入与阅读时间对比
虽然我没有很多长篇文章,但我确实发现收入和阅读时间之间存在正相关关系:
按作者对收入与阅读时间模型拟合的图表
我 57 篇文章的平均阅读时间约为 9 分钟。这张图表表明,我可以通过撰写超过 9 分钟的文章来略微增加我的收入。
收入与时间预测对比
下面的图表展示了随着时间的推移收入增长的情况。因为我作为 Medium 上的作家还处于早期阶段,我认为假设当前的收入趋势至少还会持续一年是合理的。
按作者对收入与文章数量对比的图表
我可以使用两条回归线的公式来预测,如果我在接下来的 15 个月内再写 57 篇文章,我可能会赚多少钱。结果是保守情况下的 4300 美元和乐观情况下的 11500 美元。
作为检查,乐观模型为我的前 57 篇文章产生了总计 3,765 美元的收入,接近实际的 3,575 美元。保守模型的结果要低得多,为 1,393 美元。
乐观情况下的月平均收入为 767 美元。虽然这低于我想要的 1,000 美元的目标,但它也假设我的当前流程不会发生变化。
但如果我明智地利用这些结果来撰写更受欢迎的文章呢?例如,如果我坚持编写关于编码和可视化的基本教程呢?以下是图表:
按作者过滤到基本级别可视化和编码文章的收入
对于这个过滤数据集的保守模型,15 个月的总收入约为 108,000 美元。这意味着每月 7,200 美元!
此外,我没有将撰写更长的文章考虑在内,正如我之前的分析所示,这将理论上产生更多的收入。
虽然我一点也不相信我能每月赚 7,200 美元,但它表明在接下来的 15 个月内还有很大的增长空间,并且我每月 1,000 美元的目标是可实现的。我只需要撰写更长(> 9 分钟)的初学者级别编码和可视化主题教程。
注意:在一年内你可以获得多少次提升肯定有一个限制。我没有将这一点纳入分析。
一些其他统计数据
这里有一些我在分析中没有使用的其他有趣统计数据。
阅读比例
“阅读比例”指标试图捕捉阅读故事而不是快速浏览并继续前进的观众百分比。基于 Medium 成员的阅读比例有助于提高文章的收入。
这是按主题组织的文章阅读比例:
每个主题的平均阅读比例(按作者)
这些结果有些偏差,因为物理、超自然和包管理类别中每个类别只有一篇文章。我也怀疑编程教程的阅读比例低于平均水平,因为它们在手机上不太容易访问。我倾向于快速浏览它们,将它们添加到列表中,然后忘记再次查看。
每个出版物的平均收入
这是根据发表情况计算的平均收入。结果有所偏差,因为我为每个出版物撰写的文章数量并不相同(黑色圆点代表出版商的文章数量)。
按作者按出版物计算的平均收入
失去的粉丝
Medium 受众页面包括关于获得和失去粉丝的信息。失去的类别可能很有趣,尽管不是非常有洞察力。例如,我在 2024 年 3 月失去了 29 个粉丝!
每月每位作者失去的粉丝数量
这有点令人困惑,因为我没有写那些可能让人避而远之的具有争议性或政治敏感性的文章。我的最好猜测是,这可能是由于我的*介绍 Seaborn 对象*故事。Python 程序员们对他们的绘图库有着奇怪的激情!
分析您自己的统计数据
如我之前所提到的,Medium 内置的分析并不提供足够的细节,让您评估像提升和收入这样的结果。这需要为您的写作风格创建一个个性化的电子表格。然后您可以使用 Excel、Python、R 或您喜欢的任何工具来分析这个文件。
要下载您的关注者和订阅者统计数据,请点击您的受众统计页面上的“下载 CSV”超链接。
获取您其他统计数据,如故事名称、浏览量、收入等,并不像下载统计数据那样直接。一种方法是将它们手动输入到电子表格中。另一种方法是使用他人提供的说明(或编写自己的代码)以编程方式访问它们。以下列出了一些来源,但请注意,您仍然需要对这些结果进行整理,以添加分析所需的相关粒度。
警告: 我并没有评估所有这些来源。请注意,其中一些技术有可能将恶意软件加载到您的机器上。
Medium API(非官方)- 从 Medium 获取您的数据
我在这篇文章中展示的所有图表都是基本类型,如柱状图、散点图、折线图和饼图,应该很容易复制。如果这篇文章很受欢迎,或者如果足够多的人要求在评论中提供代码,我将在另一篇文章中发布我的 Jupyter Notebook。
摘要
分析您的 Medium 统计数据可以帮助您实现写作目标。虽然 Medium 提供了内置的表格和图表来帮助您,但它们缺乏足够的粒度,无法深入理解哪些方法有效,哪些无效。
通过将您的指标导出到电子表格,并为您的故事添加特定类别的额外列,您可以解决您对结果的关键问题。此外,您还可以过滤数据集到特定类别,进行“如果…会怎样”的游戏,并预测未来的收入。
当然,这种分析假设你将继续在相同的主题上写作。它无法告诉你你尚未涉猎的话题。据我所知,如果我只写关于乐高迷你人偶和糟糕的吸血鬼电影,我的收入可能会翻四倍!
感谢!
感谢阅读,请未来继续关注我的更多快速成功数据科学文章。
658

被折叠的 条评论
为什么被折叠?



