Python 贝叶斯分析第三版（三）-优快云博客

原文：annas-archive.org/md5/23c902bea72dd81eede00e0b57b70813

译者：飞龙

协议：CC BY-NC-SA 4.0

第十一章

接下来该做什么

统计学家是对一个愤世嫉俗的数据科学家的技术称谓。——吉姆·萨维奇

我写这本书是为了向那些已经熟悉 Python 及其数据处理库，但不太熟悉统计分析的读者介绍贝叶斯统计的主要概念和实践。通过阅读前十章，你应该对贝叶斯统计的许多主要主题有了合理的实际理解。虽然你不会成为一个专家级的贝叶斯“忍者黑客”（不管那是什么），但你应该能够创建自己的概率模型来解决自己的数据分析问题。如果你真心喜欢贝叶斯统计，这本书远远不够——没有一本书能够做到足够的深度。

要在贝叶斯统计中变得流利，你需要实践、时间、耐心、更多的实践、热情、问题，甚至更多的实践。你还将从不同的角度重新审视这些思想和概念中受益。为了收集更多材料，你应该查看 PyMC 文档www.pymc.io、Bambi 文档bambinos.github.io/bambi/、ArviZ 文档python.arviz.org以及 PreliZ 文档preliz.readthedocs.io。一定要查看示例部分，里面有许多本书涵盖的模型的示例，还有许多其他没有涵盖的模型示例。与 ArviZ 团队一起，我们正在编写一份名为《贝叶斯模型的探索性分析》的教育资源。我们希望这将是一个有用的参考，尤其是对于贝叶斯建模的初学者：arviz-devs.github.io/Exploratory-Analysis-of-Bayesian-Models/。

如果你想提供任何反馈，无论是关于文本还是代码的，你可以在github.com/aloctavodia/BAP3上提交问题。如果你有关于贝叶斯统计的问题，尤其是与 PyMC、ArviZ 或 Bambi 相关的问题，你可以在discourse.pymc.io上提问。

在以下列表中，我汇总了一些我认为你可能会觉得有用的资源，帮助你继续学习贝叶斯统计：

在github.com/pymc-devs/pymc-resources的仓库中，你可以找到用 Python/PyMC 编写的代码，这些代码最初是为其他编程语言写的书籍中的内容。
*《Python 中的贝叶斯建模与计算》*是我合著的另一本书：bayesiancomputationbook.com。虽然其中一些主题与本书中呈现的内容有重叠，但你可能仍然会发现它有用，因为许多内容是从不同的角度或使用不同的例子来呈现的。此外，一些主题也补充或扩展了我们在这里讨论的内容。
有很多关于贝叶斯统计的好书，但我最喜欢的入门/实用书籍包括统计学的重新思考、贝叶斯数据分析、回归与其他故事，以及贝叶斯规则! 如果你更偏向机器学习方面且希望更多数学内容，机器学习：一种概率视角是一个很好的资源。
学习贝叶斯统计 是一个每两周更新的播客，许多不同领域的研究者、开发者和实践者讨论贝叶斯统计：learnbayesstats.com/。
PyMCon 是为贝叶斯社区设计的优先考虑异步的虚拟会议：pymcon.com/。这里有很多精彩的讲座，同时也是你展示自己讲座的好机会！
直观贝叶斯 是一系列付费课程和社区设计的项目，旨在帮助你从对贝叶斯感兴趣到快速成为实践者：www.intuitivebayes.com/。

作为一个孩子，我曾梦想有飞行汽车、清洁无限的能源、在火星或月球上的假期，还有一个追求全人类福祉的全球政府……是的，我知道……我曾是一个梦想家！但由于种种原因，我们没有这些。相反，我们得到了完全无法想象的东西，至少在几十年前对我来说是不可思议的：相对容易访问到非常强大的计算方法（至少对某些人而言）。

计算机革命的副作用之一是，任何具备基本编程语言知识（如 Python）的人现在都可以使用大量用于数据分析、模拟和其他复杂任务的计算方法。我认为这是好事，但也意味着我们需要特别小心这些方法。我在本科时学习统计学的方式，以及必须记住各种固定方法的过程，既令人沮丧，又没有用，而且与这些进展完全无关。从个人角度来说，这本书或许是对那段令人沮丧经历的回应。我尝试写一本以建模方法为重点，并强调依据具体情境进行分析的统计学书籍。我不确定是否真正成功了，但如果没有成功，可能的原因之一是我仍然需要在这方面学习更多（也许，甚至，我们作为一个社区都需要更多地学习这方面的知识）。另一个原因是，恰当的统计分析应由领域知识和情境引导，而在一本面向广泛读者的入门书籍中，提供这种情境通常是困难的。不过，我希望我已经提供了一个理智、批判性的统计模型视角，一些有用的例子，以及足够的动力让你继续学习。

加入我们的社区 Discord 空间

加入我们的 Discord 社区，结识志同道合的人，并与 5000 多名成员一起学习： packt.link/bayesian

https://github.com/OpenDocCN/freelearn-ml-pt2-zh/raw/master/docs/bys-anal-py-3e/img/file1.png

第十二章：参考书目

Oriol Abril-Pla, Virgile Andreani, Colin Carroll, Larry Dong, Christopher J. Fonnesbeck, Maxim Kochurov, Ravin Kumar, Jupeng Lao, Christian C. Luhmann, Osvaldo A. Martin, Michael Osthege, Ricardo Vieira, Thomas Wiecki, 和 Robert Zinkov。Pymc：一个现代化且全面的概率编程框架，基于 Python。PeerJ 计算机科学，9:e1516，2023。doi: 10.7717/peerj-cs.1516。

Agustina Arroyuelo，Jorge A. Vila，和 Osvaldo A. Martin。从贝叶斯视角探索蛋白质结构模型的质量。计算化学期刊，42(21)：1466-1474，2021 年。doi: https://doi.org/10.1002/jcc.26556。网址 onlinelibrary.wiley.com/doi/abs/10.1002/jcc.26556。

Joseph K. Blitzstein。概率论入门，第 2 版。查普曼与霍尔/CRC，博卡拉顿，第 2 版，2019 年 2 月。ISBN 978-1-138-36991-7。

Luis Jorge Borges。虚构集。Sur，1944 年。

H. Jane Brockmann。马蹄蟹中的卫星雄性群体，Limulus polyphemus。动物行为学，102(1)：1-21，1996 年。doi: https://doi.org/10.1111/j.1439-0310.1996.tb01099.x。网址 onlinelibrary.wiley.com/doi/abs/10.1111/j.1439-0310.1996.tb01099.x。

Peter G. Bryant 和 Marlene A. Smith。实用数据分析：商业统计案例研究。Irwin，芝加哥，1995 年。ISBN 978-0-256-15829-8。OCLC：726362789。

Tomás Capretto，Camen Piho，Ravin Kumar，Jacob Westfall，Tal Yarkoni，和 Osvaldo A Martin。Bambi：一个简单的 Python 贝叶斯线性模型拟合接口。统计软件期刊，103(15)：1-29，2022 年。doi: 10.18637/jss.v103.i15。网址 www.jstatsoft.org/index.php/jss/article/view/v103i15。

Hugh A. Chipman，Edward I. George，和 Robert E. McCulloch。BART：贝叶斯加性回归树。应用统计年鉴，4(1)：266-298，2010 年 3 月。ISSN 1932-6157。doi: 10.1214/09-AOAS285。

Aubrey Clayton。伯努利的谬误：统计学非逻辑与现代科学危机。哥伦比亚大学出版社，纽约，2021 年 8 月。ISBN 978-0-231-19994-0。

Scott Cunningham。因果推断：混音带。耶鲁大学出版社，纽黑文；伦敦，2021 年 1 月。ISBN 978-0-300-25168-5。

Jerome H. Friedman。贪心函数近似：一种梯度提升机器。统计年鉴，29(5)：1189 - 1232，2001 年。doi: 10.1214/aos/1013203451。网址 doi.org/10.1214/aos/1013203451。

Andrew Gelman。统计计算的民间定理，2008 年 5 月。网址 statmodeling.stat.columbia.edu/2008/05/13/the_folk_theore/。

A. Goldstein, Adam Kapelner, Justin Bleich, 和 Emily Pitkin. 透视黑盒：通过个体条件期望的图表可视化统计学习. 计算与图形统计学杂志, 24:44 – 65, 2013 年。

Charles R. Harris, K. Jarrod Millman, Stéfan J. van der Walt, Ralf Gommers, Pauli Virtanen, David Cournapeau, Eric Wieser, Julian Taylor, Sebastian Berg, Nathaniel J. Smith, Robert Kern, Matti Picus, Stephan Hoyer, Marten H. van Kerkwijk, Matthew Brett, Allan Haldane, Jaime Fernández del Río, Mark Wiebe, Pearu Peterson, Pierre Gérard-Marchant, Kevin Sheppard, Tyler Reddy, Warren Weckesser, Hameer Abbasi, Christoph Gohlke, 和 Travis E. Oliphant. 使用 NumPy 进行数组编程. 自然, 585(7825):357–362, 2020 年 9 月. doi: 10.1038/s41586-020-2649-2. URL doi.org/10.1038/s41586-020-2649-2。

Allison Marie Horst, Alison Presmanes Hill, 和 Kristen B Gorman. palmerpenguins: Palmer 群岛（南极洲）企鹅数据, 2020 年. URL allisonhorst.github.io/palmerpenguins/. R 包版本 0.1.0。

Stephan Hoyer 和 Joe Hamman. Xarray：Python 中的 N 维标签数组和数据集. 开放研究软件杂志, 5(1), 2017 年 4 月. ISSN 2049-9647. doi: 10.5334/jors.148。

J. D. Hunter. Matplotlib：一个二维图形环境. 科学与工程计算, 9(3):90–95, 2007 年. doi: 10.1109/MCSE.2007.55。

Alejandro A. Icazatti, Oriol Abril-Pla, Arto Klami, 和 Osvaldo A. Martin. Preliz：一个用于先验引导的工具箱. 开放源代码软件杂志, 2023 年。

Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, 和 Jonathan Taylor. 统计学习导论： Python 应用. Springer, 2023 年 9 月. ISBN 978-3-031-39189-7。

Alex Kale, Francis Nguyen, Matthew Kay, 和 Jessica Hullman. 假设结果图帮助未经训练的观察者判断模糊数据中的趋势. IEEE 可视化与计算机图形学学报, 25(1):892–902, 2019 年. doi: 10.1109/TVCG.2018.2864909。

Robert E. Kass 和 Adrian E. Raftery. 贝叶斯因子. 美国统计学会杂志, 90(430):773–795, 1995 年 6 月. ISSN 0162-1459. doi: 10.1080/01621459.1995.10476572. URL www.tandfonline.com/doi/abs/10.1080/01621459.1995.10476572. 出版商: Taylor & Francis_eprint: https://www.tandfonline.com/doi/pdf/10.1080/01621459.1995.10476572。

Christian Kleiber 和 Achim Zeileis. 使用根图可视化计数数据回归. 美国统计学家, 70(3):296–303, 2016 年 7 月. ISSN 0003-1305, 1537-2731. doi: 10.1080/00031305.2016.1173590. URL arxiv.org/abs/1605.01311. arXiv:1605.01311 [stat]。

John Kruschke. 进行贝叶斯数据分析，第二版：使用 R、JAGS 和 Stan 的 教程。学术出版社，波士顿，第二版，2014 年 11 月。ISBN 978-0-12-405888-0。

Ravin Kumar, Colin Carroll, Ari Hartikainen, 和 Osvaldo Martin. Arviz：一个用于贝叶斯模型探索分析的统一库，适用于 Python。开放源代码软件杂志，4(33)：1143，2019 年。

David J. C. MacKay. 信息理论、推理与学习 算法。剑桥大学出版社，剑桥，英国；纽约，2003 年 10 月。ISBN 978-0-521-64298-9。

Wes McKinney. Python 数据分析：使用 pandas、NumPy 和 Jupyter 进行数据清洗。O’Reilly 媒体，北京、波士顿、法纳姆、塞巴斯托波尔、东京，2022 年 9 月。ISBN 978-1-09-810403-0。

Yann McLatchie, Sölvi Rögnvaldsson, Frank Weber, 和 Aki Vehtari. 稳健且高效的投影预测推断，2023 年 6 月。网址 arxiv.org/abs/2306.15581。arXiv:2306.15581 [stat]。

Petrus Mikkola, Osvaldo A. Martin, Suyog Chandramouli, Marcelo Hartmann, Oriol Abril Pla, Owen Thomas, Henri Pesonen, Jukka Corander, Aki Vehtari, Samuel Kaski, Paul-Christian Bürkner, 和 Arto Klami. 先验知识引导：过去、现在与未来。贝叶斯分析，第 1 – 33 页，2023 年。doi: 10.1214/23-BA1381。网址 doi.org/10.1214/23-BA1381。

Kevin P. Murphy. 机器学习：概率视角。MIT 出版社，剑桥，MA，第一版，2012 年 8 月。ISBN 978-0-262-01802-9。

Kevin P. Murphy. 概率机器学习：高级主题。MIT 出版社，2023 年。网址 probml.github.io/book2。

K. W. Penrose, A. G. Nelson, 和 A. G. Fisher. 男性使用简单测量技术的广义体成分预测方程。医学与运动科学 在体育与运动中的应用，17(2)：189，1985 年 4 月。ISSN 0195-9131。网址 journals.lww.com/acsm-msse/citation/1985/04000/generalized_body_composition_prediction_equation.37.aspx。

Juho Piironen 和 Aki Vehtari. 马鞍分布和其他收缩先验中的稀疏性信息与正则化。电子统计学杂志，11(2)：5018 – 5051，2017 年。doi: 10.1214/17-EJS1337SI。网址 doi.org/10.1214/17-EJS1337SI。

Juho Piironen, Markus Paasiniemi, 和 Aki Vehtari. 高维问题中的投影推断：预测与特征选择。电子统计学杂志，14(1)：2155 – 2197，2020 年。doi: 10.1214/20-EJS1711。网址 doi.org/10.1214/20-EJS1711。

Miriana Quiroga, Pablo G Garay, Juan M. Alonso, Juan Martin Loyola, 和 Osvaldo A Martin. 贝叶斯加性回归树在概率编程中的应用，2022 年。

Sebastian Raschka, Yuxi Liu, Vahid Mirjalili, 和 Dmytro Dzhulgakov. 使用 PyTorch 和 Scikit-Learn 的机器学习：用 Python 开发机器学习和深度学习模型。Packt 出版公司，伯明翰孟买，2022 年 2 月。ISBN 978-1-80181-931-2。

Carl Edward Rasmussen 和 Christopher K. I. Williams. 机器学习中的高斯过程。麻省理工学院出版社，剑桥，马萨诸塞州，2005 年 11 月。ISBN 978-0-262-18253-9。

Riemann 积分。Riemann 积分，2023 年 5 月。网址 en.wikipedia.org/w/index.php?title=Riemann_integral&oldid=1152570392。页面版本 ID：1152570392。

Gabriel Riutort-Mayol, Paul-Christian Bürkner, Michael R. Andersen, Arno Solin, 和 Aki Vehtari. 用于概率编程的实用希尔伯特空间近似贝叶斯高斯过程，2022 年。

Aki Vehtari, Andrew Gelman, Daniel Simpson, Bob Carpenter, 和 Paul-Christian Bürkner. 排名归一化、折叠和局部化：一种改进的R 用于评估 MCMC 收敛性（附讨论）。贝叶斯分析，16(2)：667 - 718，2021 年。doi: 10.1214/20-BA1221。网址 doi.org/10.1214/20-BA1221。

Wes McKinney. Python 中的统计计算数据结构。在 Stéfan van der Walt 和 Jarrod Millman 编辑的第九届 Python 科学会议论文集中，第 56 - 61 页，2010 年。doi: 10.25080/Majora-92bf1922-00a。

Peter H Westfall. 峰度作为尖峭度，1905-2014。rip。美国统计学家，68(3)：191-195，2014 年。

Andrew Gordon Wilson 和 Pavel Izmailov. 贝叶斯深度学习与泛化的概率视角，2022 年 3 月。网址 arxiv.org/abs/2002.08791。arXiv:2002.08791 [cs, stat]。

https://github.com/OpenDocCN/freelearn-ml-pt2-zh/raw/master/docs/bys-anal-py-3e/img/file0.png

www.packt.com

订阅我们的在线数字图书馆，您将能全面访问超过 7,000 本书籍和视频，并获得行业领先的工具来帮助您规划个人发展和职业进步。有关更多信息，请访问我们的网站。