看看数据科学家们都在用什么：Github上的十大深度学习项目

最新推荐文章于 2024-08-08 07:41:08 发布

转载最新推荐文章于 2024-08-08 07:41:08 发布 · 3.3k 阅读

DeepLearning 专栏收录该内容

181 篇文章

订阅专栏

本文介绍了GitHub上十个最受欢迎的深度学习项目，涵盖了从Caffe到Deeplearning4j的各种工具和框架，这些项目不仅提供了丰富的学习资源，还展示了当前深度学习领域的前沿技术和实践。

本文作者Matthew May是一位正在进行并行式机器学习算法研究的计算机硕士研究生，同时Matthew也是一位数据挖掘研习者，数据发烧友，热忱的机器学习科学家。开源工具在数据科学工作流中起到了愈发重要的作用。Github十大深度学习项目，其中包含了大量的代码库，框架以及学习资料。看看Github上的人们都在使用哪些工具，都在从哪些资源那里进行学习。

最新KDnuggets软件调查结果表明，在过去12个月，73%的数据科学家都会使用免费的数据科学工具。不言而喻，Python和R语言（两者皆为开源）以及各自的生态系统，是这些免费的数据科学工具中，数据科学家们运用的最突出、最必不可少的。

看看数据科学家们都在用什么：Github上的十大深度学习项目

Github已成为名副其实的开源软件交流中心，其上寄存了几乎所有想得到的项目类型。深度学习在学术、研究和兴趣方面的普及程度越来越高，并在数据科学方面越来越重要，我们将探索一下Github里出类拔萃的深度学习项目。

需要注意的是，大部分人认为属于深度学习的一些重要项目并没有出现在该名单上，原因在于在Github搜索「深度学习」时并没有涉及到这些项目。

1. Caffe

看看数据科学家们都在用什么：Github上的十大深度学习项目

Caffe是利用Python和MATLAB两者结合创建的深度学习程序库。由伯克利大学的伯克利视觉与学习中心创办，如果人们仅把Caffe当做计算机视觉应用是情有可原的；事实上，这是一个通用的深度学习程序库，能够开发卷积网络，并创建其他视觉、语音等应用。

2. Data Science IPython Notebooks

看看数据科学家们都在用什么：Github上的十大深度学习项目

这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习，像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中，当然还有相关的特定构架和概念等。

3. ConvNetJS

由斯坦福博士生Andrej Karpathy写就，他也一直维持着博客更新。ConvNetJS是一个由Javascript实现的神经网络及其通用模块，并且包括大量的基于浏览器的实例。这些文档和实例数不胜数，且非常完整。不要让javascript和神经网络结合在一起的想法把你吓跑了，这可是个非常受欢迎而且非常有用的项目。

4. Keras

Keras也是一种Python深度学习程序库，但它利用了TensorFlow和Theano，这也意味着它可以在目前已知最受欢迎的2个深度学习研发库中的任一个上运行。也是那些越来越多的被形容为非常高级的库之一，而所有这些高等级库都非常相似：抽象化底层的深度学习引擎，使使用者可以更快、更便捷以及更灵活地部署神经网络。Keras支持主流深度学习架构，自带30秒的快速入门指南，并有着完善的文档。

5. MXNet

作为一个深度学习框架，MXNet旨在灵活和高效，并且通过允许混合使用指令式编程及符号式编程的技巧来提高代码生产力。这个项目可以和多种语言绑定，如Python, R, 以及 Julia。同时MXNet还附带了一系列神经网络指南和蓝本。另外值得注意的是，一个相关项目用JavaScript在浏览器环境中实现MXNet，有兴趣的朋友可以通过该链接对一个图形分类模型进行测试。

6. Qix

这是一个各种计算和编程主题有关资源(包括Node.Js, GoLang和深度学习)的Github版本库。之所以说「似乎（appears）」，是因为Github版本库都是用中文写的，谷歌提供的翻译甚至会带来更多不解。不过，有许多链接，所以如果你能说中文或看得懂中文，或许这里有些有价值的东西。

7. Deeplearning4j

看看数据科学家们都在用什么：Github上的十大深度学习项目