Github源代码搜索技巧

Github是一个基于Web的Git代码托管平台,它允许开发者在互联网上存储、管理和共享代码。Github是全球最大的开源社区之一,拥有数百万的开发者和项目。在Github上,您可以找到各种类型的项目,包括开源软件、API、框架、库等等。

目前GitHub中有大约4500万个存储库、115TB代码和155亿个文档。但里面有很多重复的内容,因为项目可以轻松fork,据github自己的信息,将重复内容和数据删除之后,包括索引和内容压缩副本加起来只有25TB大小。

写代码最忌讳造重复的轮子,找到类似代码,依葫芦画瓢,是最高效的写代码方法,所以github的几十T代码是程序员的宝库,一定要学会高效利用它。

Github的代码搜索功能,以前基于ElasticSearch开发,程序员普遍反映难用,后来Github一直在持续改进,最新的代码搜索基于rust语言开发。

最新的Github的代码搜索功能已经很好用,可以按内容类型,语言类型,仓库名称搜索代码,但中国程序员使用的最大问题是github的网络连接,github访问经常中断。

一个替代的方法使用国内的源代码搜索网站:www.tanglib.com 

小唐代码搜索网站的内容同样来自github, 来自github的star数量超过100的仓库,共123万个存储库,1.15亿个代码文件,1T文字量,相对于github总量要少,但这些代码是经过程序员的挑选(star数量在100以上已经能说明一些问题),可信度较高。

虽然只有1T,但其实已经不少,包括了28种程序语言的内容:Java,C,JavaScript,PHP,C++,Python,C#,Ruby,GO,TypeScript,CSS,Shell,Scala,Makefile,SQL,Lua,Perl,Dockerfile,Haskell,Rust,TeX,Batchfile,CMake,Visual Basic,FORTRAN,PowerShell,Assembly,Julia等。

小唐代码搜索是一个字符级搜索引擎,与百度谷歌不同,可以搜索代码中的任意符号包括空格,你可以精确定位代码,例如可搜索 ”= timeout ) {“,所有其它的搜索引擎(谷歌,百度, bing)均为词语级搜索引擎,不能精确搜索该字符串。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值