常见的正则表达式匹配中英文、字母和数字

本文汇总了在项目中常用的正则表达式,用于匹配中文、英文、字母和数字,为你的文本处理提供便利。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。

1、匹配中文:[\u4e00-\u9fa5]

2、英文字母:[a-zA-Z]

3、数字:[0-9]

4、匹配中文,英文字母和数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同时判断输入长度:
[\u4e00-\u9fa5_a-zA-Z0-9_]{
   4,10}

5(?!_)  不能以_开头
(?!.*?_$)  不能以_结尾
[a-zA-Z0-9_\u4e00-\u9fa5]+  至少一个汉字、数字、字母、下划线
$  与字符串结束的地方匹配

6、只含有汉字、数字、字母、下划线,下划线位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$

7、由数字、26个英文字母或者下划线组成的字符串
^\w+$

82~4个汉字
"^[\u4E00-\u9FA5]{2,4}$";

9、最长不得超过7个汉字,或14个字节(数字,字母和下划线)正则表达式
^[\u4e00-\u9fa5]{
   1,7}$|^[\dA-Za-z_]{
   1,14}$
 

10、匹配双字节字符(包括汉字在内)[^x00-xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计111、匹配空白行的正则表达式:ns*r
评注:可以用来删除空白行

12、匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

13、匹配首尾空白字符的正则表达式:^s*|s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

14、匹配Email地址的正则表达式:^[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]@[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]\.[a-zA-Z][a-zA-Z\.]
### DeepSeek R1 模型复现代码 GitHub 仓库实现 对于希望获取 DeepSeek R1 模型或项目复现代码的开发者而言,GitHub 是一个重要的资源平台。通常情况下,开源社区会提供官方或其他贡献者的实现版本。 许多研究团队会在论文发布的同时公开相应的源码链接,方便其他研究人员验证实验结果并进一步改进算法。如果 DeepSeek R1 已经发布了对应的预训练模型或是详细的架构描述,则很可能存在配套的开源实现[^1]。 为了找到特定于 DeepSeek R1 的 GitHub 实现库,建议采取以下方式搜索: - 使用关键词 `DeepSeek R1` 结合 `reproduction`, `implementation` 或者 `source code` 进行组合查询; - 查看是否有来自作者所在机构发布的官方存储库; - 浏览 Issues 和 Pull Requests 页面了解最新动态以及潜在问题解决方案; 值得注意的是,并不是所有的研究成果都会立即开放其完整的工程化实现细节。因此,在某些时候可能需要等待一段时间直到更多资料被公布出来,或者是通过阅读原始文献来尝试自行构建类似的系统结构[^2]。 ```python import requests from bs4 import BeautifulSoup def search_github_repos(query): url = f"https://github.com/search?q={query}&type=repositories" response = requests.get(url) soup = BeautifulSoup(response.text, &#39;html.parser&#39;) repos_info = [] items = soup.select(&#39;.repo-list-item&#39;) for item in items[:5]: # 获取前五个匹配项作为示例展示 title = item.h3.a[&#39;href&#39;].split(&#39;/&#39;)[-1] link = "https://github.com" + item.h3.a[&#39;href&#39;] description_tag = item.find(&#39;p&#39;, class_=&#39;mb-1&#39;) desc = description_tag.text.strip() if description_tag else &#39;&#39; repo_data = { "title": title, "link": link, "description": desc } repos_info.append(repo_data) return repos_info search_query = "DeepSeek R1 reproduction OR implementation" results = search_github_repos(search_query) for result in results: print(f"{result[&#39;title&#39;]}\n{result[&#39;link&#39;]}\nDescription: {result[&#39;description&#39;]}\n") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值