如何通过关键词匹配统计其出现的频率

本文介绍了一个使用Perl编写的程序,该程序能够通过关键词匹配来统计文本中关键词出现的频率。利用Perl强大的正则表达式功能,程序可以高效地处理大量文本数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近写的一个perl程序,通过关键词匹配统计其出现的频率,让人领略到perl正则表达式的强大,程序如下:

#!/usr/bin/perl
use strict;
my (%hash,%hash1,@array);
while(<>){
     s/\r\n//; 
     my $line;
     if(/-(.+?)【(.+?)】【(.+?)】(定单积压)/){
     $line=$1.'.*'.$2.'.*'.$4;
     push @array,$_ unless exists $hash{$line};
     $hash{$line}+=1;}
     elsif(/-(.+?)【(.+?)】(.+?)【(.+?)】/){
     $line=$1.'.*'.$2.'.*'.$4;
     push @array,$_ unless exists $hash{$line};
     $hash{$line}+=1;
}}
while(my($key,$value)=each %hash){
     $key =~ s/(\()(.+)(\))/\\$1$2\\$3/;
     foreach my $index(@array){
     if($index =~ /$key/){
     $hash1{$index}=$value;
     #last;
     }
}}
foreach my $key(sort {$hash1{$b}<=>$hash1{$a}} keys %hash1){
       print "$key,$hash1{$key}\n";
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值