如何用perl读入一个文件,计算文件中各个单词的出现频率,再输出
来源:学生作业帮 编辑:作业帮 分类:综合作业 时间:2024/05/09 11:04:41
如何用perl读入一个文件,计算文件中各个单词的出现频率,再输出
用perl读入一个文件"shizegengo.txt",计算文件中各个单词的出现频率,然后再按左边-单词,右边-出现次数
perl -w
# frequency
%count;
open TERM,"shizegengo.txt";
while(){
chomp;
$count{$word}=0
foreach $word (keys %count){
$count{$word} + = 1;
}
$longest=0;
foreach $word (keys %count){
$word_length=length($word);
$longest=$word_length if $word_length > $longest;
}
foreach $word (sort keys % count){
printf"%-${longest}s %s\n",$word ,$count{word};
}
}
close TERM;
这个是我写的程序,不知道为什么运行不了,请帮我看下哪里出问题了.
用perl读入一个文件"shizegengo.txt",计算文件中各个单词的出现频率,然后再按左边-单词,右边-出现次数
perl -w
# frequency
%count;
open TERM,"shizegengo.txt";
while(){
chomp;
$count{$word}=0
foreach $word (keys %count){
$count{$word} + = 1;
}
$longest=0;
foreach $word (keys %count){
$word_length=length($word);
$longest=$word_length if $word_length > $longest;
}
foreach $word (sort keys % count){
printf"%-${longest}s %s\n",$word ,$count{word};
}
}
close TERM;
这个是我写的程序,不知道为什么运行不了,请帮我看下哪里出问题了.
楼上兄弟批评的是.本人是门外汉,第一次回答程序方面的问题,没有经验,还请见谅!
其实单词统计的问题 perl的文档中就有很好的实例.作为新手,我也在学习中.希望大家共同交流、进步.
while ( /(\b[^\W_\d][\w'-]+\b)/g ) { $seen{$1}++;}
以上语句为实例中给出的单行统计单词方法.
my @array = split /[\s \,\!\:\;\?\.\#]/;
这是个笨方法,使用标点来分割单词;
但实际应用却可以灵活分出特殊用意的词.
foreach (@array) { $words{$_}++ if /^\w/;}
可参考:文档:perlfaq6.htm
其实单词统计的问题 perl的文档中就有很好的实例.作为新手,我也在学习中.希望大家共同交流、进步.
while ( /(\b[^\W_\d][\w'-]+\b)/g ) { $seen{$1}++;}
以上语句为实例中给出的单行统计单词方法.
my @array = split /[\s \,\!\:\;\?\.\#]/;
这是个笨方法,使用标点来分割单词;
但实际应用却可以灵活分出特殊用意的词.
foreach (@array) { $words{$_}++ if /^\w/;}
可参考:文档:perlfaq6.htm
如何用perl读入一个文件,计算文件中各个单词的出现频率,再输出
用PASCAL做!读入一英文句子,单词之间用空格或逗号隔开,统计其中单词个数,并输出各个字母出现的频率.
从文件中读入一段英语文章,统计文章中单词的数量,求出现次数最多和最少的单词和数量.用C怎么实现?
用perl查一个词表中的词在另一个文档中出现的,频率,输出频率表,并列出该词出现的索引行.
用Mathematica 怎样写语句 从文件中读入一维数组,怎样输出数组到另一个文件中?
Fluent计算时无法读入cas文件,并出现以下提示,该怎么解决呢?
c 语言如何在文件中提取单词,并按照英文词典顺序排序输出到另外一个文件
JAVA统计一篇文章中所有单词出现的次数,并按字典序将单词及频数输出到文件中
比如一个word文件是中英文的,如何用替换,把文档变成只有英文的文件.
有两个fastaq格式的DNA序列文件,想写一个perl程序完成!
如何用matlab定义一个函数文件addsub.m
如何用matlab将一个矩阵的每一行单独保存成一个文件