new-words

diff grep-sentences.pl @ 11:34d0332f238c

Группировка похожих слов (пока что только для английского языка).

Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
author Igor Chubin <igor@chub.in>
date Fri Apr 02 19:46:44 2010 +0300 (2010-04-02)
parents 9345cc05fdd1
children c6efd17741aa
line diff
     1.1 --- a/grep-sentences.pl	Tue Mar 09 11:57:55 2010 +0200
     1.2 +++ b/grep-sentences.pl	Fri Apr 02 19:46:44 2010 +0300
     1.3 @@ -1,8 +1,8 @@
     1.4  #!/usr/bin/perl
     1.5  
     1.6  
     1.7 -$page=$ARGV[0];
     1.8 -$regexp=$ARGV[1];
     1.9 +$regexp=$ARGV[0];
    1.10 +$page=$ARGV[1];
    1.11  #if (open(PAGE, "lynx -dump '$page'|")) {
    1.12  if (open(PAGE, "$page")) {
    1.13      local $/;