new-words
view misc/one-word-voc @ 68:846240941452
added -C key: compress to lines; fixed bug with #90-line
| author | Igor Chubin <igor@chub.in> | 
|---|---|
| date | Sun Sep 23 16:07:29 2012 +0300 (2012-09-23) | 
| parents | |
| children | 
 line source
     2 cat <<EOF > /dev/null
     3 Как работает?
     4 ----------------
     6 Слова, которые мы должны обрабатывать поступают на стандартный поток ввода.
     7 * Удаляем из них комментарии.
     8 * Размножаем слова, которые, возможно, находятся не в нормальной форме.
     9   Например, слова, заканчивающиеся на te.
    10 * Прогоняем через прогу, которая разложит их по категориям.
    11 * Разложенные по категориям слова прогоняем ещё раз.
    12 EOF
    14 word_multiplier()
    15 {
    16     cat
    17 }
    19 new-words -l de -R 95 -n -c -a "$@" \
    20 | grep -v ^# | awk '{print $2}' | word_multiplier \
    21 | while read word
    22 do
    23     de-short "$word"
    24 done \
    25 | perl ~/hg/new-words/misc/categorized.pl \
    26 | while read word 
    27 do 
    28     if echo $word | fgrep -q "|"
    29     then
    30     w="$(echo $word | awk '{print $1}')"
    31     a="`de-super-short $w`"; [ -n "$a" ] && echo $w " | " $a 
    32     else
    33     echo "$word"
    34     fi
    35 done
