new-words
annotate misc/one-word-voc @ 66:53ba2847501f
added misc scripts
| author | Igor Chubin <igor@chub.in> | 
|---|---|
| date | Tue Mar 27 14:16:46 2012 +0200 (2012-03-27) | 
| parents | |
| children | 
| rev | line source | 
|---|---|
| igor@66 | 1 | 
| igor@66 | 2 cat <<EOF > /dev/null | 
| igor@66 | 3 Как работает? | 
| igor@66 | 4 ---------------- | 
| igor@66 | 5 | 
| igor@66 | 6 Слова, которые мы должны обрабатывать поступают на стандартный поток ввода. | 
| igor@66 | 7 * Удаляем из них комментарии. | 
| igor@66 | 8 * Размножаем слова, которые, возможно, находятся не в нормальной форме. | 
| igor@66 | 9 Например, слова, заканчивающиеся на te. | 
| igor@66 | 10 * Прогоняем через прогу, которая разложит их по категориям. | 
| igor@66 | 11 * Разложенные по категориям слова прогоняем ещё раз. | 
| igor@66 | 12 EOF | 
| igor@66 | 13 | 
| igor@66 | 14 word_multiplier() | 
| igor@66 | 15 { | 
| igor@66 | 16 cat | 
| igor@66 | 17 } | 
| igor@66 | 18 | 
| igor@66 | 19 new-words -l de -R 95 -n -c -a "$@" \ | 
| igor@66 | 20 | grep -v ^# | awk '{print $2}' | word_multiplier \ | 
| igor@66 | 21 | while read word | 
| igor@66 | 22 do | 
| igor@66 | 23 de-short "$word" | 
| igor@66 | 24 done \ | 
| igor@66 | 25 | perl ~/hg/new-words/misc/categorized.pl \ | 
| igor@66 | 26 | while read word | 
| igor@66 | 27 do | 
| igor@66 | 28 if echo $word | fgrep -q "|" | 
| igor@66 | 29 then | 
| igor@66 | 30 w="$(echo $word | awk '{print $1}')" | 
| igor@66 | 31 a="`de-super-short $w`"; [ -n "$a" ] && echo $w " | " $a | 
| igor@66 | 32 else | 
| igor@66 | 33 echo "$word" | 
| igor@66 | 34 fi | 
| igor@66 | 35 done | 
