new-words

view misc/one-word-voc @ 66:53ba2847501f

added misc scripts
author Igor Chubin <igor@chub.in>
date Tue Mar 27 14:16:46 2012 +0200 (2012-03-27)
parents
children
line source
2 cat <<EOF > /dev/null
3 Как работает?
4 ----------------
6 Слова, которые мы должны обрабатывать поступают на стандартный поток ввода.
7 * Удаляем из них комментарии.
8 * Размножаем слова, которые, возможно, находятся не в нормальной форме.
9 Например, слова, заканчивающиеся на te.
10 * Прогоняем через прогу, которая разложит их по категориям.
11 * Разложенные по категориям слова прогоняем ещё раз.
12 EOF
14 word_multiplier()
15 {
16 cat
17 }
19 new-words -l de -R 95 -n -c -a "$@" \
20 | grep -v ^# | awk '{print $2}' | word_multiplier \
21 | while read word
22 do
23 de-short "$word"
24 done \
25 | perl ~/hg/new-words/misc/categorized.pl \
26 | while read word
27 do
28 if echo $word | fgrep -q "|"
29 then
30 w="$(echo $word | awk '{print $1}')"
31 a="`de-super-short $w`"; [ -n "$a" ] && echo $w " | " $a
32 else
33 echo "$word"
34 fi
35 done