new-words

view README @ 18:7e3a52db54ad

Среднее количество слов и неизвестных слов (*10) в предложении в статистике.

Пример использования:

LANG KNOWN% UNKNOWN% KNOWN TOTAL WPS UWPS*10
en 89.8 10.2 167021 185840 21 21
author Igor Chubin <igor@chub.in>
date Mon Apr 05 21:34:55 2010 +0300 (2010-04-05)
parents 9345cc05fdd1
children f06e8b0ee41a
line source
2 Программа, которая помогает нам находить неизвестные
3 слова в новом тексте
5 Подробности: http://xgu.ru/wiki/new-words
7 == Файлы ==
9 README Файл, который мы сейчас читаем
10 INSTALL.sh Инсталляционный скрипт (копирует исполняемые файлы в /usr/local/bin/ или в ~/bin/)
11 new-words.sh Собственно программа (написана на sh)
12 new-words.pl Программа new-words, которую мы когда-нибудь напишем на Perl
13 grep-sentences.pl Программа, которая ищет в файле предложения (текст, разделённый точками) по словам
14 learn-words.sh Программа для повторения слов, на которые были поставлены пометки
15 en.sh Пример скрипта-словаря, который вызывается по K из vim (нужно скопировать в en)
17 == Что сделать ==
19 * Переписать на Perl (пока на Perl)
20 * Статистика по текущему тексту; уровни покрытия словами текста
21 * Время добавления слова и прогресс добавления
22 * Источник слова
23 * Автоматическое определение языка по тексту