new-words
annotate README @ 11:34d0332f238c
Группировка похожих слов (пока что только для английского языка).
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
| author | Igor Chubin <igor@chub.in> | 
|---|---|
| date | Fri Apr 02 19:46:44 2010 +0300 (2010-04-02) | 
| parents | 9345cc05fdd1 | 
| children | f06e8b0ee41a | 
| rev | line source | 
|---|---|
| igor@0 | 1 | 
| igor@0 | 2 Программа, которая помогает нам находить неизвестные | 
| igor@0 | 3 слова в новом тексте | 
| igor@0 | 4 | 
| igor@0 | 5 Подробности: http://xgu.ru/wiki/new-words | 
| igor@0 | 6 | 
| igor@0 | 7 == Файлы == | 
| igor@0 | 8 | 
| igor@0 | 9 README Файл, который мы сейчас читаем | 
| igor@8 | 10 INSTALL.sh Инсталляционный скрипт (копирует исполняемые файлы в /usr/local/bin/ или в ~/bin/) | 
| igor@0 | 11 new-words.sh Собственно программа (написана на sh) | 
| igor@0 | 12 new-words.pl Программа new-words, которую мы когда-нибудь напишем на Perl | 
| igor@5 | 13 grep-sentences.pl Программа, которая ищет в файле предложения (текст, разделённый точками) по словам | 
| igor@5 | 14 learn-words.sh Программа для повторения слов, на которые были поставлены пометки | 
| igor@5 | 15 en.sh Пример скрипта-словаря, который вызывается по K из vim (нужно скопировать в en) | 
| igor@0 | 16 | 
| igor@0 | 17 == Что сделать == | 
| igor@0 | 18 | 
| igor@0 | 19 * Переписать на Perl (пока на Perl) | 
| igor@0 | 20 * Статистика по текущему тексту; уровни покрытия словами текста | 
| igor@0 | 21 * Время добавления слова и прогресс добавления | 
| igor@0 | 22 * Источник слова | 
| igor@0 | 23 * Автоматическое определение языка по тексту | 
