new-words
view README @ 11:34d0332f238c
Группировка похожих слов (пока что только для английского языка).
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
| author | Igor Chubin <igor@chub.in> | 
|---|---|
| date | Fri Apr 02 19:46:44 2010 +0300 (2010-04-02) | 
| parents | 9345cc05fdd1 | 
| children | f06e8b0ee41a | 
 line source
     2 Программа, которая помогает нам находить неизвестные
     3 слова в новом тексте
     5 Подробности: http://xgu.ru/wiki/new-words
     7 == Файлы ==
     9 README              Файл, который мы сейчас читаем
    10 INSTALL.sh          Инсталляционный скрипт (копирует исполняемые файлы в /usr/local/bin/ или в ~/bin/)
    11 new-words.sh        Собственно программа (написана на sh)
    12 new-words.pl        Программа new-words, которую мы когда-нибудь напишем на Perl
    13 grep-sentences.pl   Программа, которая ищет в файле предложения (текст, разделённый точками) по словам
    14 learn-words.sh      Программа для повторения слов, на которые были поставлены пометки
    15 en.sh               Пример скрипта-словаря, который вызывается по K из vim (нужно скопировать в en)
    17 == Что сделать ==
    19 * Переписать на Perl (пока на Perl)
    20 * Статистика по текущему тексту; уровни покрытия словами текста
    21 * Время добавления слова и прогресс добавления
    22 * Источник слова
    23 * Автоматическое определение языка по тексту
