new-words
annotate README @ 11:34d0332f238c
Группировка похожих слов (пока что только для английского языка).
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
author | Igor Chubin <igor@chub.in> |
---|---|
date | Fri Apr 02 19:46:44 2010 +0300 (2010-04-02) |
parents | 9345cc05fdd1 |
children | f06e8b0ee41a |
rev | line source |
---|---|
igor@0 | 1 |
igor@0 | 2 Программа, которая помогает нам находить неизвестные |
igor@0 | 3 слова в новом тексте |
igor@0 | 4 |
igor@0 | 5 Подробности: http://xgu.ru/wiki/new-words |
igor@0 | 6 |
igor@0 | 7 == Файлы == |
igor@0 | 8 |
igor@0 | 9 README Файл, который мы сейчас читаем |
igor@8 | 10 INSTALL.sh Инсталляционный скрипт (копирует исполняемые файлы в /usr/local/bin/ или в ~/bin/) |
igor@0 | 11 new-words.sh Собственно программа (написана на sh) |
igor@0 | 12 new-words.pl Программа new-words, которую мы когда-нибудь напишем на Perl |
igor@5 | 13 grep-sentences.pl Программа, которая ищет в файле предложения (текст, разделённый точками) по словам |
igor@5 | 14 learn-words.sh Программа для повторения слов, на которые были поставлены пометки |
igor@5 | 15 en.sh Пример скрипта-словаря, который вызывается по K из vim (нужно скопировать в en) |
igor@0 | 16 |
igor@0 | 17 == Что сделать == |
igor@0 | 18 |
igor@0 | 19 * Переписать на Perl (пока на Perl) |
igor@0 | 20 * Статистика по текущему тексту; уровни покрытия словами текста |
igor@0 | 21 * Время добавления слова и прогресс добавления |
igor@0 | 22 * Источник слова |
igor@0 | 23 * Автоматическое определение языка по тексту |