new-words

view README @ 11:34d0332f238c

Группировка похожих слов (пока что только для английского языка).

Выполняется группировка похожих слов,
и слова сортируются не отдельно, а группами,
исходя из количества слов в группе.
В пределах группы сортировка выполняется по количеству вхождений
для каждого слова.
author Igor Chubin <igor@chub.in>
date Fri Apr 02 19:46:44 2010 +0300 (2010-04-02)
parents 9345cc05fdd1
children f06e8b0ee41a
line source
2 Программа, которая помогает нам находить неизвестные
3 слова в новом тексте
5 Подробности: http://xgu.ru/wiki/new-words
7 == Файлы ==
9 README Файл, который мы сейчас читаем
10 INSTALL.sh Инсталляционный скрипт (копирует исполняемые файлы в /usr/local/bin/ или в ~/bin/)
11 new-words.sh Собственно программа (написана на sh)
12 new-words.pl Программа new-words, которую мы когда-нибудь напишем на Perl
13 grep-sentences.pl Программа, которая ищет в файле предложения (текст, разделённый точками) по словам
14 learn-words.sh Программа для повторения слов, на которые были поставлены пометки
15 en.sh Пример скрипта-словаря, который вызывается по K из vim (нужно скопировать в en)
17 == Что сделать ==
19 * Переписать на Perl (пока на Perl)
20 * Статистика по текущему тексту; уровни покрытия словами текста
21 * Время добавления слова и прогресс добавления
22 * Источник слова
23 * Автоматическое определение языка по тексту