поисковый движок над локальными файлами c Серёгой
python3 main.py path
{path} — папка, в которой будут проиндексированы все текстовые файлы (включая текстовые файлы в подпапках)
после запуска идет работа в интерактивном режиме
вызов команды
command query
{command} — indexof или relevant
indexof — находит все файлы, удовлетворяющие запросу
relevant — находит топ-3 файлов по tf-idf
{query} — запрос (может включать логические операторы or / and / not) — cat and dog and not (elephant or zebra)
аргументы команд
-n / --top-n — настройка количества файлов в топе (только для relevant) — relevant -n 5 cat
-l / --logic — включает ли команда логические команды (по умолчанию равно False) — indexof -l "dog and cat"
-ext / --extensions — расширения файлов, по которым будет работать поиск — relevant -ext "pdf txt" "cat"
неточное совпадение
для поиска с неточным совпадением в запросе к слову надо приписывать ~ — indexof ~cat and dog or ~elephant