Задача — есть ряд текстов для обучения. Хочется скормить (в консоли) тексты фильтру Байеса с привязкой текстов и ключевых слов (категорий текста). И запомнил.
Потом подать на вход утилите неизвестный текст и чтобы она выдала список подходящих категорий (ключевых слов) с указанием коэффициента соответствия.
В spamassasin была такая штука, sa-learn, но там только бинарный подход спам/не спам.
Есть много библиотек под разные языки, но очень низкоуровневых. Надо много геморроиться и разбираться с созданием хранилища. Либо вообще обучение перед каждым использованием...
Должно же быть что-то уже готовое к использованию, нет?
↧
Есть в природе cli-инструменты для работы с фильтрами Байеса?
↧