ФОРМИРОВАНИЕ ЯДРА ДОКУМЕНТОВ В СИСТЕМАХ ИНТЕРНЕТ-МОНИТОРИНГА В УСЛОВИЯХ РЕСУРСНЫХ ОГРАНИЧЕНИЙ
Аннотация:
Рассматриваются особенности разработки систем интернет-мониторинга открытого типа с неограниченным количеством источников в условиях ограниченного объема систем хранения собранных данных. Цель работы — решение задачи формирования множества документов минимально необходимого размера (ядра документов), отвечающего требованиям репрезентативности и вариативности тем при мониторниге сети Интернет. Для формализации и решения поставленной задачи разработана теоретико-множественная модель ядра документов. Предложенный подход отличается использованием вытесняющего алгоритма, поддерживающего в базе данных наличие только актуальных документов в пределах доступного объема системы хранения данных. Приведены результаты эксперимента с использованием реальных данных, подтверждающие применимость разработанной модели. Предложенный подход может быть использован в ряде практических задач, в частности для поиска в сети Интернет сведений (документов, страниц), по которым отсутствует априорная информация, необходимая для поиска по ключевым словам.
Ключевые слова:
Постоянный URL
Статьи в номере
- МЕТОДОЛОГИЧЕСКИЕ И МЕТОДИЧЕСКИЕ ОСНОВЫ ПРОАКТИВНОГО УПРАВЛЕНИЯ ЖИЗНЕННЫМ ЦИКЛОМ СЛОЖНЫХ ТЕХНИЧЕСКИХ ОБЪЕКТОВ
- ОЦЕНИВАНИЕ ЭКСПЛУАТАЦИОННЫХ ЗАТРАТ ПРИ РАСЧЕТЕ СОВОКУПНОЙ СТОИМОСТИ ВЛАДЕНИЯ РАСПРЕДЕЛЕННЫМИ ТЕХНИЧЕСКИМИ КОМПЛЕКСАМИ
- СИСТЕМНЫЙ АНАЛИЗ МОДЕЛЕЙ КЛАССИФИКАЦИИ И УПОРЯДОЧЕНИЯ ОБЪЕКТОВ
- ПЛАНИРОВАНИЕ РЕКОНФИГУРАЦИИ МНОГОРЕЖИМНЫХ СЛОЖНЫХ ОБЪЕКТОВ
- НЕЧЕТКО-ВОЗМОЖНОСТНЫЙ ПОДХОД К УПРАВЛЕНИЮ СЛОЖНОСТЬЮ ИНТЕГРИРОВАННЫХ ИНФОРМАЦИОННО-УПРАВЛЯЮЩИХ СИСТЕМ
- МОДЕЛЬНО-АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЗАДАЧ ПРОГНОЗИРОВАНИЯ И ПЛАНИРОВАНИЯ ПРОЦЕССА ЗАГОТОВКИ КОРМОВ
- МОДЕЛЬ КОМБИНИРОВАННОГО ПРИМЕНЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ МЕТОДОВ КОРРЕЛЯЦИИ СОБЫТИЙ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
- ПРИМЕНЕНИЕ МЕТОДОВ СИНТЕЗА ОБУЧАЮЩИХ ДАННЫХ ДЛЯ РАСПОЗНАВАНИЯ ЧАСТИЧНО СКРЫТЫХ ЛИЦ НА ИЗОБРАЖЕНИЯХ