Аннотация
Цифровые фасилитаторские сети, управляющие обширной визуальной документацией на нескольких языках, сталкиваются с трудностями поиска связанного контента, когда идентичные диаграммы существуют в различных языковых версиях. Традиционные подходы поиска на основе метаданных не могут идентифицировать визуально похожие материалы, что снижает эффективность повторного использования контента. Данное исследование рассматривает реализацию системы поиска изображений по сходству для организационных сред, обрабатывающих примерно 66 диаграмм еженедельно. Цель состоит в обеспечении точной идентификации точных совпадений и языковых вариантов при сохранении вычислительной эффективности на стандартном оборудовании. Система использует многомасштабное извлечение признаков, объединяющее анализ цветовых гистограмм в пространствах RGB и HSV, многопороговое обнаружение границ с операторами Canny, характеристику текстуры градиентами Sobel и сигнатуры шаблонов, формируя 261-мерное представление признаков. Уровневая структура оценки сходства анализирует отношения между изображениями, тогда как обнаружение языковых вариантов сочетает анализ шаблонов имен файлов с проверкой визуального сходства. Реализация использует фреймворк Flask с OpenCV для операций компьютерного зрения. Тестирование с организационными диаграммами на английском, русском и казахском языках демонстрирует 92% точность в идентификации точных совпадений и языковых вариантов при среднем времени отклика 1,8 секунды и пиковом использовании памяти 72 МБ. Обнаружение языковых вариантов достигает 89% точности при доле ложноположительных результатов ниже 3%. Модульная архитектура обеспечивает развертывание на обычных офисных системах, демонстрируя, что традиционные подходы компьютерного зрения остаются применимыми для управления организационным контентом при надлежащей адаптации к практическим ограничениям.
Ключевые слова: поиск изображений, цифровые фасилитаторские сети, компьютерное зрение, Flask, многомасштабное извлечение признаков, обнаружение языковых вариантов

