EN | RU    
Издательство научно-технической литературы
Поиск по сайту:

На главную»

Контакты»

Журналы»

Новости»

Оформление статей»

Реклама в журналах»

Обратная связь»

Книги»

О фирме»



 реклама



Приборы и системы. Управление, контроль, диагностика

Аннотация к статье
<< Назад
Метод формализации нечетких коллокаций на основе фаззификации расстояний между термами в текстах
Д.В. ПОЛЯКОВ, А.И. ЕЛИСЕЕВ, С.А. ДУЗЬКРЯТЧЕНКО

Целью работы является создание и исследование методов учета коллокаций термов при формализации коллекций текстовых документов. Использование коллокаций в математических моделях текстов позволит повысить качество решения задач поиска и кластеризации на наборах текстовых документов. В работе предлагается модель коллокации термов с учетом расстояния между ними. Под расстоянием понимается число слов, появившихся между термами, составляющими коллокацию, в текстовом документе. Методология исследования основывается на принципах теории нечетких множеств, теории информационного поиска и кластерного анализа. Результатом проведенных исследований стали: метод формализации коллокаций термов с учетом расстояния между ними, а также алгоритм их выявления в текстовых документах и оценки значимости. Предложенный метод заключается в формализации расстояния между термами в коллокации посредством нечеткого числа и последующего построения коллокации для доку-
мента с помощью математического аппарата теории нечетких множеств. В работе предложен алгоритм выявления значимых коллокаций в текстах на основе латентно-семантического анализа и теории нечетких множеств. Дополнительным достоинством предложенного алгоритма является получение естественной оценки значимости коллокации. Исследования, результаты которых пред-
ставлены в статье, не касаются вопросов применения полученных коллокаций для поиска текстовых данных и кластеризации наборов текстовых документов.
Ключевые слова: коллокация, текстовые коллекции, нечеткие коллокации, теория нечетких множеств, кластеризация текстовых документов, информационный поиск.

Контактная информация: E-mail: dimadress@yandex.ru

Стр. 19-30.

 разделы

«О журнале

«Архив журнала

«Тематическая направленность журнала

«Правила оформления статей

«Этапы рассмотрения и публикации статей

«Правила рецензирования статей

«Редакционная и профессиональная этика

«Обнаружение плагиата

«Редакция и редакционная коллегия

«Новости журнала


 журналы
...................................
Приборы и системы. Управление, контроль, диагностика
...................................
Приборостроение и средства автоматизации. Энциклопедический справочник
...................................
Промышленные АСУ и контроллеры
...................................
Экологические системы и приборы
...................................
Авиакосмическое приборостроение
...................................
Инженерная физика
...................................
История науки и техники
...................................
Музыка и время
...................................
Нотный альбом
...................................
Музыковедение
...................................
Всеобщая история
...................................
Справочник инженера
...................................
Прикладная физика и математика
...................................
Известия академии инженерных наук им. А.М. Прохорова
...................................

Последние новости:

Выставки по автоматизации и электронике «ПТА-Урал 2018» и «Электроника-Урал 2018» состоятся в Екатеринбурге

Открыта электронная регистрация на выставку Дефектоскопия / NDT St. Petersburg

Открыта регистрация на 9-ю Международную научно-практическую конференцию «Строительство и ремонт скважин — 2018»

ExpoElectronica и ElectronTechExpo 2018: рост площади экспозиции на 19% и новые формы контент-программы

Тематика и состав экспозиции РЭП на выставке "ChipEXPO - 2018"

   Rambler's Top100 Rambler's Top100         


    Система управления разработана в: ananskikh.ru
© Издательство "НАУЧТЕХЛИТИЗДАТ", 2005-2024