Statistical analysis of near-synonymous words list and catalog in R
DOI:
https://doi.org/10.21638/spbu09.2018.310Аннотация
В данной статье приводятся результаты регрессионного анализа двух близких по значению слов list и catalog. Целью анализа является выделение наиболее объективного варианта на основе моделирования грамматических интеракций, оказывающих влияние на актуализацию рассматриваемых слов в языке. Определение list и catalog в качестве объективных и независимых лексических единиц осуществляется в системе различий и противопоставлений. На начальном этапе согласно вероятностному распределению выделяются два наиболее частотных типа интеракций при употреблении слов list и catalog. Затем модели с предикторами PRE.MOD и GENITIVE.MEAN сопоставляются с моделью без интеракций, что продиктовано необходимостью показать различие между моделями на уровне дисперсии, так как сопоставление средних значений не всегда выявляет все аспекты изучаемого явления (ср.: средние значения моделей могут быть статистически одинаковыми). Таким образом, три статистические гипотезы сопоставляются попарно. Основная, нулевая гипотеза состоит в том, что дисперсии трех рассматриваемых моделей статистически одинаковы, и альтернативная — в том, что эти дисперсии статистически различны. Оценка модели без интеракций является предсказательным логитом list для вышеуказанных уровней отсчета. Коэффициенты логистической регрессии отражают вероятность изменений при взаимодействии с тем или иным предиктором. На этапе нормализации применяется модель бинарного выбора Хосмера—Лемешоу, по результатам применения которой принимается решение о необходимости выравнивания полученных результатов или ее отсутствии. Также выявляется присутствие / отсутствие образцов корреляции среди рассмотренных предикторов на основе функции lrm, что определяет меру надежности используемой модели и позволяет получить доверительные интервалы расчетных коэффициентов. Данный подход отражает новизну работы и позволяет выявить факторы, определяющие выбор того или иного понятия, исходя из объективных семантических критериев. Интеракции рассматриваются на 4 уровнях: научный, литературный, новостной и разговорный. Итоги работы позволяют дополнить содержание слов list и catalog и выявить их динамику.
Ключевые слова:
корпусная лингвистика, логистическая регрессия, сравнительный анализ, семантика, синоним, список, каталог
Скачивания
Библиографические ссылки
References
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Статьи журнала «Вестник Санкт-Петербургского университета. Язык и литература» находятся в открытом доступе и распространяются в соответствии с условиями Лицензионного Договора с Санкт-Петербургским государственным университетом, который бесплатно предоставляет авторам неограниченное распространение и самостоятельное архивирование.