Значение КОЛИЧЕСТВЕННЫЕ МЕТОДЫ в Лингвистическом энциклопедическом словаре

Что такое КОЛИЧЕСТВЕННЫЕ МЕТОДЫ

в языкознании — использование подсчетов и измерений при изучении ялыка и речи. В той мере, в какой К. м. опираются на матем. статистику, они могут быть названы статистич. методами. Как и все магем. методы, К. м. могут применяться к объектам самой разной природы, поэтому в яз-зиа-нии они используются для анализа единиц любого уровня. Во ми. сферах яз-зиания применение К. м. ничем не отличается от применения их в др. науках. Напр., экспериментальная (инструментальная) фонетика использует тот же матем. аппарат, что и физика. Применение выборочных методов статистики в из-знании аналогично их применению в других естественных и социальных науках. В психолингвистике н социолингвистике, где обрабатываются мнения информантов, применяются те же методы конструирования шкал, что и в психологии и социологии. Вместе с тем в яз-знании возникают специфич. аспекты применения К. м., связанные с противопоставлением языка и речи. Непосредственно к системе языка К. м. применяются крайне редко и ограничиваются гл. обр. лексикой (количеств, изучение этимологич. состава словаря, процессов словообразования, распространенности разных типов полисемии). К. м. используются также в сравнит.-ист. яз-зиании (см. Глоттохронология). Осн. объектом применения К. м. обычно является речь, точнее, текст. Количеств, показатели дают определ. информацию о самих текстах. На том факте, что различия между языковыми стилями и жанрами носят преим. статистич. характер, основана г. наз. статистич. стилистика. Возможность через лексику количественно отражать тематич. отнесенность текстов изыка важна для нек-рых приложений лингвистики (напр., н информатике). Широкое применение К. м. для описания и классификации текстов (напр., при атрибуции текстов, в частности при установлении авторства анонимных или псевдоиимиых текстов) связано с тем, что большинство двусторонних единиц и конструкций изыка могут служить основой для различения текстов ил» для их квалификации. С др. стороны, К. м., примененные к текстам, открывают путь к изучению самого изыка, поскольку сегменты текстов, являющиеся объектами подсчетов, соотнесены с единицами языка. К. м. позволяют количественно описывать поведение разл. языковых единиц (фонем, букв, морфем, слов) в тексте: частоту употребления единиц, их распределение в текстах разного жанра, сочетаемость с др. единицами и т. п. Одновременно накапливается обобщенная количеств, информация о классах единиц, о языковых конструкциях (напр., данные о средней длине слова или предложения, о частоте употребления к.-л. грамматич. форм в тех или иных синтаксич. функциях и т. п.). Такай информация углубляет описание единил языка. Напр., простая констатации наличия форм им. падежа ед. числа личных местоимений в англ., рус. и лат. языках недостаточна для выявлении типологич. различий, если не учитывать количеств, различия в текстовом поведении соотв. единиц: почти абсолютная необходимость местоимения при глаголе в англ. яз., его обычность — в рус. яз. н редкость и стилистич. маркированность — в лат. яз. Т. о., создается перспектива превращения обычной структурной модели языка в структурно-вероятностную модель, в к-рой учитываются результаты статистич. анализа текстов (в этой модели единицы языка обладают «весом», измеряемыми оказываются языковые противопоставления и связи). Структурно-вероятностная модель отличается -.большей реалистичностью, особенно эффективна оиа в диахронич. и типологич. исследованиях (напр., при сличении и обработке исторически после-доват. текстов). Соединение статистич. методов с идеями дистрибутивного анализа легло в основу дистрибутивно-статист и ч. анализа, описывающего структуру языка и структуру текста на основе очень ограниченной исходной информации (напр., принимая за данное письм. текст без к.-л. сведений о его семантике). В этом случае единицы языка и их отношения выделяются в процессе этого анализа, а не используются как готовый материал. КОЛИЧЕСТВЕННЫЕ 231 К. м. в яз-знании предполагают вссле-дование обширных массивов текстов, поэтому для их применения большое значение приобретают средства доступа к текстовым данным, допускающие многократное к ним обращение. К таким средствам относятся базы данных, хранимые в ЭВМ, издания, подготовленные с помощью ЭВМ (частотные словари, конкордансы — словари, фиксирующие все контексты употребления слова, и т. п.). Создание машинных фондов нац. языков (см. Автоматическая обработка текста) расширяет возможность изучения изыка, особенно с помощью К. м. 9 Аилреев Н. Д., СтаТистико-комби-ваторные методы в теоретич. и прикладном языковедении. Л., 1967; Головин Б. Н., Язык и статистика, М., 1971; Алексеев П. М., Статистич. лексикография, Л., 1975; Шайкевич А. Я., Дистрибутивно-статистич. анализ в семантике, в кн.: Принципы и методы семантич. исследований, М., 1976; Пиотровский Р. Г., Бекта-ев К. Б., Пиотровская А. А., Ма-тем. лингвистика, М., 1977; Квантитативная типология языков Азии и Африки, Л., 1982; G u i г a u d P., Problemes et methodes de la statistique linguistique, Dordrecht. [1959]. А. Я. Шайкевич.

Лингвистический энциклопедический словарь. 2012