анализ текста (АА), операция, которая заключается в том, что из данного текста на естественном языке извлекается содержащаяся в этом тексте грамматическая и семантическая информация, выполняемая по некоторому алгоритму в соответствии с заранее разработанным описанием данного языка. Обратная операция называется автоматическим синтезом текста. АА подразделяется на три этапа:
1 ) лексико-морфологический - переход от отдельной словоформы к её лексико-грамматической характеристике;
2) синтаксический - переход от цепочки лексико-грамматических характеристик, представляющих фразу, к её синтаксической структуре;
3) семантический - переход от синтаксически проанализированной фразы к её смысловой записи. В алгоритме АА обычно различают сведения о языке ('грамматика') и сведения о самом процессе анализа ('механизм', или собственно алгоритм АА). АА является необходимым этапом в разных видах автоматической обработки текстов: автоматического перевода, автоматического реферирования, информационного поиска и т. п. АА следует отличать от автоматического исследования текстов, при котором полностью (или почти полностью) отсутствуют сведения о языке текста и текст обрабатывается алгоритмом именно с целью построения описания языка.
Лит.: Мельчук И. А., Морфологический анализ при машинном переводе (преимущественно на материале русского языка), в сборнике: Проблемы кибернетики, в. 6, М., 1961, с. 207-276; Dupuis L., Un système morphologique..., 'Information Storage and Retrieval', 1964, v. 2, | 1, с. 29-41; Мельчук И. А., Автоматический синтаксический анализ, т. 1, Новосибирск, 1964; Иорданская Л. Н., Автоматический синтаксический анализ, т. 2, Новосибирск, 1967; Hays D. G., Readings in automatic language processing, N. Y., 1966; Vauquois B., VeilIon G., Veyrunes J., Syntax and interpretation, 'Mechanical Translation', 1966, v. 9, | 2, p. 44-54; Жолковский А. К., Леонтьева Н. Н., Мартемьянов Ю. С., О принципиальном использовании смысла при машинном переводе, в кн.: Машинный перевод, в. 2, М., 1961, с. 17-46.
И. А. Мельчук.