Лекция: Корпусные менеджеры
Работа пользователей с корпусом осуществляется с помощью специализированных программных средств – корпусных менеджеров, предоставляющих разнообразные возможности по получению из корпуса необходимой информации:
— поиск конкретных словоформ;
— поиск словоформ по леммам;
— поиск группы словоформ в виде разрывной или неразрывной синтагмы;
— поиск словоформ по набору морфологических признаков;
— отображение информации о происхождении, типе текста и т.п.;
— вывод результатов поиска с указанием контекста заданной длины;
— получение различных лексико-грамматических статистических данных;
— сохранение отобранных строк конкорданса в отдельном файле на компьютере пользователя и др.
Результаты поиска обычно выдаются в виде конкорданса (поэтому корпусные менеджеры еще называют конкордансерами), где искомая единица представлена в ее контекстном окружении и в виде статистических данных. Последние могут фиксировать частотные характеристики отдельных языковых единиц, или граммем, или могут характеризовать совместную встречаемость нескольких лексических единиц. Многие системы позволяют настраивать формат выдачи (менять длину левого и правого контекста, задавать объем выдачи и порядок сортировки данных, отображать или не отображать лингвистические и экстралингвистические характеристики, и т.д.).
Пример выдачи корпусных менеджеров см. в Приложении 1 (рис. 2–4).