Метод корпусного исследования – преимущества и недостатки (на примере использования Национального корпуса русского языка)
Abstrakt
Метод корпусного исследования – преимущества и недостатки(на примере использования Национального корпуса русского языка)
Настоящая статья посвящена методу корпусного исследования. В ней широко пред-ставлены несомненные преимущества и недостатки этого подхода, проиллюстриро-ванные на материале Национального корпуса русского языка. Достоинство корпусазаключается в значительном упрощении и ускорении процедуры лингвистическойобработки больших массивов текстов, что однако не лишено многих недостатков, свя-занных с автоматическим аннотированием данных.
Ключевые слова: корпус; корпусное исследование; аннотирование; корпусная линг-вистика, НКРЯ, глагол
The Method of Corpus Study – Advantages and Disadvantages(On the Example of Russian National Corpus)
This paper is devoted to the method of corpus study. It presents the advantages and disadvantagesof this approach illustrated on the material of the Russian National Corpus. The advantageof the corpus is the considerable simplification and acceleration of the procedure ofthe linguistic analyze of large amount of texts, which, however, does not avoid many of errorsassociated with automatic annotation of the data.
Key words: corpus, corpus study, annotation, corpus linguistics, RNC, verb
Bibliografia
Aston G., Burnard L., The BNC Handbook: Exploring the British National Corpus with SARA,
Edinburgh University Press, Edinburgh 1998.
Fillmore C.J., Corpus linguistics vs. computer-aided armchair linguistics, [in:] Directions in Corpus
Linguistics: Proceedings from a 1991 Nobel Symposium on Corpus Linguistics, Stockholm
, http://is.muni.cz/el/1421/jaro2008/FJ0B738/um/Corpus_linguistics_verze1.
pdf [доступ: 2.06.2017].
Guo X., Modal auxiliaries in phraseology: a contrastive study of learner English and native speaker
English, [in:] Proceedings from the Corpus Linguistics Conference Series, 2005, www.
corpus.bham.ac.uk/PCLC/CL%202005%20xiaotian%20guo.doc [доступ: 11.09.2017].
Habert B., Nazarenko A., Salem A., Les linguistiques de corpus, Armand Colin, Paris 1997.
Pawłowski A., Lingwistyka korpusowa – perspektywy i zagrożenia, «Polonica» 2003, t. XXII–
XXIII, с. 19–31.
Podstawy językoznawstwa korpusowego, red. B. Lewandowska-Tomaszczyk, Wydawnictwo
Uniwersytetu Łódzkiego, Łódź 2005.
Зализняк A.A., Грамматический словарь русского языка, Русский язык, Москва 1977.
Кобрицов Б.П., Ляшевская О.Н., Толдова С.Ю., Снятие семантической многозначности
глаголов с использованием моделей управления, извлеченных из электронных
толковых словарей, http://download.yandex.ru/IMAT2007/kobricov.pdf [доступ:
06.2017].
Коваль С.А., Роль корпуса в создании реалистичных моделей словоизменительной мор-
фологии, [в:] Труды международной конференции «Корпусная лингвистика – 2006»,
Санкт-Петербург 2006, с. 148–158.
Колокольникова М.Ю., Дискурс-анализ и корпусный анализ в исследованиях в области
исторической лексикологии, «Известия Саратовского университета» 2010, Жур-
налистика, т. 10, вып. 2, http://www.philology.ru/linguistics1/kolokolnikova-10.htm
[доступ: 11.06.2017].
Копотев M.B., Из наблюдений над публицистикой Ф.М. Достоевского (человек и его дело),
«Slavic Almanac: The South African Year Book for Slavic, Central, and East European
Studies» 2003, c. 153–164.
Копотев M.B., Янда Л., Национальный корпус русского языка (www.ruscorpora.ru), «Во-
просы языкознания» 2006, №5, с. 149–155.
Копотев М.В., Мустайоки А., Современная корпусная русистика, [в:] Инструментарий
русистики: корпусные подходы, ред. А. Мустайоки, Л.А. Бирюлин, Е.Ю. Протасова,
Helsinki University Press, Helsinki 2008, c. 7–24.
Кустова Г.И., Толдова С.Ю., Национальный корпус русского языка: Семантические филь-
тры для разрешения многозначности глаголов, [в:] Национальный корпус русско-
го языка: 2006—2008. Новые результаты и перспективы, Санкт-Петербург 2009,
http://ruscorpora.ru/sbornik2008/12.pdf [доступ: 11.06.2017].
Лаврентьев А.М., Влияние корпусных технологий на развитие диахронической линг-
вистики: пример Франции, https://halshs.archives-ouvertes.fr/halshs-01071863/
document [доступ: 11.06.2017].
Ляшевская О.Н., Плунгян В.А., Сичинава Д.В., О морфологическом стандарте Нацио-
нального корпуса русского языка, [в:] Национальный корпус русского языка: 2003–
Результаты и перспективы, Изд. Индрик, Москва 2005, с. 111–135.
Мамонтова В.В., Корпусная лингвистика в современной языковедческой парадигме, «Ак-
туальные вопросы современной науки» 2010, № 12, с. 230–238.
Михайлов М., Параллельные корпуса художественных текстов, Tampere 2003.
Нагель О.В., Корпусная лингвистика и ее использование в компьютеризированном язы-
ковом обучении, «Язык и культура» 2008, т. 1, № 4, с. 53–59.
Рассказы о сновидениях: Корпусное исследование устного русского дискурса, ред. А.А. Ки-
брик, В.И. Подлесская, Изд. Языки славянских культур, Москва 2009.
Шаров С.А., Представительный корпус русского языка в контексте мирового опыта,
«Научно-техническая информация. Серия 2. Информационные процессы и систе-
мы» 2003, № 6, с. 9–18.
Шмелев А.Д., Языковые факты и корпусные данные, «Русский язык в научном освеще-
нии» 2010, № 1, с. 236–265.
http://www.ruscorpora.ru [доступ: 12.06.2017].
http://www.ruscorpora.ru/corpora-morph.html [доступ: 11.06.2017].
http://www.ruscorpora.ru/corpora-sem.html [доступ: 11.06.2017].
http://www.ruscorpora.ru/corpora-stat.html [доступ: 11.06.2017].
https://tech.yandex.ru/mystem [доступ: 2.01.2017].
Ta praca dostępna jest na licencji Creative Commons Attribution 3.0 License.
Artykuły zawarte w AUPC.SR są dostępne na licencji Creative Commons Uznanie autorstwa - Użycie niekomercyjne - Bez utworów zależnych 4.0 Międzynarodowe.
Annales Universitatis Paedagogicae Cracoviensis Studia Russologica = ISSN 1689-9911.