Please use this identifier to cite or link to this item: https://elib.utmn.ru/jspui/handle/ru-tsu/15005
Title: Извлечение ключевых терминов на базе корпуса текстов о разработке нефтяных и газовых месторождений
Other Titles: Key Term Extraction Based on a Corpus of Oil and Gas Field Development Discourse
Authors: Ковязина, Марина Анатольевна
Marina, A. Kovyazina
Keywords: corpus;term extraction;terminology;keyness score;корпус;извлечение терминов;терминология;показатель ключевого слова
Issue Date: 2016
Citation: Ковязина, М. А. Извлечение ключевых терминов на базе корпуса текстов о разработке нефтяных и газовых месторождений / М. А. Ковязина // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. - 2016. - Т. 2, № 3. - С. 61-69.
metadata.dc.relation.ispartof: Вестник ТюмГУ: Гуманитарные исследования. Humanitates. 2016. Том 2 №3
Abstract: Статья излагает результаты исследования, посвященного извлечению терминологии на базе текстового корпуса. Автор применяет программное приложение AntConc и корпусную поисковую систему Sketch Engine для формирования корпуса специальных текстов, рассматривающих основные этапы и методы разработки месторождений нефти и газа, и выявления терминологии, являющейся ключевой для данной предметной области. Основная терминология, описывающая область разработки месторождений нефти и газа, извлекается с использованием нескольких корпусных инструментов: построение частотных списков слов, вычисление относительной частоты (ipm) для единиц корпуса, выявление ключевых слов и терминов с применением статистической меры ключевого слова (keyness score), построение дистрибутивного тезауруса на основе меры ассоциации logDice. В результате анализа на базе корпуса выделены единицы, семантически близкие термину «разработка», а также отраслевые и общенаучные термины, ключевые для исследуемой предметной . The paper presents a research targeted at term extraction based on a text corpus. The author of the research uses the corpus analysis toolkit “AntConc” and the corpus query system “Sketch Engine” to compile the corpus of texts devoted to oil and gas field development processes, stages, and methods, as well as to extract the key terminology of the domain. Several corpus methods are used to identify the terminology inherent in oil and gas field development discourse: analysing word frequency lists, generating a list of key words and terms based on keyness score, and building a distributional thesaurus with the application of the logDice coefficient. As a result of the corpus-based research, the terms synonymous with the key notion “field development” have been grouped, as well as the key domain-specific and general scientific terminology has been extracted.
URI: https://elib.utmn.ru/jspui/handle/ru-tsu/15005
Appears in Collections:Вестник ТюмГУ: Гуманитарные исследования. Humanitates

Files in This Item:
File SizeFormat 
061_069.pdf519,96 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.