Please use this identifier to cite or link to this item: https://elib.utmn.ru/jspui/handle/ru-tsu/7382
Full metadata record
DC FieldValueLanguage
dc.contributor.authorZakharova, E. Yu.en
dc.contributor.authorSavina, O. Yu.en
dc.contributor.authorЗахарова, Е. Ю.ru
dc.contributor.authorСавина, О. Ю.ru
dc.date.accessioned2022-05-23T11:28:49Z-
dc.date.available2022-05-23T11:28:49Z-
dc.date.issued2020
dc.identifier.citationЗахарова, Е. Ю. Лексическое разнообразие текста и способы его измерения / Е. Ю. Захарова, О. Ю. Савина. – Текст : электронный // Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates / главный редактор Н. Н. Белозёрова. – Тюмень : Издательство Тюменского государственного университета, 2020. – Т. 6, № 1(21). – С. 20-34.ru
dc.identifier.issn2411-197Х
dc.identifier.issn2500-0896
dc.identifier.urihttps://elib.utmn.ru/jspui/handle/ru-tsu/7382-
dc.description.abstractThis paper reviews various lexical diversity (LD) measures and their classification. The authors define the most significant advantages and disadvantages of the measures and investigate the main scopes of LD application. They include measuring LD in the speech of children and people with aphasia, checking progress in learning a foreign language, and investigating different writing styles of certain authors. Results show that the most frequently used measure is the type-token ratio (TTR), which means the ratio of different words (types) to the total number of words (tokens). The most important problem of TTR and other measures based on TTR is that the more tokens a text has, the less is the TTR value. This has led to the development of other measures; some of them are based on a TTR formula, thus, they do not solve the problem and the calculation result is also affected by the text length. In that case, the texts with different length cannot be compared. Another group of measures rests upon the TTR formula supplemented by a principle of sample forming. These measures solve the problem of the TTR partially or completely, though they often require some extra instruments. Fortunately, these instruments are available on the Internet and demand no particular knowledge on their working principle or in programming. Contemporary researchers tend to use independent measures, because texts mostly have different length and the dependent measures cannot give proper results.en
dc.description.abstractВ данной статье представлен обзор способов расчета коэффициента лексического разнообразия текста с их последующей классификацией, определены основные преимущества и недостатки способов, рассмотрены основные сферы практического применения коэффициента. Установлено, что самым распространенным способом является соотношение уникальных лексических единиц (тайпов) и всех словоформ (токенов) – TTR (англ. type-token ratio). Однако главной проблемой TTR и нескольких других производных способов является зависимость результата расчета от длины текста, то есть чем больше в тексте лексических единиц, тем ниже значение TTR. Таким образом, сравнение коэффициентов лексического разнообразия текстов разной длины невозможно. В связи с этим были разработаны другие способы расчета. Некоторые представляют собой видоизмененную формулу TTR, модифицированную квадратным корнем, логарифмом или другой математической операцией, однако они не решают проблему TTR. Другая группа способов использует в расчете обычную формулу TTR, дополненную принципом определения выборки, то есть полный текст не исследуется сразу, а разделяется на более удобные для исследования части. Такие способы частично или полностью решают проблему зависимости результата от длины текста, но для их применения зачастую требуется дополнительный инструмент. Современные ученые склоняются к отказу от сложных формул и применению независимых способов, поскольку тексты для анализа в большинстве исследований имеют разную длину (особенно это касается текстов, не созданных специально для исследований – художественной литературы или законодательных актов), и здесь зависимые способы не могут дать корректный результат.ru
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.publisherИздательство Тюменского государственного университетаru
dc.relation.ispartofВестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates. – 2020. – Т. 6, № 1(21)ru
dc.subjectlexical diversityen
dc.subjectlexical diversity measuresen
dc.subjectlexicometryen
dc.subjectstatistical linguisticsen
dc.subjectquantitative methodsen
dc.subjectvocabularyen
dc.subjectlexemeen
dc.subjectлексическое разнообразиеru
dc.subjectкоэффициент лексического разнообразияru
dc.subjectлексикометрияru
dc.subjectлингвостатистикаru
dc.subjectквантитативные методыru
dc.subjectсловарный запасru
dc.subjectлексемаru
dc.titleЛексическое разнообразие текста и способы его измеренияru
dc.title.alternativeLexical diversity measures’ review and classificationen
dc.typeArticleen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.typeinfo:eu-repo/semantics/articleen
local.description.firstpage20
local.description.lastpage34
local.issue1(21)
local.volume6
dc.identifier.doi10.21684/2411-197X-2020-6-1-20-34
Appears in Collections:Вестник ТюмГУ: Гуманитарные исследования. Humanitates

Files in This Item:
File SizeFormat 
humanitates_2020_1_20_34.pdf508.8 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.