Creating the own corpus of American film scripts
Journal Title: Науковий вісник Дрогобицького державного педагогічного університету імені Івана Франка. Серія: Філологічні науки (мовознавство) - Year 2018, Vol 9, Issue
Abstract
The article deals with the problem of creating the own corpus of texts on the example of the corpus of American family film scripts. The methodology and criteria for constructing linguistic corpus are considered. The typology and main characteristics of the created corpus are determined. Special attention is drawn to the technological process of creating a corpus which included: finding the sources of linguistic material; entry of the data in the form of the texts of the film scripts presented in plain text format (*.txt), annotation, part-of-speech (POS) tagging, converting tagged texts into a specialized linguistic information retrieval system or corpus manager which provides rapid multi-dimensional search and statistical processing. In this research we used the AntConc manager. We focused on analysis of the created corpus which included: defining the total number of tokens and total number of types in the corpus, finding the type-token ratio (TTR) and standard type-token ratio (STTR), making a list of the most frequent word forms, clarification of the hapax legomena (words used in corpus only once), detection of frequency of distribution of different parts of speech, finding the index of the lexical density, defining the average length of the sentence of the corpus, determination of the index of formality, making a keyword list. We found that most key words are lexically neutral, belong to the core vocabulary and relate to everyday family life. Two words from the list belong to the colloquial style. There are also words that occur to be technical and directorial remarks.
Authors and Affiliations
О. В. Скобнікова
СПІВВІДНОШЕННЯ ОНОМАСІОЛОГІЧНОЇ Й СЛОВОТВІРНОЇ СТРУКТУР У ПОХІДНОМУ СЛОВІ
Статтю присвячено встановленню взаємної залежності ономасіологічної й словотвірної структур похідного слова в межах вивчення природи, закономірностей і різновидів мовного позначення реалій об’єктивної дійсності та виявле...
Conceptual content of functional-semantic category of futurality in modern French language
The purpose of the article is to present a functional description of the futuristic aspect and tense forms that comprise the conceptual, functional-semantic category of futurality in the modern French language. The objec...
The communicative aspect of the pragmatic meaning of antonyms of the Ukrainian language
The article deals with the communicative pragmems in the pragmatic component of the lexical meaning of antonyms in the Ukrainian language. The research singles out the main microcomponents of pragmatically relevant infor...
МЕТАКОМУНІКАТИВНИЙ ВОКАБУЛЯР НА РІВНІ ІНТРАТЕКСТУАЛЬНОЇ РЕАЛЬНОСТІ
У статті йдеться про вивчення контекстуально залежних метакомунікативів та виокремлення їх основних типів. Проаналізовано зазначені метакомунікативи на рівні інтратекстуальної реальності та простежено їхнє функціонування...
Artemenko I. O. Metaphor as a symbolic means of expressing specific traits of North American students’ subculture.
The article deals with metaphorical units expressing specific traits of students’ gender societies activity in the USA. The article also highlights metaphoric mechanisms of their symbolic meaning-formation and functionin...