Ласкаво просимо

до електронної бібліотеки Інституту журналістики

Головна || Законодавча база || Навчально-методичні комплекси || Наукові видання
Праці викладачів || Студентські роботи || Різне


Особливості укладання й сфери застосування словника-мінімуму української мови для студентів-іноземців

Зіновій Партико


УДК 81’374

Розглянуто існуючі концепції укладання словників-мінімумів. Описано автоматизовану технологію укладання загального словника-мінімуму української мови. Крім того, подано методики укладання антропонімічного й топонімічного словників-мінімумів української мови. Вказано сфери використання таких словників. Визначено шляхи вдосконалення словника-мінімуму.

Ключові слова: словник-мінімум, метод, лексика, слово, антропонімія, топонімія.

TThe existing methods of compiling of dictionaries-minimums are considered. Automation technology of compiling of the common Ukrainian dictionary-minimum are described. Besides, technology of compiling of anthroponymical and toponymical dictionaries-minimums are presented. Spheres of utilization of such dictionaries are indicated. The ways of Ukrainian dictionary-minimum improvement are defined.

Key words: vocabulary-minimum, method, vocabulary, word, toponymy, antroponymy


Зі здобуттям Україною незалежності й утвердженням статусу української мови як державної постала потреба в навчанні іноземців цієї мови. Проте, як виявилося, українське мовознавство до такого завдання було не зовсім готовим, причому в одному з найважливіших пунктів – у відборі лексичного мінімуму. Як відомо, перед таким мінімумом ставлять вимогу, яка полягає в тому, щоби забезпечити розуміння мовцем максимального обсягу кожного сприйнятого тексту при умові знання мінімальної кількості слів потрібної мови.

Ця проблема має зв'язок з важливими науковими й практичними потребами: перша (наукова) – це розроблення методики укладання словника, а друга (практична) – це можливість використання словника-мінімуму для навчання студентів-іноземців і підготовки для них підручників української мови.

Що стосується стану дослідженості цієї проблеми, то тут – крім інтуїтивного відбору лексики лінгвістами – вже існують певні наукові методи, зокрема відбір лексики за певними ознаками (наприклад, тематичними, частотними) або на основі наявності в кількох словниках одночасно (ознака поширеності слова). Останній спосіб (при умові використання частотних словників) є одним із найоб'єктивніших. Проте для укладання словника-мінімуму української мови до цього часу використовували, як правило, або інтуїцію, або тематичні ознаки (див. словники в підручниках української мови для іноземців; перелік цих підручників подано нижче в посторінкових примітках). Це означає, що в них об'єктивні методи для укладання словників-мінімумів не використовувались.

Саме з цієї причини впродовж останніх років нами було укладено словник-мінімум української мови [1]. Крім того, оскільки тексти завжди містять найрізноманітніші назви, його було доповнено антропонімічним і топонімічним словниками-мінімумами української мови. Зараз цей комплексний словник готується до опублікування1.

Мета цієї статті – детально описати методики укладання словників-мінімумів української мови, а також можливі сфери їх застосування.

Методи укладання словників-мінімумів. Для укладання словників-мінімумів застосовують кілька методів. Так, один із них, запропонований свого часу французькими дослідниками [2], передбачав, що найперше слід сформувати множину основних картин світу (на зразок: людина, погода, дім, пошта, розваги тощо), далі потрібно описати ці картини словами, уклавши з них підсловники, а тоді об'єднати ці підсловники в одне ціле – словник-мінімум. Суттєвою вадою цього методу є те, що він зовсім не враховує наявність службових частин мови, частотних характеристик лексики, допускає використання низькочастотної лексики тощо.

Інший метод, розроблений у Росії, передбачає, що слід зібрати якомога більше частотних словників (вони, звичайно, повинні належати до однієї тематичної галузі), відібрати з них лексику лише вищих рангів – наприклад, від 1-го до 3–5-тисячного, – а далі виділити ті слова, які входять одночасно до всіх чи більшості словників [5]. У такий спосіб цей метод враховує як частотність слів у текстах, так і їх поширеність у різних словниках. Основною вадою цього методу є те, що він не бере до уваги тих слів, які позначають об'єкти нашого повсякдення, серед яких ми живемо, але не входять до складу високочастотної лексики (наприклад, деталі одягу).

Ще один метод передбачає використання обох згаданих методів одночасно, а саме: високочастотну лексику беруть із частотних словників, а низькочастотну, що описує навколишній світ, – з основних картин світу. На нашу думку, останній метод є оптимальним, крім того, відбір слів з окремих готових словників легко піддається алгоритмізації, а це робить укладання такого словника простим настільки, що його може виконувати комп'ютер. Редагування словника, звісно ж, залишається за людиною. Обсяг такого словника, як свідчать численні дослідження, повинен становити від 2 до 3 тис. слів.

Зважаючи на подані міркування, для укладання словника-мінімуму української мови було обрано саме останній зі згаданих методів.

Крім того, укладання словника-мінімуму на основі кількох словників має ще одну перевагу – використовувати так звану технологію "концентричних вкладених кіл" (див. рисунок). Ця технологія передбачає, що відібрану для словника-мінімуму лексику записують окремими, якщо можна так сказати, "пластами" (рівнями): в ядрі словника є слова, які входять до всіх без винятку словників; у другому від центру "кільці" – слова, що входять до всіх, крім одного, словників; у третьому від центру "кільці" – слова, що входять до всіх, крім двох, словників тощо. Це дає змогу, відповідно, ранжувати лексику за рівнями вивчення мови (наприклад, ядро – для першого, перше "кільце" – для другого, друге "кільце" – для третього рівня вивчення мови).

Структура словника-мінімуму:

1 – лексика першого рівня; 2 – лексика другого рівня;

3 – лексика третього рівня; 4 – лексика четвертого рівня;

n – лексика n-го рівня

Методика укладання словника-мінімуму загальної лексики. До початку 90-х років для української мови було укладено близько десятка частотних словників. Проте ці словники з різних причин не можна було використовувати в нашому дослідженні. Річ у тім, що їх було укладено або на недостатньо великих вибірках, або вони містили лексику ХІХ століття. Оскільки на початку 90-х років ХХ століття був лише один частотний словник української мови [11], який відповідав усім критеріям, то саме його ми взяли як базовий. Для дослідження з нього було вибрано всю лексику з частотою понад 10. Усі словоформи було лематизовано.

Другий частотний словник було укладено нами самостійно. Для його укладання було використано публіцистичні тексти обсягом 300 тис. слововживань (контрольні роботи студентів першого курсу факультету журналістики ЛНУ ім. І. Франка; у контрольних роботах було представлено всі газетні жанри). Кількість лематизованих слів в укладеному частотному словнику публіцистики становила близько 5 тис. Для укладання словника-мінімуму слова, що мали частоту менше 5, було відкинуто.

З підручників української мови для іноземців було вибрано чотири словники, з яких два вже було опубліковано, один друкувався, а ще одни був у рукописі [3; 7; 12; 13]. Кількість слів у цих словниках становила, відповідно: 3415, 936, 1126 і 2339 слів2. Підручник української мови для носіїв російської [4] при створенні словника-мінімуму не використовувався, оскільки, як показав аналіз його лексики, вона становить підмножину іншого словника [3].

Для укладання словника-мінімуму було застосовано описану вище стратегію "концентричних вкладених кіл". Відповідно до сказаного, алгоритм укладання словника працював так: 1) будь-яке слово було дозволено включати в словник-мінімум лише за умови, якщо воно входить одночасно у два частотні словники (і художньої прози, і публіцистики); 2) крім того, це слово повинно було входити одночасно ще в 1, 2, 3 чи 4 словники з підручників. На основі описаного алгоритму було розроблено програму, яка з шести вхідних утворювала чотири вихідні словники: до першого з них увійшли всі слова, наявні одночасно в усіх шести вхідних словниках; до другого – в п'яти вхідних словниках; до третього – у чотирьох вхідних словниках; до четвертого – у трьох вхідних словниках.

Для укладання словника було створено спеціальну комп'ютерну програму, що укладала словник-мінімум. Результати її роботи засвідчили, що кількість слів у першому підсловнику становила 204, у другому – 353, у третьому – 489, в четвертому – 768, а загалом в усьому словнику – 1814 слів.

Відповідно до сказаного, кожна лексема отримала свою паспортизацію. Розглянемо це на прикладі зі словника:

5 1101 вітання

6 1111 вітати

4 0101 вітер

4 1001 вітчизняний

3 0001 віяти.

Тут перша цифра позначає, в скількох словниках трапляється слово. Друга, третя, четверта й п'ята цифри позначають, в яких саме навчальних словниках трапляється слово (перша – це словник підручника Ю. Жлуктенка, друга – підручника Р. Помірка, третя – підручника Л. Новицької, четверта – підручника Г. Макарової). Цифра "1" вказує, що слово вжите, а "0", – що слово не вжите у відповідному словнику.
Як показав аналіз лексики словника, деякі зі слів доречно було б відредагувати. З цією метою над словником виконано такі операції:

– усунено історизми та архаїзми;

– розмежовано омоніми;

– додано відсутні слова (наприклад, деякі числівники, назви місяців, пір року, днів тижня, кольорів тощо);

– додано деякі слова середньої частотності (з метою доведення кількісного складу лексики до 3 тис.);

– додано "резервні" слова [2];

– замінено слова, що не відповідають сучасним нормам української літературної мови;

– зазначено для кожного слова наголос;

– вказано для кожного дієслова, для якого в самому словнику нема відповідника в доконаному чи недоконаному виді, належну пару в потрібному виді.

Доповнення словника словами середньої частотності й "резрвними" словами зробило його таким, що складається з шести рівнів. Кількість слів у першому словнику становить 204, у другому – 353, у третьому – 481 і в четвертому – 759 слів, що в сумі становить 1797 слів. Кількість слів, доповнених із першої версії словника, становить 766 (більшість із них – це слова середньої частоти, які ввійшли до складу "Частотного словника сучасної української художньої прози"), а "резервних" слів – 436. Разом це становить 3 тис. слів.

Суттєвою перевагою цього словника є те, що кожен користувач може вибрати з нього ту частину, яка йому найбільше потрібна. Так, для першого етапу вивчення мови слід брати лише слова з "пласту" першого рівня, для другого етапу – зі слів "пласту" другого рівня тощо. У принципі, залучати для певного етапу лексику з "пласту" нижчого рівня можна, але не бажано. Залучення лексики нижчих рівнів треба уникали.

Проте, як відомо, тексти містять не лише загальновживану лексику, а й значну частину власних назв (топоніми й антропоніми). З огляду на сказане, додатково було укладено ще два словники: антропонімічний словник-мінімум і топонімічний словник-мінімум. Способи їх укладання описано нижче.

Укладання антропонімічного словника-мінімуму версії 1.0. Для укладання антропонімічного словника-мінімуму на основі довідників [8; 9] спершу було укладено загальний антропонімічний словник (складова – "Власні імена: чоловічі та жіночі"). Для кожного чоловічого імені в словнику подано також похідні від нього патроніми (чоловічого та жіночого роду). Складова цього словника "Прізвища" створена на основі телефонних довідників3.

Антропонімічний словник-мінімум було укладено на основі вищезгаданого загального антропонімічного словника. Під час його укладання при доборі імен було взято до уваги принцип частотності (використано дані відділів реєстрації актів громадянського стану4). Кількість записів становить: 77 (чоловічі імена), 154 (похідні від них патроніми) і 81 (жіночі імена). Словник-мінімум прізвищ було укладено також з урахуванням їх частотності (використано дані телефонних довідників5). У процесі редагування зі списку було видалено прізвища іншомовного походження. Крім того, наявні в кількох прізвищах типові помилки було усунено відповідно до норм сучасного українського правопису. Кількість записів – 174.

Укладання топонімічного словника-мінімуму версії 1.0. Спершу було укладено загальний топонімічний словник, куди ввійшла лексика з енциклопедичних довідників (назви держав, рік, гірських вершин, морів, океанів), а також статистичних і географічних довідників, опублікованих в Україні з 1995 до 1998 року з урахуванням вимог останнього правопису [6; 10]. Такі обмеження щодо українських топонімів було викликано тим, що після 1991 року в Україні певна частина населених пунктів змінила існуючі назви на ті, що вживалися в різних частинах держави до 1917 чи 1939 років.

Топонімічний словник-мінімум було укладено на основі загального топонімічного словника. Він містить здебільшого географічні назви України (міста, ріки, гори), а також назви найбільших держав. Принцип частотності тут не враховувався. Кількість записів у ньому становить 208. Таку порівняно велику кількість топонімів введено з тією метою, щоби користувачі, які є носіями різних мов, могли вибирати ті топоніми, які описують країни, де вони проживають.

Сфери використання словника-мінімуму. Як уже було частково зазначено, словники-мінімуми доцільно використовувати:

– для аудиторного навчання іноземців української мови;

– під час створення підручників української мови для іноземців;

– для вирішення питання про надання підручнику української мови для іноземців грифа Міністерства освіти й науки України6;

– для визначення складності текстів у текстових процесорах і системах редагування;

– під час прийняття в українське громадянство7;

– при вирішенні питання про призначення на посаду державного службовця;

– для екпериментальних лінгвістичних досліджень.

Таким чином, використання словника-мінімуму в експериментальній системі редагування "Редактор" показало, що він визначає складність тексту здебільшого коректно. Це прямо свідчить про те, що він справді є словником-мінімумом української мови.

Словники-мінімуми доцільно використовувати в навчальному процесі (під час навчання іноземців), у системах опрацювання текстів для визначення семантичної складності тексту, а також у законодавчих актах, що регулюють використання державної мови.

Актуальним є вдосконалення укладеної версії словника-мінімуму. Для вдосконалення, крім використаних частотних словників, планується використати ще два частотні словники: а) частотний словник публіцистики (словник укладено на зовсім інших текстах, ніж описано вище, причому на значно більшій вибірці); б) частотний словник української художньої прози за період після 70-х років ХХ століття.

Актуальним є також удосконалення антропонімічного (розширення ареалу використаної лексики) й топонімічного (врахування фактора частотності) словників-мінімумів.

1. Ардан Р. В., Бацевич Ф. С., Партико З. В. Комп'ютерний словник-мінімум української мови // Мовознавство. – 1996. – № 4 – 5. – С. 34 – 40.

2. Гиндин С. И. Частота слова и его значимость в системе языка // Лингвостатистика и вычислительная лингвистика. – 1982. – Вып. 628.
3. Жлуктенко Ю. О., Тоцька Н. І., Молодід Т. К. Підручник української мови. – К., 1973.

4. Жлуктенко Ю. А., Карпиловская Е. А., Ярмак В. И. Изучаем украинский язык. – К., 1991.

5. Лексическая основа русского языка. – М., 1984.

6. Населення України. 1994. Демографічний щорічник. – К., 1995.

7. Новицька Л. Г., Поліщук Т. М. та ін. Вивчаємо українську. – К.: НМК ВО, 1993.

8. Скрипник Л. Г., Дзятківська Н. П. Власні імена людей. – К.: Наукова думка, 1986.

9. Словник власних імен людей. – 3-тє вид., виправ. і доп. – К.: Наукова думка, 1967.

10. Статистичний щорічник України за 1998 р. – К.: Техніка, 1999. – 576 с.

11. Частотний словник сучасної української художньої прози: У 2 т. – К.: Наукова думка, 1981.

12. Makarova H., Palamar L., Prisyashnyuk N. Speak Ukrainian with us. Part 1, 2. – Kyiv, 1991–1992.

13. Pomirko R. La Langue ukrainienne: Manuel pour les debutants. – Lviv, 1996. [Manuscript].

 

© Партико Л.Д., 2004


© Інститут журналістики. Усі права застережені
Посилання на матеріали цього видання під час їх цитування обов'язкові