ЛЕКСИКАТА В CANTILENA PRO SABATHO: ГЛОТОМЕТРИЧЕН АНАЛИЗ | Международен филологически форум
philol.forum@uni-sofia.bgСп. "Филологически форум" - хуманитарно списание за млади изследователи на Факултета по славянски филологии е вече в Scholar One!

ЛЕКСИКАТА В CANTILENA PRO SABATHO: ГЛОТОМЕТРИЧЕН АНАЛИЗ

Posted in: том 10 Started by

ЛЕКСИКАТА В CANTILENA PRO SABATHO: ГЛОТОМЕТРИЧЕН АНАЛИЗ

ЛЕКСИКАТА В CANTILENA PRO SABATHO: ГЛОТОМЕТРИЧЕН АНАЛИЗ

Симеон Стефанов, Институт за български език, БАН

s.stefanov@ibl.bas.bg

 

Резюме: Настоящото изследване е опит да се приложи методът на статистическата лингвистика върху материал от едно от най-ранните средновековни произведения в хърватската книжнина, писани на народен език и записани с латински букви, известно като Cantilena pro sabatho. Тъй като не ми е известно подобни проучвания да са правени върху други ранни хърватски произведения, основната задача е да се даде материал за сравнение с резултатите от бъдещи изследвания.

Ключови думи: Един от най-ранните текстове в средновековната хърватска книжнина, Cantilena pro sabatho, медиевистика, историческа лексикология на хърватския език, глотометричен анализ.

 

 

LEXIS IN CANTILENA PRO SABATHO: GLOTOMETRIC ANALYSIS

Simeon Stefanov, Institute for Bulgarian language, BAS

Sofia, Bulgaria

 

Abstract: The present study is an attempt to apply statistical methods in investigating the vocabulary of one of the earliest known Medieval Croatian text, written in Croatian vernacular with Latin script, known as Cantilena pro sabatho. The main aim is to give comparative material for similar future studies.

Keywords: One of the earliest texts in Medieval Croatian literature, Cantilena pro sabatho, medieval studies, historical lexicology of Croatian language, glotometric analysis.

 

 

  1. Предмет, цели, задачи и методи на изследване

Настоящото изследване е опит да се приложи методът на статистическата лингвистика (Frumkina 1964: 42-54, Yanakiev 1977, Hristova 1994: 7-40, Davidov 1996: 28-43, Ilieva 2011: 14-36; 2013: 72-86 и др.) върху материал от едно от най-ранните средновековни произведения в хърватската книжнина, писани на народен език и записани с латински букви, известно като Cantilena pro sabatho (нататък също CPS). Тъй като не ми е известно подобни проучвания да са правени върху други ранни хърватски произведения, основната задача е да се даде материал за сравнение и съпоставка с резултатите от бъдещи изследвания. Все пак за някои от разгледаните категории ще дам сведения за резултатите от работата ми върху други три паметника от този период. Това са най-ранният известен засега хърватски текст, писан на народен език и записан с латински букви, Red i zakon od primlenja na dil dobroga činjenja sestar naših reda svetoga otca našega dominika (нататък също RZ, по подробно за този текст вж. Stefanov 2018v, 2020) от 1345 г., Šibenska molitva или Oracio pulcra (et) devota ad B(ea)tam V(irginem) Ma(r)ia(m) от края на XIV в. (нататък също ŠM, по подробно за този текст вж. Stefanov 2018b, 2020) и житието на св. Екатерина Legenda sv. Katarine divice от XIV-XV в. по ръкопис I c 6 от Архива на ХАЗУ (нататък също LSK, по подробно за този текст вж. Stefanov 2012, 2013, 2014a, 2014b, 2015a, 2015b, 2015v, 2016, 2017a, 2017b, 2018a, 2019, 2020). За да прецизирам обобщенията и изводите си се запознах и с резултатите от изследвания върху езика на произведения от старата българска литература, с известното за състоянието в съвременни български литературни жанрове, с жанровата класификация на средновековната хърватска литертура. Сведения за състоянието в текстове от старата и съвременната българска литература заемам от Ilieva 2013 и Yanakiev 1977, а за жанровата класификация на средновековната хърватска литература от Hercigonja 1973, 1975 и Fališevac 1978. Трябва да се има предвид, че разглежданият тук паметник е препис от края на XIV в. – 1385 г. (Hadrovics 1984: 16), най-вероятно е превод от латинска или италианска подложка, поради което е възможно неговите езикови особености да са присъщи не само на хърватския текст, но и на предполагаемия протограф. Тъй като съпоставката с латински източници не е част от задачите на настоящото изследване, а и понеже хърватският текст все пак е написан на народен език, смятам, че CPS, който отразява до голяма степен особеностите на говоримия език от разглеждания период, може да ни послужи като свидетелство и за неговото състояние.

  1. За паметника. Лексиката в CPS. Глотометричен анализ
    • За паметника

Cantilena pro sabatho от средата на XIV в. е драматургично произведение, описващо събитията през Велики петък и Велика събота на страстната седмица. Включва кръстните мъки на Исус Христос до момента, когато Мария утешава Апостолите. Събитията са представени от Йосиф от Ариматея, отчасти под формата на диалог. Включен е и моментът с плача на Мария над мъртвия си син и пророкуването на неговото възкресение. Произведението е записано с латиница на чакавски. Съдържа 132 осмосрични стиха. Текстът е открит от унгарския славист Ласло Хадрович на последната страница на кодекс с латински проповеди. Този кодекс е принадлежал на францисканския манастир в Шибеник, а негов пряк собственик е бил фра Павел Шибенчанин. Вероятно той е за/преписал CPS на посоченото място в сборника. Това се е случило около 1385 г. Днес паметникът се пази в унгарската национална библиотека под сигнатура CodLat 540, 1k, folio 91v (Hadrovics 1984: 15-23, Damjanović, Kuzmić, Mihaljević, Žagar 2009: 533).

  • Лексиката в CPS. Глотометричен анализ
    • Показатели на словника

Словникът на CPS наброява 261 заглавни единици. От тях по честота на употреба в текста в групата от първата до петдесетата дума влизат 13 съществителни имена, 5 прилагателни имена, 8 глаголни форми  или общо 26 лексеми пълнозначна лексика[1], срещу 24 – служебна лексика. Изчислени в проценти тези стойности показват, че 26% от петдесетте най-често употребявани думи в текста са съществителни имена. С общо 66 словоупотреби те заемат 12,27% от текста, а като 13 съществителни имена – 4,98% от целия словник. Прилагателни имена са 10% от групата. С 15 словоупотреби те заемат 2,79% от текста, а като 5 прилагателни имена – 1,92% от целия словник. Глаголните форми са 8 и съставляват 16% от групата. С общо 48 словоупотреби те заемат 8,92% от текста, а като 8 заглавни единици – 3,07% от целия словник. Сред петдесетте най-често употребявани думи в текста пълнозначната лексика е 26 заглавни единици – 52%. Със 129 словоупотреби тя заема 23,98% от текста, а като 26 лексеми – 9,96% от целия словник. Непълнозначната лексика съставлява 48% от групата. Със 137 словоупотреби тя заема 25,46% от текста, а като 24 заглавни единици – 9,2% от целия словник.

В групата от 51 до 100 най-чести думи в словника на CPS влизат 18 съществителни имена, 6 прилагателни имена, 14 глаголни форми, или общо 38 лексеми пълнозначна и 12 – непълнозначна лексика. Изчислени в проценти тези стойности показват, че 36% от думите в тази група са съществителни имена. С общо 28 словоупотреби те заемат 5,2% от текста, а като 18 съществителни имена – 6,9% от целия словник. Прилагателни имена са 12% от групата. С общо 7 словоупотреби те заемат 1,3% от текста, а като 6 заглавни единици – 2,3% от целия словник. Глаголните форми са 28% от групата. С общо 27 словоупотреби те заемат 5,02% от текста, а като 14 заглавни единици – 5,36% от целия словник. Пълнозначната лексика в групата е 38 лексеми, или 76% от нея. С общо 62 словоупотреби тя заема 11,75% от текста, а като 38 заглавни единици – 14,56% от целия словник. Непълнозначната лексика в групата е 12 лексеми и съставлява 24% от нея. С общо 21 словоупотреби тя заема 3,9% от текста, а като 12 лексеми – 4,6% от целия словник.

В групата от 101 до 150 по честота на употреба единица в словника влизат 17 съществителни имена, 9 прилагателни имена, 13 глаголни форми, или общо 39 единици пълнозначна лексика и 11 единици непълнозначна лексика. Това са лексеми употребени по веднъж в текста. Изчислени в проценти тези стойности показват, че 34% от тази група са съществителни имена. С общо 17 словоупотреби те заемат 3,16% от текста, а като 17 лексеми – 6,5% от целия словник. Прилагателните имена са 18% от групата. С общо 9 словоупотреби те заемат 1,67% от текста, а като 9 прилагателни имена – 3,45% от целия словник. Глаголните форми са 26% от групата. С общо 13 словоупотреби те заемат 2,42% от текста, а като 13 заглавни единици – 4,98% от целия словник. Пълнозначната лексика е 78% от групата. С общо 39 словоупотреби тя заема 7,25% от текста, а като 39 заглавни единици – 14,94% от целия словник. Непълнозначната лексика е 22% от групата. С общо 11 словоупотреби тя заема 2,04% от текста, а като 11 заглавни единици – 4,21% от целия словник.

В групата от 151 по честота на употреба дума до края на словника, която наброява 111 заглавни единици, влизат 32 съществителни имена, 8 прилагателни имена, 61 глаголни форми, 10 единици служебна лексика. Това са лексеми употребени само по веднъж в текста. Изчислени в проценти тези стойности показват, че 28,83% от тази група са съществителни имена. С общо 32 словоупотреби те заемат 5,95% от текста, а като 32 лексеми – 12,26% от целия словник. Прилагателните имена са 7,2% от групата. С общо 8 словоупотреби те заемат 1,49% от текста, а като 8 заглавни единици – 3,07% от целия словник. Глаголните форми са 23,37% от групата. С общо 61 словоупотреби те заемат 11,34% от текста, а като 61 заглавни единици – 23,37% от целия словник. Общият брой на пълнозначната лексика в тази група е 101 лексеми или 90,99% от нея. Със 101 словоупотреби те заемат 18,77% от текста, а като 101 заглавни единици – 38,7% от целия словник. Непълнозначната лексика в групата е 10 лексеми или 9,01% от нея. С общо 10 словоупотреби те заемат 1,86% от текста, а като 10 заглавни единици – 3,83% от целия словник.

Общото количество на съществителните имена в словника е 80 заглавни единици, или 30,65% от него, на прилагателните имена – 28 заглавни единици, или 10,73% от него, на глаголните форми – 96 заглавни единици, или 36,78% от него. Общото количество на пълнозначната лексика е 204 заглавни единици, или 78,16% от него, а на непълнозначната – 57 заглавни единици, или 21,86% от него.

Въз основа на изнесените резултати, въпреки малкия обем на паметника, може да се забележи тенденцията да е висок процентът на служебната лексика сред най-често употребяваните думи в текста. Колкото повече намалява честотата на употребените единици в текста, намалява и количеството на служебната лексика, а нараства това на пълнозначната. Относително ниският процент на служебната лексика в словника показва, че голяма част от единиците от тази категория са употребени по повече от веднъж в текста.

Отношението покритие в текстапокритие в словника показва, че колкото по-висока е честотата на употреба на лексемите, по-голямо е и покритието в текста, а по-малко – в словника. С намаляването на честотата на употреба, намалява покритието на групата в текста, а нараства покритието в словника.

2.2.2. Показатели на отношението между словника и текста

2.2.2.1. Коефициент на лексикално многообразие

Важна категория при глотометричния анализ на един текст е коефициентът на лексикално многообразие. Чрез него се оценява съотношението между употребените поне веднъж лексеми и всички употреби в текста. Той се изчислява като разделим броя лексеми в словника на общия брой употреби и умножим полученото число по 100, за да го превърнем в проценти. По този начин се игнорират повторените единици, а се взимат пред вид само първите употреби на всяка лексема. В разглеждания текст коефициентът на лексикално многообразие е 48,51%. Това е доста висока стойност, която може да е повлияна и от малкия обем на паметника. За сведение коефициентът на лексикално многообразие в ŠM е 32,97%, в RZ е 40,06 %, а в прозаичните части на LSK – 29,05%.

Приведените резултати все пак показват известна стабилност за разглежданата категория в най-ранните хърватски текстове, писани на народен език и записани с латински букви, и са свидетелство за това, че макар и да не се опират на предходна книжовна традиция от подобен характер, хърватските книжовници все пак успяват да създадат текстове, които дори и в повечето случаи преводни, да отразяват особеностите и на говоримия език, но и да са лексикално разнообразни. Трябва да се има предвид, че това са различни по обем текстове, така че приведените данни биха могли да служат само като ориентир и отправна точка при бъдещи съпоставки на равни части от тези и други подобни произведения.

2.2.2.2. Индекс на повторяемостта

Друга съществена категория при глотометричния анализ на едно произведение е индексът на повторяемостта. Той се пресмята като разделим общия брой словоупотреби на броя единици в словника. Индексът на повторяемостта в разглежданото произведение е 2,06. За сведение в RZ той е 2,5, в ŠM 3,03, а в прозаичните части на LSK той е 3,44.

Това са относително ниски стойности на разглежданата категория в средновековната хърватска литература, писана на народен език с латински букви, а нейното постоянство показва, че вероятно и тя е относително стабилна. Все пак ниските стойности може да се дължат и на малкия обем на разглежданите паметници[2]. Напълно очаквано е колкото по-ниска е стойността на индекса на повторяемостта, толкова по-голямо да е разнообразието на речника на дадено произведение.

2.2.3. Показатели на текста

2.2.3.1. Статистически изчисления

С понятието „глаголна температура“ се означава процентът на лични глаголни форми, употребени в даден текст или текстови отрязък. Терминът е въведен от Мирослав Янакиев в книгата му Стилистиката и езиковото обучение. София: Държавно издателство „Народна просвета“, 1977, където авторът уточнява, че по този начин студентите му назовават споменатата текстова категория (Yanakiev 1977: 155, 185-190). По модела на този термин бихме могли да въведем (и изчислим) и „номиналната температура“, или процента на съществителните имена, „адективната температура“, или процента на прилагателните имена. Бихме могли да разграничим и процента на личните от този на неличните глаголни форми в общото количество единици от тази категория в даден текст или текстови отрязък. Въз основа на изследванията си върху стила на съвременни български автори Мирослав Янакиев установява, че текст или текстови отрязък с относително висок процент лични глаголни форми (с висока „глаголна температура“) звучи по-живо, по-динамично, по-раздвижено, по-действено, а насищането на разказа със съществителни имена внася предметност (Yanakiev 1977: 155). За относително висок процент лични глаголни форми се смята резултат в рамките 18-25% в една килолекса (Yanakiev 1977: 185-190). В цитираното изследване Мирослав Янакиев уточнява, че в разговорната практика употребяваме повече лични, отколкото нелични глаголни форми, докато по-честата употреба на нелични глаголни форми е присъща на писаните текстове (Yanakiev 1977: 181-185). Въпреки че това заключение е направено върху езика и стила на съвременни български автори и понеже не ми е известен подобен труд в хърватската наука за литературата, обхващаща текстове от периода XIV-XV в., цитирам българския изследовател. Смятам, че наблюденията му биха могли да се окажат валидни и за средновековни (хърватски) текстове, писани на народен език.

Словникът на CPS наброява 261 заглавни единици в 538 словоупотреби. Общото количество на съществителните имена в текста е 143 единици, или 26,58% от него, на прилагателните имена – 39 единици, или 7,25% от него, на глаголните форми – 149 единици, или 27,7% от него. Общото количество на пълнозначната лексика в текста е 331 единици, или 61,52% от него, а на непълнозначната – 207 единици, или 38,48% от него. От приведените резултати се вижда, че процентът на глаголните форми 27,7% е относително висок. За сведение в RZ той е 18,18%, в ŠM е 14,33%, а в прозаичните части на житието на св. Екатерина LSK е 23,39%. Процентът на съществителните имена в разглеждания текст е 26,58%. За сведение в RZ той е 30,97%, в ŠM е 33,59%, а в LSK е 23,11%. Процентът на прилагателните имена в разглеждания текст е 7,25%. За сведение в RZ той е 10,51%, в ŠM е 18,49%, а в LSK е 7,98%.

  • Средна аритметична стойност и средно квадратично отклонение от нея за разглежданите категории в текста. Гаранция за 100% надеждност на ексцерптна оценка на средната аритметична стойност

Сега ще установя какво е състоянието на разглежданите категории в CPS и по килолекси, и за целия текст. Тъй като обемът на паметника е 538 единици, ще приведа информацията за петте цели килолекси, но ще използвам също и тази само за първите три, понеже идеята ми е след това да съпоставя получените резултати с резултатите от RZ, а неговият обемът е 349 единици, или три цели килолекси и половина, и ŠM, а неговият обем е 649 единици, или шест цели килолекси и половина. От ŠM ще използвам информацията само за първите пет килолекси. За съпоставката с LSK ще използвам сведенията от петте цели килолекси CPS. В бъдеще тези резултати ще могат да послужат за сравнения и съпоставки с равни по обем ексцерпти от други средновековни хърватски текстове, писани на народен език и записани с латински букви.

В първата килолекса CPS са употребени 26 съществителни имена, или 26% от ексцерпта, 7 прилагателни имена, или 7% от ексцерпта, 28 глаголни форми, или 28% от ексцерпта, общо 61 думи пълнозначна лексика, или 61% от екцерпта, и 39 непълнозначна лексика, или 39% от ексцерпта.

Във втората килолекса се срещат 25 съществителни имена, или 25% от ексцерпта, 9 прилагателни имена, или 9% от ексцерпта, 27 глаголни форми, или 27% от ексцерпта, общо 61 думи пълнозначна лексика, или 61% от ексцерпта, и 39 – непълнозначна лексика, или 39% от ексцерпта.

В третата килолекса се срещат 30 съществителни имена, или 30% от ексцерпта, 10 прилагателни имена, или 10% от ексцерпта, 24 глаголни форми, или 24% от ексцерпта, общо 64 единици пълнозначна лексика, или 64% от ексцерпта, и 36 единици непълнозначна лексика, или 36% от ексцерпта.

В четвъртата килолекса са употребени 25 съществителни имена, или 25% от ексцерпта, 4 прилагателни имена, или 4% от ексцерпта, 31 глаголни форми, или 31% от ексцерпта, общо 60 думи пълнозначна лексика, или 60% от ексцерпта, и 40 непълнозначна лексика, или 40% от ексцерпта.

В петата килолекса се срещат 23 съществителни имена, или 23 % от ексцерпта, 6 прилагателни имена, или 6% от ексцерпта, 32 глаголни форми, или 32% от ексцерпта, общо 61 думи пълнозначна лексика, или 61% от ексцерпта, и 39 непълнозначна лексика, или 39% от ексцерпта.

В останалите 62 единици текст се срещат 14 съществителни имена, или 36,84% от ексцерпта, 3 прилагателни имена, или 7,89% от ексцерпта, 7 глаголни форми, или 18,42% от ексцерпта. Общо 24 единици пълнозначна лексика, или 63,16% от ексцерпта, и 14 непълнозначна лексика, или 36,84% от ексцерпта.

Броят на глаголните форми в петте килолекси CPS е съответно 28, 27, 24, 31, 32. Броят на съществителните имена е 26, 25, 30, 25, 23, а броят на прилагателните имена – 7, 9, 10, 4, 6. Средното аритметично количество глаголни форми за петте килолекси текст е 28,4. Оттук като извадим от средното аритметично реалното количество глаголни форми за всяка килолекса, получените резултати за всеки един ексцерпт вдигнем на квадрат и съберем стойностите помежду им, след това разделим полученото число на четири, понеже работим с пет килолекси, а на края сложим под квадратен корен резултата, получаваме 3,21. Това е средното квадратично отклонение на глаголните форми за всеки ексцерпт в петте цели килолекси текст. То ни показва с колко в една килолекса текст техният брой се отклонява от средната стойност за тази категония в n на брой (в нашия случай 5) килолекси текст. С негова помощ бихме могли да изчислим интервала на средната стойност на употребените глаголни форми в петте килолекси CPS. В нашия случай за глаголните форми той би трябвало да е 25,19-31,61. Отново с помощта на средното квадратично отклонение можем да изчислим гаранцията за 100% надеждност на ексцерптната оценка на стойността на тази категория в петте килолекси CPS. Тя се получава като умножим по три средното квадратично отклонение, а за глаголните форми в CPS е 3,21×3=9,63.

Средното аритметично на употребените съществителни имена в петте килолекси текст от CPS е 25,8. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 2,61. Интервалът на средната стойност на употребените съществителни имена за петте килолекси CPS е 23,19-28,41. Гаранцията за 100% надеждност на ексцерптната оценка на стойността на съществителните имена за петте килолекси текст е 7,83.

Средното аритметично за прилагателните имена в петте килолекси CPS е 7,2. Средното квадратично отклонение за тази категория е 2,39. Интервалът на средната стойност на употребените прилагателни имена е 4,81-9,59. Гаранцията за 100% надеждност на ексцерптната оценка на стойността на прилагателните имена за петте килолекси е 7,17.

Заради съпоставката с резултатите от работата ми върху RZ, ще направя същите изчисления и за смо три килолекси текст, понеже RZ има само три цели килолекси текст. След това ще приведа резултатите от изчисленията на тези категории в по пет килолекси текст от ŠM и LSK.

Средното аритметично на употребените съществителни имена в три килолекси текст от CPS е 27. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 2,65.

Средното аритметично на употребените прилагателни имена в три килолекси текст от CPS е 8,67. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 1,53.

Средното аритметично на употребените глаголни форми в три килолекси текст от CPS е 26,33. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 2,08.

Средното аритметично на употребените съществителни имена в пет килолекси текст от ŠM е 35,6. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 5,18.

Средното аритметично на употребените прилагателни имена в пет килолекси текст от ŠM е 20,6. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 2,51.

Средното аритметично на употребените глаголни форми в пет килолекси текст от ŠM е 10. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 1,73.

Средното аритметично на употребените съществителни имена в първите пет килолекси текст от LSK е 26,4. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 3,78.

Средното аритметично на употребените прилагателни имена в първите пет килолекси текст от LSK е 9,8. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 3,27.

Средното аритметично на употребените глаголни форми в първите пет килолекси текст от LSK е 22. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 6,04.

Средното аритметично на употребените съществителни имена във вторите пет килолекси текст от LSK е 21,2. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 6,22.

Средното аритметично на употребените прилагателни имена във вторите пет килолекси текст от LSK е 5,4. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 2,3.

Средното аритметично на употребените глаголни форми във вторите пет килолекси текст от LSK е 25,2. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 4,44.

Средното аритметично на употребените съществителни имена в третите пет килолекси текст от LSK е 18,2. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 5,17.

Средното аритметично на употребените прилагателни имена в третите пет килолекси текст от LSK е 9. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 1,87.

Средното аритметично на употребените глаголни форми в третите пет килолекси текст от LSK е 24,6. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 4,04.

Средното аритметично на употребените съществителни имена в четвъртите пет килолекси текст от LSK е 24. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 1,73.

Средното аритметично на употребените прилагателни имена в четвъртите пет килолекси текст от LSK е 8,2. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 3,11.

Средното аритметично на употребените глаголни форми в четвъртите пет килолекси текст от LSK е 22,6. Средното квадратично отклонение за тази категория в текстовите ексцерпти е 1,14.

2.2.3.3. Критерий на Пиърсън

Сега вече бих могъл да изчисля и потенциално колко съществителни имена, прилагателни имена, глаголни форми, пълнозначна и непълнозначна лексика бих могъл да очаквам в останалите 62 единици текст CPS от последната шеста килолекса текст. Така ще получа още една хипотетична цяла килолекса.  В статистическата лингвистика тази процедура се използва за оценка на отношението между теорията и практиката при изчисляване на дадени стойности (Yanakiev 1977: 220-222). Текстовата корекция до края на текста е 62 единици. За да получа търсеното от мене количество на употребени единици в текстовата корекция ще разделя гаранцията за 100% надеждност на изчисление на стойността съответната категория за целия текст на 62 и ще умножаю полученото число по гаранцията за 100% надеждност на изчисление на съответната категория. След направените изчисления установявам, че очакваното количество съществителни имена в текстовата корекция е (7,83/62)x7,83=0,99=1. Очакваното количество прилагателни имена в текстовата корекция е (7,17/62)x7,17=0,83=1. Очакваното количество глаголни форми е (9,63/62)x9,63=1,5=2.

Общото количество съшествителни имена в хипотетична цяла шеста килолекса CPS е 14+1=15 (15%). Общото количество прилагателни имена в хипотетична цяла шеста килолекса CPS е 3+1=4 (4%). Общото количество глаголни форми в хипотетична цяла шеста килолекса CPS е 7+2=9 (9%). Общото количество на пълнозначна лексика в хипотетична цяла седма килолекса CPS е 15+4+9=28 (28%), а на непълнозначната – 14+58=72 (72%).

2.2.3.4. Критерий на Колмогоров-Смирнов

В статистическата лингвистика тази процедура се използва за установяване на съотношението между стойностите на избрани категории в два вариационни реда от по равен брой килолекси при съпоставка на равни по обем ексцерпти. Тук аз ще  я приложа, за да установя отношението два по два вариационни реда между ексцерпти от по три и пет килолекси глаголна, номинална и адективна температура в RZ, ŠM, CPS и LSK.

С Δ max. се отбелязва максималната разлика между стойностите за съответната категория по килолекси в двата съпоставяни вариационни реда. С помощта на λ2 можем да заключим съществена ли е или не разликата между средните стойности за дадена категория в два вариационни реда от по равен брой килолекси. Изчислява се като се раздели Δ2 max. на броя килолекси в редицата, умножени по две, или λ=Δ2max./2n. В лингвостатистиката е установено, че ако λ е по-голямо от 1,84, то е възможно двата съпоставяни ексцерпта да са от различна генерална съвкупност, а ако е по-голямо и от 2,65, то двата съпоставяни ексцерпта със сигурност са от различна генерална съвкупност, или казано по друг начин, принадлежат на различни по тип текстове.

Тъй като RZ ни дава три цели килолекси текст, CPS – пет, ŠM – шест, а LSK двадесет и една, ще съпоставя първо трите килолекси RZ с първите три килолекси CPS, след това пет килолекси текст от ŠM с петте килолекси CPS, а накрая петте килолекси CPS с четрите групи от по пет цели килолекси LSK.

Във вариационна редица от глаголни температури в общо шест килолекси текст, по три от RZ и CPS, Δ max.=3, а λ=32/2×5=9/10=0,9<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо шест килолекси текст, по три от RZ и CPS, Δ max.=1, а λ=12/2×4=1/8=0,125<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо шест килолекси текст, по три от RZ и CPS, Δ max.=3, а λ=32/2×5=9/10=0,9<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от глаголни температури в общо десет килолекси текст, по пет от ŠM и CPS Δ max.=5, а λ=52/2×8=25/16=1,56<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо десет килолекси текст, по пет от ŠM и CPS Δ max.=5, а λ=52/2×9=25/18=1,39<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо десет килолекси текст, по пет от ŠM и CPS Δ max.=4, а λ=42/2×8=16/16=1<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо десет килолекси текст – петте от CPS и първите пет от LSK Δ max.=1, а λ=12/2×6=1/12=0,083<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо десет килолекси текст – петте от CPS и първите пет от LSK Δ max.=2, а λ=22/2×8=4/16=0,25<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от глаголни температури в общо десет килолекси текст – петте от CPS и първите пет от LSK Δ max.=3, а λ=32/2×10=9/20=0,45<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо десет килолекси текст – петте от CPS и вторите пет от LSK Δ max.=3, а λ=32/2×8=9/16=0,56<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо десет килолекси текст – петте от CPS и вторите пет от LSK Δ max.=2, а λ=22/2×7=4/14=0,29<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от глаголни температури в общо десет килолекси текст – петте от CPS и вторите пет от LSK Δ max.=2, а λ=22/2×8=4/16=0,25<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо десет килолекси текст – петте от CPS и третите пет от LSK Δ max.=4, а λ=42/2×6=16/12=1,33<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо десет килолекси текст – петте от CPS и третите пет от LSK Δ max.=2, а λ=22/2×7=4/14=0,29<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от глаголни температури в общо десет килолекси текст – петте от CPS и третите пет от LSK Δ max.=2, а λ=22/2×8=4/16=0,25<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от номинални температури в общо десет килолекси текст – петте от CPS и четвъртите пет от LSK Δ max.=3, а λ=32/2×6=9/12=0,75<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от адективни температури в общо десет килолекси текст – петте от CPS и четвъртите пет от LSK Δ max.=2, а λ=22/2×8=4/16=0,25<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Във вариационна редица от глаголни температури в общо десет килолекси текст – петте от CPS и четвъртите пет от LSK Δ max.=4, а λ=42/2×8=16/16=1<1,84<2,65. Следователно би трябвало двата вариационни реда да са от една генерална съвкупност.

Според направените изчисления по Критерия на Колмогоров-Смирнов показателите на CPS би трябвало да принадлежат към една генерална съвкупност с показателите на RZ, ŠM и с показателите на всички части на LSK.

2.2.3.5. Критерий на Фишер

Когато се съпоставя ексцерпт, състоящ се от проби, които имат статистически инвариант, с друг ексцерпт, състоящ се от проби, които също имат статистически инвариант, но друг, е възможно критерият λ да не регистрира различие, защото е възможно двата ексцерпта да се различават не по средните си аритметични, а по показателите си за разнообразието на вариантите, от които се състоят вариационните редове, т.е. по сигмите си (или по средните квадратични). За да се регистрира това различие съществува критерий, който се нарича Критерий на Фишер. Така ако сме изчислили средните квадратични отклонения на два вариационни реда от една езикова категория и разделим по-голямото на по-малкото, по големината на получената стойност можем да съдим дали двата вариационни реда действително се различават статистически. Ако полученото число е по-малко от 1,69, трябва да се признае наличието на един статистически инвариант за пробите от двата ексцерпта. Ако е по-голямо от 2,11, трябва да се приеме, че разликата между дисперсиите е достатъчно ярка и можем да разглеждаме ексцерптите като принадлежащи на различни от глотометрическо гледище генерални съвкупности (на различни по жанр текстове).

Тук отново ще направя съпоставка между резултатите от изчислението на вече познатите категории в трите килолекси RZ и три килолекси CPS, в петте килолекси CPS и пет килолекси ŠM, в петте килолекси CPS и четирите групи от по пет килолекси LSK.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в RZ е 4,04, 0,58, 1,53. Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в първите три килолекси CPS е 2,08, 2,65, 1,53. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 4,04/2,08=1,94<2,11, нo 1,94>1,69, т.е. по отношение на Критерия на Фишер за глаголните форми двата съпоставяни ексцерпта попадат „в границите на съмнението“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 2,65/0,58=4,57>2,11>1,69, т.е. по отношение на Критерия на Фишер за съществителните имена двата съпоставяни ексцерпта „нямат общ статистически инвариант“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 1,53/1,53=1<1,69, т.е. по отношение на Критерия на Фишер за прилагателните имена двата съпоставяни ексцерпта „имат общ статистически инвариант“.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в пет килолекси ŠM е: 1,73, 5,18, 2,51. Средното квадратично отклонение за тези категории в петте килолекси CPS е: 3,21, 2,61, 2,39. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 3,21/1,73=1,86>1,69, но 1,86<2,11, т.е. по отношение на Критерия на Фишер за глаголните форми двата съпоставяни ексцерпта попадат „в границите на съмнението“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 5,18/2,61=1,98>1,69, но 1,98<2,11, т.е. по отношение на Критерия на Фишер за съществителните имена двата съпоставяни ексцерпта попадат „в границите на съмнението“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 2,51/2,39=1,05<1,69<2,11, т.е. по отношение на Критерия на Фишер за прилагателните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в първите пет килолекси LSK е: 6,04, 3,78, 3,29. Средното квадратично отклонение за тези категории в петте килолекси CPS е: 3,21, 2,61, 2,39. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 6,04/3,21=1,88>1,69, но 1,88<2,11, т.е. по отношение на Критерия на Фишер за глаголните форми двата съпоставяни ексцерпта попадат „в границите на съмнението“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 3,78/2,61=1,45<1,69<2,11, т.е. по отношение на Критерия на Фишер за съществителните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 3,27/2,39=1,37<1,69<2,11, т.е. по отношение на Критерия на Фишер за прилагагателните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена във вторите пет килолекси LSK е: 4,44, 6,22, 2,3. Средното квадратично отклонение за тези категории в петте килолекси CPS е: 3,21, 2,61, 2,39. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 4,44/3,21=1,38<1,69<2,11, т.е. по отношение на Критерия на Фишер за глаголните форми би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 6,22/2,61=2,38>2,11>1,69, т.е. по отношение на Критерия на Фишер за съществителните имена не би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 2,39/2,3=1,04<1,69<2,11, т.е. по отношение на Критерия на Фишер за прилагателните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в третите пет килолекси LSK е: 4,04, 5,17, 1,87. Средното квадратично отклонение за тези категории в петте килолекси CPS е: 3,21, 2,61, 2,39. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 4,04/3,21=1,26<1,69<2,11, т.е. по отношение на Критерия на Фишер за глаголните форми би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 5,17/2,61=1,98>1,69, но 1,98<2,11, т.е. по отношение на Критерия на Фишер за съществителните имена двата съпоставяни ексцерпта попадат „в границите на съмнението“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 2,39/1,87=1,28<1,69<2,11, т.е. по отношение на Критерия на Фишер за прилагателните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“.

Средното квадратично отклонение за вариационните редове глаголни форми, съществителни имена и прилагателни имена в четвъртите пет килолекси LSK е: 1,14, 1,73, 3,11. Средното квадратично отклонение за тези категории в петте килолекси CPS е: 3,21, 2,61, 2,39. Стойността на Критерия на Фишер за глаголните форми в съпоставяните ексцерпти е 3,21/1,14=2,82>2,11>1,69, т.е. по отношение на Критерия на Фишер за глаголните форми не би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за съществителните имена в съпоставяните ексцерпти е 2,61/1,73=1,51<1,69<2,11, т.е. по отношение на Критерия на Фишер за съществителните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“. Стойността на Критерия на Фишер за прилагателните имена в съпоставяните ексцерпти е 3,11/2,39=1,3<1,69<2,11, т.е. по отношение на Критерия на Фишер за прилагателните имена би трябвало двата съпоставяни ексцерпта „да имат общ статистически инвариант“.

Въз основа на направените изчисления по Критерия на Фишер можем да обобщим, че наличието на общ статистически инвариант между CPS и RZ  е „в границите на съмнението“ – с по една категория има, няма или е „в границите на съмнението“. Наличието на общ статистически инвариант между CPS и ŠM е „в границите на съмнението“ – по две категории е „в границите на съмнението“, а по една „има общ статистически инвариант“. CPS по-скоро „има общ статистически инвариант“ с LSK – два пъти е в „границите на съмнението“, осем пъти „има общ статистически инвариант“, а два пъти – няма.

Прави впечатление, че колкото по-големи по обем стават паметниците, с които се съпоставя, толкова по-вероятно е някоя от съпоставките да влезе „в границите на съмнението“ или дори „да има общ статистически инвариант“ със CPS. Докато за RZ само един от случаите не показва наличие на „общ статистически инвариант“ със CPS, за ŠM също само един, а останалите два са „в границите на съмнението“, то при LSK има цели осем случая, които показват наличието на общ статистически инвариант, а това показва, че резултатите важат преди всичко за съпоставяните ексцерпти, но също така, че е възможно да се влияят и от обема на съпоставяните паметници, а в по малка степен и то жанра, особено като се има предвид, че някои от разгледаните текстове проявяват особености, характерни за повече от един средновековен жанр.

  1. Заключение

В настоящото изследване бяха представени данните от глотометричния анализ на едно от най-ранните известни засега средновековни хърватски произведения, писани на народен език и записани с латински букви, известно като Cantilena pro sabatho. Направените изчисления биха могли да послужат за сравнения и съпоставки с резултатите от подобни проучвания върху други средновековни хърватски произведения от същия период.

 

 

Библиография

 

Davidov 1996: Davidov, A. Izpolzvane na statisticheskite   metodi v leksikolozhkite izsledvania. – V: Starobalgarska leksikologia (red. A. Davidov). Veliko Tarnovo: „Abagar“, 1996, 28-43. [Давидов 1996: Давидов, А. Използване на статистическите методи в лексиколожките изследвания. – В: Старобългарска лексикология (ред. А Давидов). Велико Търново: „Абагар“, 1996, 28-43.]

Damjanović, Kuzmić, Mihaljević, Žagar 2009: Damjanović, Kuzmić, Mihaljević, Žagar, Cantilena pro sabatho. – Povijest hrvatskoga jezika. Srednji vijek, 1, 533.

Ilieva 2011: Ilieva, T. Leksikata v Ioan-Ekzarhovia prevod na Bogoslovieto – kolichestveni pokazateli. – Starobalgaristika, 35/2, 14-37. [Илиева 2011: Илиева, Т. Лексиката в Йоан-Екзарховия превод на Богословието – количествени показатели. – Старобългаристика, 35/2, 14-37.]

Ilieva 2013: Ilieva, T. Leksikata v tvorchestvoto na Petar Chernorizets – glotometrichen profil. – Ezik i literatura 1-2/2013, 72-86. [Илиева 2013: Илиева, Т. Лексиката в творчеството на Петър Черноризец – глотометричен профил. – Език и литература 1-2/2013, 72-86.]

Stefanov 2012: Stefanov, S., Naslednici na yatovata glasna v edin chakavski tekst na zhitieto na sv. Ekaterina ot XV v. – Littera et Lingua, Zima, 2012. [Стефанов 2012: Стефанов, С. Наследници на ятовата гласна в един чакавски текст на житието на св. Екатерина от XV в. – Littera et Lingua, Зима, 2012 http://slav.uni-sofia.bg/naum/lilijournal/2012/4].

Stefanov 2013: Stefanov, S., Nablyudeniya varhu ezika na zhitie na sv. Ekaterina v harvatskata knizhnina ot XV v. – Starobalgarska literatura, kn. 47, 174-185. [Стефанов 2013: Стефанов, С. Наблюдения върху езика на житие на св. Екатерина в хърватската книжнина от XVв. – Старобългарска литература, кн. 47, 174-185.]

Stefanov 2014a: Stefanov, S. Varhu izokolnite strukturi v zhitie na sv. Ekaterina ot XV v na naroden harvatski ezik: – Godishnik na Sofiyskiya universitet „Sv. Kliment Ohridski“, Tom 99, 143-169 ISSN 1314-9989 [Стефанов 2014а: Стефанов, С. Върху изоколните структури в житие на св. Екатерина от XV в. на народен хърватски език. – Годишник на Софийския Университет „Св. Климент Охридскиi“, том 99, 143-169 ISSN 1314-9989.] http://digilib.nalis.bg/dspviewerb/srv/viewer/bul/28b7826e-50a0-4d05-a02f-b1688956c161?tk=KLeCblCgTQWgL7FoiVbBYQAAAABh6msb.unMM-vcrLa-g1riiC-Rsbw&citation_url=/xmlui/handle/nls/3385)

Stefanov 2014b: Stefanov, S. O stihe v srednevekovnom zhitii sv. Ekaterina na narodnom hrvatskom yazyke. – V: Roly molodezhi v procese ustoychivogo civilizacionnogo razvitiya. V. Slavyanskiy mir: aspekt istorii i kulturi (Sbornik tezisov dvuh Mezhdunarodnyh molodezhkih mezhdisciplinarnih slavisticheskih konferenciy 28.05.2014), I. I. Kalliganov (red.), Moskva: Izdatelystvo RAN, 2014, 40-44. [Стефанов 2014б: Стефанов, С. О стихе в средневековном житии св. Екатерины на народном хорватском языке. – В: Роль славянской молодёжи в процессе устойчивого цивилизационного развития. V. Славянский мир: аспекты истории и культуры (Сборник тезисов двух Международныхмолодёжких междисциплинарных славистических конференций 28.05.2014), И. И. Каллиганов (ред.), Москва: Издательство РАН, 2014, 40-44.]

Stefanov 2015a: Stefanov, S. Stilistichni pozvati za sazdavane na ritam v srednovekovno zhitie na sv. Ekaterina na naroden harvatski ezik – V: Dvizhenie i prostranstvo v slavyanskite ezici, literaturi i kulturi“ (Sbornik s dokladi ot Dvanadesetite mezhdunarodni slavistichni cheteniya 09-10.05.2014 г.), M. Mladenova (red.), Veliko Tarnovo: Izdatelstvo „Faber“, 2015, 46-53. [Стефанов 2015а: Стефанов, С. Стилистични похвати за създаване на ритъм в средновековно житие на св. Екатерина на народен хърватски език. – В: Движение и пространство в славянските езици, литератури и култури (Сборник с доклади от Дванадесетите международни славистични четения 09-10.05.2014 г.), М. Младенова (ред.), Велико Търново: Издателство „Фабер“, 2015, 46-53.]

Stefanov 2015b: Stefanov, S. Leksika i stil v srednovekovno zhitie na sv. Ekaterina na narodne hrvatski ezik. – Littera et Lingua, Prolet-Lyato, 2015. [Стефанов 2015б: Стефанов, С. Лексика и стил в средновековно житие на св. Екатерина на народен хърватски език. – Littera et Lingua, Пролет-Лято, 2015 http://slav.uni-sofia.bg/naum/lilijournal/2015/12/1-2/].

Stefanov 2015v: Stefanov, S. Za stilistichnite foguri i kontaktnite sinonimi v tri zhitiini teksta za sveta Ekaterina na naroden harvatski ezik ot XIV-XVII v. – Godishnik na Sofiyskiya universitet „Sv. Kliment Ohridski“, Tom 100, 245-286. ISSN 1314-9989. [Стефанов 2015в: Стефанов, С. За стилистичните фигури и контактните синоними в три житийни текста за св. Екатерина на народен хърватски език от XIV-XV II в. – Годишник на Софийския Университет „Св. Климент Охридски“, том 100, 245-286 ISSN 1314-9989 http://digilib.nalis.bg/dspviewerb/srv/viewer/bul/06d9e899-1411-4245-a7a0-21337d0c09d4?tk=BtnomRQRQkWnoCEzfQwJ1AAAAABh6mOD.Q5SgBl2S0jW9xGIiOVFnAg&citation_url=/xmlui/handle/nls/24837].

Stefanov 2016: Stefanov, S. Refleksi na yatovata glasna v zhitie na sv. Ekaterina, pisano na naroden harvatski ezik ot perioda XIV-XV v.: – Filologicheski Forum, 1 (3), 2 (2016), 21-31 ISSN 2367-8119. [Стефанов 2016: Стефанов, С. Рефлекси на ятовата гласна в житие на св. Екатерина, писано на народен хърватски език от периода XIV-XV в. – Филологически форум, 1 (3), 2 (2016), 21-31. ISSN 2367-8119 https://philol-forum.uni-sofia.bg/portfolio-item/br-3/].

Stefanov 2017a: Stefanov, S. Tekstove za sv. Ekaterina v harvatskata knizhnina XIV/XVIII v. – Godishnik na Sofiyskiya universitet „Sv. Kliment Ohridskii“, Tom 101, 155-172 ISSN 1314-9989. [Стефанов 2017а: Стефанов, С. Текстове за св. Екатерина в хърватската книжнина XIV-XVIII в. – Годишник на Софийския Университет „Св. Климент Охридски“, том 101, 155-172 ISSN 1314-9989 http://digilib.nalis.bg/dspviewerb/srv/viewer/bul/6933a617-8370-4b3e-8a95-76eb8022c18a?tk=aTOmF4NwSz6KlXbrgCLBigAAAABh6mH7.oHGT-KPCaJH96S0mii1sDA&citation_url=/xmlui/handle/nls/24853].

Stefanov 2017b: Stefanov, S. Refleksi na erovata glasna I na srichkotvornoto ṛ i ḷ v chakavski tekst na zhitieto na sv. Ekaterina, pisan na naroden harvatski ezik ot perioda XIV-XV v. – V: Multikulturalizam I mnogoezichie. (Sbornik s dokladi ot Trinadesetite mezhdunarodni slavistichni cheteniya 21-23.04.2016 g.), M. Stefanov, P. Martinova, D. Grigorov (sast.), Veliko Tarnovo: Izdatelstvo „Faber“, 2017, 123-133 ISBN 978-619-00-0646-6. [Стефанов 2017б: Стефанов, С. Рефлекси на еровата гласна и на сричкотворното ṛ и ḷ в чакавски текст на житието на св. Екатерина, писан на народен хърватски език от периода XIV-XV в. – В: Мултикултурализъм и многоезичие. (Сборник с доклади от Тринадесетите международни славистични четения 21-23.04.2016 г.), М. Стефанов, П. Мартинова, Д. Григоров (съст.), Велико Търново: Издателство „Фабер“, 2017, 123-133 ISBN 978-619-00-0646-6.]

Stefanov 2018a: Stefanov, S. Leksikata v Legenda sv. Katarine divice: Glotometrichen analiz. – Dzyalo, god. VI, 2018, br. 12. [Стефанов 2018a: Стефанов, С. Лексиката в Legenda sv. Katarine divice: Глотометричен анализ. – Дзяло, год. VI, 2018, бр. 12 http://www.abcdar.com/magazine/XII/Stefanov_1314-9067_XII.pdf http://www.abcdar.com/magazine_XII.php].

Stefanov 2018b: Stefanov, S. Leksikata v Shibenska molitva: Glotometrichen analiz. – Ezik i literatura, 3-4/2018, 195-208 pISSN 0324–1270, eISSN2535-1036. [Стефанов 2018б: Стефанов, С. Лексиката в Šibenska molitva: Глотометричен анализ. – Език и литература, 3-4/2018, 195-208 pISSN 0324–1270, eISSN2535-1036 http://www.ezik-i-literatura.eu/2018/3-4/15-EiL_3_4_2018_Simeon_Stefanov.pdf].

Stefanov 2018v: Stefanov, S. Leksikata v Red i zakon zadarskih dominikanki: Glotometrichen analiz. – V: Stereotipat v slavyanskite ezici, literature i kulturi. (Sbornik s dokladi ot Chetirinadesetite mezhdunarodni slavistichni cheteniya, Sofiya, 26-28.04.2018 g.), Cv. Avramova, D. Ivanova, R. Stefcheva (sast.). Sofiya: Universitetsko izdatelstvo „Sv. Kliment Ohridski“, 2018, 493-506 ISBN 978-954-07-4883-2. [Стефанов 2018в: Стефанов, С. Лексиката в Red i zakon zadarskih dominikanki: Глотометричен анализ. – В: Стереотипът в славянските езици, литератури и култури. (Сборник с доклади от Четиринадесетите международни славистични четения София 26-28.04.2018 г.), Цв. Аврамова, Д. Иванова, Р. Стефчева (съст.). София: Университетско издателство „Св. Климент Охридски“, 2018, 493-506 ISBN 978-954-07-4883-2.]

Stefanov 2019: Stefanov, S. Varhu leksikata v zhitie na sv. Ekaterina, pisano na naroden harvatski ezik ot perioda XIV-XV v. – V: Klimentovi cheteniya za mladi izsledovateli. (Sbornik s dokladi ot ednoimennata konferenciya). D. Atanasova, M. A. Vaptsarova (red.). Sofiya: Universitetsko izdatelstvo „Sv. Kliment Ohridski“, 2019, 164-178 ISBN 2603-4425. [Стефанов 2018в: Стефанов, С. Върху лексиката в житие на св. Екатерина, писано на народен хърватски език от периода XIV-XV в. – В: Климентови четения за млади изследователи. (Сборник с доклади от едноименната конференция). Д. Атанасова, М. А. Вапцарова (ред.). София: Университетско издателство „Св. Климент Охридски“, 2019, 164-178 ISBN 2603-4425.]

Stefanov 2020: Stefanov, S., Tekstove v harvatskata knizhnina XIV-XV v.: Glotometrichen analiz. – Dzyalo, god. XVIII, 2020, br. 8. [Стефанов 2020: Стефанов, С., Текстове в хърватската книжнина XIV-XV в.: Глотометричен анализ. – Дзяло, год. XVIII, 2020, бр. 8 http://www.abcdar.com/magazine/XVIII/Dzl_2020_br18_09_Simeon_Stefanov_Leksikata_v_Hurvatia_XIV-XV_vek.pdf

http://www.abcdar.com/magazine_XVIII.php].

Fališevac 1978: Fališevac, D. Razdoblja i književne vrste hrvatske srednjovjekovne proze (o problemu periodizacije i klasifikacije). – Filologija, 8, 89-98.

Frumkina 1964: Frumkina, R. M. Statisticheskye metody izucheniya leksiki. Moskva: „Nauka“, 1964. [Фрумкина 1964: Фрумкина, Р. М. Статистические методы изучения лексики. Москва: „Наука“, 1964.]

Hadrovics 1984: Hadrovics, L. Cantilena pro sabatho. – Filologija, 12, 7-25.

Hercigonja 1973: Hercigonja, E. Hrvatska književnost srednjega vijeka (do kraja 14. stoljeća). – В: Zbornik Zagrebačke slavističke škole. Franjo Grčević, Mladen Kuzmanović (ur.). Zagreb: Filozofski fakultet sveučilišta u Zagrebu, 1973, 22-66.

Hercigonja 1975: Hercigonja, Е., Srednjovjekovna književnost. Zagreb: „Liber-Mladost“. 1975.

Hristova 1994: Hristova, I. Rechnik na slovata na Kliment Ohridski. Sofia: Universitetsko izdatelstvo „Sv. Kliment Ohridski“, 1994. [Христова 1994: Христова, И. Речник на словата на Климент Охридски. София: Университетско издателство „Св. Климент Охридски“, 1994.]

Yanakiev 1977: Yanakiev, M. Stilistikata i ezikovoto obuchenie. Sofia: Darzhavno izdatelstvo „Narodna prosveta“, 1977. [Янакиев 1977: Янакиев, М. Стилистиката и езиковото обучение. София: Държавно издателство „Народна просвета“, 1977.]

 

Симеон Стефанов е доктор по филология, главен асистент в Института за български език при БАН. Основните му научни интереси са в областта на историята на южнославянските (книжовни) езици, медиевистиката, славистиката, етимологията.

 

[1] В пълнозначната лексика в разглеждания текст влизат съществителни имена, прилагателни имена и глаголи, а в служебната – местоимения, местоименни наречия, съюзи, предлози, частици, междуметия.

[2] В съвременната българска поезия, където този индекс е най-малък, той се движи около 3; в журналистиката – 4,1, а в научната литература – 6,2 (Davidov 1996: 38, Ilieva 2013: 76). В съчинения от старобългарската литература този показател е: в съчиненията на Петър Черноризец – 5,15, в химнографията на Климент Охридски – 6,9, в словата на Климент Охридски – 7,07, в творчеството на Презвитер Козма – 7,48, в творчеството на Черноризец Храбър – 4,07, в Повесть временных лет – 10 (Ilieva 2013: 76). Причината за толкова висок индекс на повторяемост изобщо в произведенията от старата (българска) литература е честата употреба на служебни думи и абстрактна лексика за фундаментални мирогледни понятия (Davidov 1996: 38, Ilieva 2013: 76).