Новите генетични кодове - с български имена

Новите генетични кодове - с български имена

© Мила Янева - Табакова



ekont

13 ноември 2050 година


Не е ли странно, че дори днес, в 2050 година, българският език продължава да бъде един от малкото без TD ("talking dictionaries"). В този случай "без" е равно на "плюс". Понякога "малко" е "повече". Защото развитието на TD-архив е знак, че езикът е попаднал в Червената книга на застрашените от изчезване езици, наречия и диалектни клъстери.


TD-архивите са структурирани бази от данни. Запълват ги ботове. Самообучаващата се матрица записва езиковото богатство, застрашено от изчезване. Проектът е на Европейската централа за книжовно знание (борсов код EUCLAL) и за последните пет години прилагането му се превърна в стандарт за цялата територия на Съюза.




Ако във второто десетилетие на века колите на Гугъл обикаляха континента, за да заснемат архиви за революционното Street View, следващата крачка се реализира от смесено финансирани хъбове - мултинационални проекти, създадени и управлявани по нов модел. Такава е и Европейската централа за книжовно знание, която финансира изграждането на TD-архивите. Неслучайно посочваме борсовия код на централата - повече от половината от акциите й са собственост на индивидуални инвеститори.


Децентрализирането на подобни институции и достъпът им до борсова капитализация цялостно промени финансирането на публично значимите проекти. Въпреки че в началото имаше скептичните прогнози (през февруари 2046-а беше първата емисия на подобни акции и облигации на фондовата борса), но само за година публичното дружество се откъсна от зависимостта си от централни фондове. Днес то е с ръст на приходите и няма нужда от донорската зависимост към Еврофин, а някои собственици на портфейли в компанията са се насочили към него единствено с цел борсова печалба. Но над 75% от инвеститорите са с нано-участие и приемат риска на този вид инвестиция с различен, съвсем осъзнат мотив: и това е културен сентимент към собствените им, застрашени от глобализацията езици.


Всеки евроцент, вложен в акции на Европейската централа за книжовно знание рано или късно ще се превърне в дигитално съхранена езикова памет.


TD-архивите натрупват внушителни количества от т.н. консервационен звук - думи, изрази, диалектни версии. За ломбардския, например - един език, прагово застрашен от изчезване - специализираният архив има натрупани над 20 000 фонологеми. От тях поне една четвърт са записани при носители на някое от наречията на ломбардски в Санта Катарина, в Бразилия.


Случаят с българския - един резултат, с който можем да се похвалим: Популярната платформа LinguiFace продължава да държи нашия език извън критичната зона на езици и диалекти в опасност от фонологемно изчезване и морфологична дисоциация на речниковия масив. Определени черти на лингвистичната структура са помогнали, без съмнение. Основната причина обаче е в дейността на един отличен вече и с Нобелова награда екип. Става дума за учените от Геномния проект и за доминиращото родно участие там.


Института за изследване на ДНК-структури "CAPP" с централа в Берн провежда т.н. дълбоко сканиране на ДНК. При този процес се ускорява ефективният анализ и търсене на първичната структура на всяка ДНК-вариация. Прототипите на всички молекулярни находки (засега над 300 милиона) се записват в иновативната система. В нея всички дълги секвенции се пренасят към живи лексикални форми. Така безкрайните и сложни "зашифровани" съчетания от имената на нуклеотидите (A/C/G/T) се превръщат в нещо по-произносимо. И в случая, тъй като ядрото на проекта е съставено от български учени (Данаил Славчев, Биляна Фол, Христо Маламиров и Лиана Иванова), те са прибегнали до родния си език.


За да се развива, всяка жива клетка в природата получава "указание" как да създаде специфичен протеин. Ако първите букви на нуклеотидите са нещо като азбука на ДНК-кода, тогава всеки ген трябва да комбинира четирите основни елемента по различни начини (все едно иска "да изпише" трибуквени "думи").


Тук влизат в действие над 30 български уникални звукови съчетания (без фонемно повторение в други езици) и техните повече от 700 производни. Фонетичните разновидности се използват за постигане на специфична благозвучност, лесна за усвояване и от хора, които не са носители на езика. По този начин специалисти в ДНК-секвенирането от три континента използват в ежедневната си работа български словоформени гнезда. Много удобни се оказват книжовните дублети като "мях"/"мех", "желъд"/"жълъд" или фонетични дублети напр. "вляга", "изляга", "слага". Чрез тях се назовават и индексират много удобно вариациите на протеиновия състав в структурната биология.


В София беше създадена Академията "Златоуст", симбиотичен проект на "CAPP", Новата българска библиотека и Министерството на културните ресурси. Публикуването на Годишник с уникални фонемни единици (трето издание) предстои в края на месеца. Изданието ще обобщи натрупаните през годината нови словоформи. Системата е изградена изцяло върху български морфеми, алофони, глосеми и синтактеми.


Накратко - никаква опасност не грози българския език и той със сигурност няма да бъде един от 7000 езика, който постепенно ще изчезват до настъпването на 2100 година (каквито тревожни данни напоследък публикува Асоциацията за научен напредък).


Илюстрация към текста - Мила Янева - Табакова


Всичко, което трябва да знаете за:

Ключови думи към статията:

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK