Проучване: Поне 21 европейски езика са застрашени от дигитална смърт

За български категорията със слаба оценка е автоматичният превод.

© Красимир Юскеселиев

За български категорията със слаба оценка е автоматичният превод.



Европейски експерти в областта на езиковите технологии предупредиха в ново изследване, че шансът на много от европейските езици да оцелеят в дигиталната епоха не е голям, предаде Многоезиковата европейска технологична асоциация (META).


След оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа, експертите стигнаха до извода, че езиковите технологии за 21 от 30-те изследвани езика или "са недоразвити", или са "слабо развити". Изследването е проведено от Европейската мрежа за върхови постижения META-NET.


Проучването включва оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.




В поне една от тези категории 21 от 30-те езика получават най-ниската оценка. За тях липсват езикови технологии или съществуващите са недоразвити, като за български категорията със слаба оценка е автоматичният превод. Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.



Под езикови технологии най-общо се разбира софтуер, който може да обработва говорима и писмена човешка реч.

Състоянието на наличните езикови ресурси и технологии не е оценено като "отлично" за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като "средно развити".


Технологиите и ресурсите за езици като баски, български, каталунски, гръцки, унгарски и полски са категоризирани като "фрагментарно развити", което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.


Тоест за момента българският език, получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси, не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици.


"По-голямата част от европейските езици не разполагат с достатъчно количество адекватни ресурси, които да гарантират оцеляването им в епохата на развити технологии, а при някои езици дори нуждата от такива ресурси не е била осъзната. Поради тази причина и бъдещето на много от европейските езици е неясно", казва професор Ханс Уцкорайт, координатор на инициативата META-NET и един от авторите и редакторите на изследването.


"Пропастта между т. нар. големи и малки езици продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт", коментира друг от редакторите - Георг Рем.

Ключови думи към статията:

Коментари (32)
  1. Подредба: Сортирай
  1. 1 Профил на АзКлавдия
    АзКлавдия
    Рейтинг: 3873 Неутрално

    Адекватна технологична подкрепа... ами хайде, де!

    Доброто е заразно
  2. 2 Профил на hodounski
    hodounski
    Рейтинг: 3092 Неутрално

    Рано или късно ще отпаднат езиците,които се говорят от малки групи.Ще пребъде китайският.

  3. 3 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    Определено български е най-неразвитият език за компютърно говорене.

  4. 4 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#2] от "hodounski":

    Китайците се разбират помежду си със субтитри

  5. 5 Профил на gallnare
    gallnare
    Рейтинг: 1605 Любопитно

    Трудно ще отмрат езици с държава зад гърба си, но пък какви добри субсидии дават, за да "докажеш" противното!

    Българският е в компанията на каталунски и баски и ако има положителна дискриминация на европейски езици, то тя е на последните два. Особено по отношение на каталунския нека не си кривят душата авторите на студията - езикови технологии да иска човек! Е, ако решат да се откачат от вимето на испанската държава, може и да са ощетени...

  6. 6 Профил на Fazer
    Fazer
    Рейтинг: 531 Неутрално

    Някой да е пробвал преводи от финландски? Гарантирам, че дори към английски резултатите са плачевни.

    Такива проучвания звучат, като "ако не си направите езика по-лесен/модерен [вкарате повече чуждици], сте обречени на изчезване". Технологиите в автоматичните преводи наваксват страшно бързо, дори с разни индийски диалекти.
    Правенето на подобни прибързани заключения, че езици не могат да оцелеят са абсурдни и крайно обидни за страните с ниски оценки.

  7. 7 Профил на elevation04
    elevation04
    Рейтинг: 660 Весело

    Българският език е заплашен най -вече от орляците кукумещи личности нахлули във всички институции на управление и средства за масово осведомяване !

  8. 8 Профил на BIG AL
    BIG AL
    Рейтинг: 1466 Весело

    Верно е ...
    И софийският вече НЕ се чува в ..София ..))
    Много герб кадри надойдоха ...))

    BIG AL
  9. 9 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#6] от "Fazer":

    От фински преводите са трудни щото има твърде различна структура от английския, за да не кажа точно обратната.

  10. 10 Профил на Съни
    Съни
    Рейтинг: 531 Любопитно

    Очакваше се при това бързо развитие на технологиите.

  11. 11 Профил на Марин
    Марин
    Рейтинг: 531 Неутрално

    Много сме си добре с кирилицата, няма никакви проблеми.
    Дори наскоро Гугъл направиха разпознаване на глас при търсене, т.е. можеш да кажеш на глас нещо и Гугъл ти го разпознава и го написва в полето за търсене. Предполагам, че ще развият тази технология не само за търсене, но и за писане на документи чрез говор

    ... потим ... не за славата ... създава изкуство!
  12. 12 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    Български може да отмре само поради простотията на говорещите го, които се чудят на какви да се направят, само и само да не са българи. Пример - етикетите на латиница дори и по киселото мляко и обикновените бисквити вече, да не говорим за бира, вино, минерална вода, мобилни оператори, телевизии, радия , повечето списания ...
    Оня ден трябваше да пратя кутия български бонбони на колеги в Австрия, няма брате нито едни с етикет на български .... Даже евтиняците по 2 лева са на латиница...

  13. 13 Профил на charlesdegaulle
    charlesdegaulle
    Рейтинг: 1341 Неутрално

    Оценката се прави по 4 категорий:
    - автоматичен превод
    - обработка и синтез на реч
    - анализ на текст
    - общо състояние на езиковите ресурси
    Въпроса е колко пари се или ще се отделят за разработка на специфичен за езика софтуер по първите три! Език дето се говори в една, две или три държави и то бедни, просто няма дигитално бъдеще, ще отмре в тази среда естествено.

  14. 14 Профил на Fazer
    Fazer
    Рейтинг: 531 Неутрално

    До коментар [#9] от "Alpheratz":

    Уча фински от известно време, също живея във Финландия. Коментарът ми беше реторичен, понеже фински не фигурираше в статията.

    Напълно правилно обаче спомена в следващия си коментар:
    [quote#12:"Alpheratz"]Български може да отмре само поради простотията на говорещите го, които се чудят на какви да се направят, само и само да не са българи.[/quote]

    Грамотността на младите в България е нещо трагично.

  15. 15 Профил на Федор Езерский
    Федор Езерский
    Рейтинг: 993 Неутрално

    [quote#3:"Alpheratz"]Определен български е най-неразвитият език за компютърно говорене. [/quote]

    Глупости! Българският даже добре е развит, спрямо други езици. Като вземеш предвид, че един от най-качествените продукти за компютърно говорене е гръцки, какво да кажем...
    http://www.innoetics.com/index.php?option=com_content&view=article&id=149&Itemid=288&;lang=en

  16. 16 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#14] от "Fazer":

    Hyvä
    Грамотността на младите е функция на грамотността на старите, няма как ей тъй младите да станат грамотни, ако старите са неграмотни. Това е процес, но "враг №1" е чалгата и трябва да бъде изкоренена Съвсе Бойко Борисовците и Цвъкитата, Азисовциге, Преславите, Битивитата и Новите им телевизии.

  17. 17 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#15] от "Федор Венедиктович Езерский":

    Хм, не знам, гръцки ми се вижда доста развит език. Има доста речници, доста "инструменти", ние нямаме (а вече няма и нужда поне от класическия) цялостен речник на българския език

  18. 18 Профил на sir_matt
    sir_matt
    Рейтинг: 508 Неутрално

    До коментар [#13] от "charlesdegaulle":

    категорий?! Не се изказвай повече по такива теми - обиждаш всички ни.

    "Me and Jimmy... we're men of grass, and boots, and beauty. "
  19. 19 Профил на Федор Езерский
    Федор Езерский
    Рейтинг: 993 Неутрално

    До коментар [#17] от "Alpheratz":

    Дей... че обърках страничката... Този продукт имах предвид
    http://www.innoetics.com/index.php?option=com_virtuemart&page=shop.browse&category_id=8&Itemid=298&lang=en

    Ами просто... това гръцкото съм го пробвал... дори се лигавих да го пусна да ми чете субтитрите докато гледам филмче, че да си припомня VHS ерата на пиратските "екшън-барети" от кварталната библиотека
    Иначе сериозно - тази гръцка играчка е най-качественият български машинен глас, на който съм попадал, другият... "Гергана" ли беше, който се разпространява от Съюза на слепите, си е дървена история отвсякъде...

  20. 20 Профил на Федор Езерский
    Федор Езерский
    Рейтинг: 993 Неутрално

    [quote#17:"Alpheratz"]Хм, не знам, гръцки ми се вижда доста развит език.[/quote]

    А за развитостта.... какво да кажа... пропилени едни 20 години. Но то къде ли не е пропиляно... Просто през 80-те е била държавна политика електрониката, там приказките Милко Балев бла бла, ДЗУ, Изот, Правец и т.н. и т.н., а вече през 90-те... е ясно...

  21. 21 Профил на Федор Езерский
    Федор Езерский
    Рейтинг: 993 Неутрално

    [quote#19:"Федор Венедиктович Езерский"] че да си припомня VHS ерата на пиратските "екшън-барети" от кварталната библиотека[/quote]

    Ама, че ги пиша... разбира се, че видеотека имах предвид

  22. 22 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#19] от "Федор Венедиктович Езерский":

    До коментар [#20] от "Федор Венедиктович Езерский":

    Хубаво да се знае за първия линк!
    Да! за втория.
    Трето, това с трудното приспособяване е проблем в цяла източна Европа, но горе долу всички полагат поне някакви усилия да се справят. Словенците например измислят по 20-тина нови думи на година, естествено, повечето никога не се използват, но някои (пример по темата на статията - "преносник" за лаптоп) се използват.
    Четвърто, ИБЕ към БАН е институция, но тя е в полуразпад към момента. Факт е как оня пинокио (Николай Василев) успя да ги пребори за транскрипцията на латиница, и да си наложи както той я вижда, без да го интересува нищо.
    Но може някой ден да се събудят, да се отърсят от либерастията, а дори и да започнат нещо да правят. Защото на български НЕ МОЖЕ да се говори всичко и всякак, защото не е хубаво и ни дразни (ако други народи не ги дразни, всеки българин обръща внимание на речта, поне на отсрещните, ако не на своята ).

  23. 23 Профил на αлферац
    αлферац
    Рейтинг: 646 Неутрално

    До коментар [#13] от "charlesdegaulle":

    категорий

  24. 24 Профил на dark'star
    dark'star
    Рейтинг: 2649 Неутрално

    Преди десетина години написах една статийка "съдбата на малките езици в дигиталния свят" ... Накратко : Периодично се извършва дигитален геноцид и унищожение на културата ни. Кодовата таблица на Правц-8 не съответсва на MIK-16 за Правец-16 и всичко написано отива в небитието. Кодовата таблица на Уиндос ср-1251 не съответства на MIK-16 за Правец-16 и всичко написано отива в небитието. Сега се преминава на UTF-8 и Уникод и и всичко написано отива в небитието. За това държа всичко на латиница!!! Гадно е за кирилицата, но спасението е в първите 128 символа =латиница!

    КОНТРА_ТРОЛ_ БАН_ХАКЕР от ПОЕТИЧЕСКИЯ фланг на НАТО
  25. 25 Профил на dark'star
    dark'star
    Рейтинг: 2649 Неутрално

    [quote#12:"Alpheratz"]Пример - етикетите на латиница[/quote]Младото поколение масово пише на латиница - то по най-неграмотния начин. Латинизацията на министър Ники е перфектна за англоговорящ чужденец, който да прочете име на селище, но е неприложима за българи (няма буква "Ъ" и "ь"и никой вменяем няма да напише "ц" с "тс" и няма алгоритъм за двупосочна транслитерация. Необходим е единен, еднозначен и обратим начин за писане на латиница, за да не се чудим как да си сричаме йероглифите един други му и всеки да си ползва своя латинизация. Методица или Чатерица2 = това е въпросът неизбежен!

    КОНТРА_ТРОЛ_ БАН_ХАКЕР от ПОЕТИЧЕСКИЯ фланг на НАТО
  26. 26 Профил на 8th_ball
    8th_ball
    Рейтинг: 1323 Неутрално

    [quote#24:"bay Tan"]всичко написано отива в небитието[/quote]

    Не е вярно. Има не един инструмент да дешифриране на написаното, пък и много от текстовите процесори поддържат всякакви стари и екзотични кодировки. Само трябва да им ги посочиш, ако сами не могат да си ги разпознаят. Лично аз с подобен проблем за първи и последен път се сблъсках поне преди 15 години, съответно проблемът беше решен бързо.

  27. 27 Профил на Дон Кихот
    Дон Кихот
    Рейтинг: 2704 Неутрално

    При всяка по-значима техническа или технологична революция, част от старите атрибути на битието са ставали нейна жертва. Малка част от тях са успявали да възкръснат, преди всичко благодарение на упорити ентусиасти, които в някои случаи заради странните си занимания са били смятани за чудаци. Доколкото езиците са идентификатор и страж на идентичността на народите, трябва обезателно да се намерят достатъчно такива ентусиасти, които да се заемат със спасяването им! Не може да няма решение, просто трябва упорито да се търси, докато не бъде намерено!

  28. 28 Профил на dark'star
    dark'star
    Рейтинг: 2649 Неутрално

    [quote#26:"8th_ball"]Не е вярно. [/quote]Абе и за мене не е проблем и лично съм писал транскодери да да си прехвърлям творенията от една кодова таблица в друга Познай обаче как реагира обикновен юзер виждайки маймуница Сега си предстви 9 компютъра на 6 операционни системи, които пишат в един и същи файл
    Не си налагам мнението, споделям опит!

    КОНТРА_ТРОЛ_ БАН_ХАКЕР от ПОЕТИЧЕСКИЯ фланг на НАТО
  29. 29 Профил на Fazer
    Fazer
    Рейтинг: 531 Неутрално

    До коментар [#16] от "Alpheratz":

    Хехе, вярно вярно. Срамота е да не се знае собственият език. Повечето ученици се надяват, че за матурите магически ще научат всичко от частни уроци, ама нещата не стават така.

  30. 30 Профил на Qassem Suleimani
    Qassem Suleimani
    Рейтинг: 648 Неутрално

    "Дигитална смърт"! Колко драматично!
    Всички се юрнаха да защитават или да плюят българския език. Бил такъв, бил онакъв, българите били неграмотни...
    И тук става въпрос за бизнес, но ако оставим дори бизнес интереса, нещата са още по-прости. Българският като граматика е лесен за описване с алгоритми и съответно има достатъчно добре разработени дигитални технологии. Съвсем друго яче стои въпроса с аглутинативните езици като фински, унгарски и турски, които са трудни и за хората, камо ли за машина. На второ място по трудност издват синтетичните езици, т.е. езиците с падежи: повечето славянски. Всичко останало е политика и бла-бла.

    "Каждому-каждому в лучшее верится, Может быть, выживет кто-нибудь из нас"
  31. 31 Профил на buzzard
    buzzard
    Рейтинг: 414 Неутрално

    Ич не ми пука дали българския ще оцелее дигитално. Искам да оцелее идеологически и да има народ който да го говори.

  32. 32 Профил на charlesdegaulle
    charlesdegaulle
    Рейтинг: 1341 Неутрално

    До коментар [#18] от "sirmatt":

    Аз съм стар човек, не ми придържайте на архаичния правопис! Учил съм и нещо, което може би за вас ще е странно, но беше доста полезно - краснопис. Според тогавашния правопис, примера беше филийка и филиика. Тогава "категории" се пишеше "категорий", според произношението.





За да коментирате, е нужно да влезете в профила си или да се регистрирате.
С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK