Напредъкът в областта на обработката на естествен език на Института по информационни и комуникационни технологии на БАН бе представен в САЩ


Докторантът Георги Шопов от Института по информационни и комуникационни технологии на Българската академия на науките (ИИКТ–БАН) взе участие в световна конференция в областта на обработката на естествен език – Empirical Methods in Natural Language Processing, която се проведе в Маями, САЩ, съобщават от БАН.
На форума той представи новите научни резултати в областта на езиковото моделиране, постигнати в ИИКТ–БАН, които формират основната част от неговия дисертационен труд. За участие в главната конференция са били избрани 1271 статии измежду 6105 изпратени. Статията на Георги Шопов, в съавторство с доцент Стефан Герджиков от ИИКТ-БАН и Факултета по математика и информатика (ФМИ) на Софийския университет ''Св. Климент Охридски'', е измежду 168-те удостоени с устен доклад, отбелязват от БАН.
През последните години езиковите модели се утвърдиха като основен подход в изкуствения интелект. Те демонстрираха забележителни способности в решаване на задачи, свързани с обработката на естествен език, в програмирането, моделирането на протеини и генерирането на базови езикови, и математически разсъждения. Масово използваните съвременни езикови модели - ChatGPT, Llama, Gemini, Claude, обаче са еднопосочни, те обработват и генерират текст строго от ляво надясно. Фиксираната посока на работа на този тип езикови модели силно ограничава тяхната изразителност, отбелязват от БАН.
В своята разработка учените от ИИКТ–БАН представят нов теоретичен поглед върху езиковото моделиране, базиран на добре известни формализми от теорията на автоматите. Благодарение на тази формална връзка, те въвеждат нов клас двупосочни езикови модели, които са строго по-изразителни от еднопосочните и позволяват решаването на значително по-сложни задачи. Друго преимущество на двупосочните езикови модели е тяхната по-висока ефективност в сравнение с еднопосочните. Двупосочните езикови модели позволяват генерацията на текст да се извършва по-бързо, на компютърни устройства с по-ниска производителност и при по-ниска консумация на електроенергия, което значително увеличава тяхната приложимост.
В бъдеще учените от Института планират да развиват двупосочните езикови модели с цел да се позволи ефективен контрол на генерирания текст, да се определя дълбочината на извода и да се избягват така наречените халюцинации на езиковите модели, допълват още от БАН.
/ЙВЛ

София

Български ученици спечелиха 45 отличия на световното първенство по дебати в Йейл

Български ученици спечелиха 45 отличия на световно първенство по дебати - World Scholar's Cup 2024 Tournament of Champions, чийто домакин...

Париж

Катедралата "Нотр Дам" обедини хиляди анонимни дарители след опустошителния пожар

Многоцветната катедрала, нарисувана от 5-годишната Луиз, и надвисналото слънце, приличат повече на весели фойерверки, отколкото на пожар. Подобно на тази...

Ню Йорк

Южнокорейската кейпоп група "Атийз" оглави класацията на "Билборд" за албуми

Южнокорейската момчешка кейпоп група "Атийз" за втори път в кариерата си оглави класацията на "Билборд" за албуми, съобщи сайтът на...

Лондон

За актьора Дуейн Джонсън не е смущаващо зрителите да пеят в киносалоните

Дуейн Джонсън смята, че феновете не трябва да се притесняват да пеят в киносалоните, съобщи Би Би Си. Това каза...

София

Споразумение за сътрудничество в сферата на образованието подписаха образователните министри на България и Виетнам

Споразумение за сътрудничество в сферата на образованието подписаха образователният министър Галин Цоков и виетнамският му колега Нгуеин Ком Шън в...

Пазарджик

Днес Тракийски университет - Стара Загора започна изнесеното си обучение в Пазарджик, шестима са записаните

Тракийският университет - Стара Загора започна изнесено обучение на студенти в Пазарджик. Първата група, която ще се обучава по специалността...