Напредъкът в областта на обработката на естествен език на Института по информационни и комуникационни технологии на БАН бе представен в САЩ

Докторантът Георги Шопов от Института по информационни и комуникационни технологии на Българската академия на науките (ИИКТ–БАН) взе участие в световна конференция в областта на обработката на естествен език – Empirical Methods in Natural Language Processing, която се проведе в Маями, САЩ, съобщават от БАН.
На форума той представи новите научни резултати в областта на езиковото моделиране, постигнати в ИИКТ–БАН, които формират основната част от неговия дисертационен труд. За участие в главната конференция са били избрани 1271 статии измежду 6105 изпратени. Статията на Георги Шопов, в съавторство с доцент Стефан Герджиков от ИИКТ-БАН и Факултета по математика и информатика (ФМИ) на Софийския университет ''Св. Климент Охридски'', е измежду 168-те удостоени с устен доклад, отбелязват от БАН.
През последните години езиковите модели се утвърдиха като основен подход в изкуствения интелект. Те демонстрираха забележителни способности в решаване на задачи, свързани с обработката на естествен език, в програмирането, моделирането на протеини и генерирането на базови езикови, и математически разсъждения. Масово използваните съвременни езикови модели - ChatGPT, Llama, Gemini, Claude, обаче са еднопосочни, те обработват и генерират текст строго от ляво надясно. Фиксираната посока на работа на този тип езикови модели силно ограничава тяхната изразителност, отбелязват от БАН.
В своята разработка учените от ИИКТ–БАН представят нов теоретичен поглед върху езиковото моделиране, базиран на добре известни формализми от теорията на автоматите. Благодарение на тази формална връзка, те въвеждат нов клас двупосочни езикови модели, които са строго по-изразителни от еднопосочните и позволяват решаването на значително по-сложни задачи. Друго преимущество на двупосочните езикови модели е тяхната по-висока ефективност в сравнение с еднопосочните. Двупосочните езикови модели позволяват генерацията на текст да се извършва по-бързо, на компютърни устройства с по-ниска производителност и при по-ниска консумация на електроенергия, което значително увеличава тяхната приложимост.
В бъдеще учените от Института планират да развиват двупосочните езикови модели с цел да се позволи ефективен контрол на генерирания текст, да се определя дълбочината на извода и да се избягват така наречените халюцинации на езиковите модели, допълват още от БАН.
/ЙВЛ

Напредъкът в областта на обработката на естествен език на Института по информационни и комуникационни технологии на БАН бе представен в САЩ

Още от Култура

Български ученици спечелиха 45 отличия на световното първенство по дебати в Йейл

Катедралата "Нотр Дам" обедини хиляди анонимни дарители след опустошителния пожар

Южнокорейската кейпоп група "Атийз" оглави класацията на "Билборд" за албуми

За актьора Дуейн Джонсън не е смущаващо зрителите да пеят в киносалоните

Споразумение за сътрудничество в сферата на образованието подписаха образователните министри на България и Виетнам

Днес Тракийски университет - Стара Загора започна изнесеното си обучение в Пазарджик, шестима са записаните

Още от София

Генералният мениджър на НБЛ Сандра Велчева-Хънт: "Иска ми се тези активности да не са кампанийни, а да има дългосрочност"

На този етап заплатите на университетските преподаватели са ситуирани добре в публичния сектор, каза ректорът на СУ проф. Георги Вълчев

Жилищните кредити растат с 26,5 на сто до 24,1 млрд. лева към края на октомври, показват данните на БНБ

Български ученици спечелиха 45 отличия на световното първенство по дебати в Йейл

Войната на Русия срещу Украйна доведе до нова ескалация между Запада и Москва

Преди да се стигне до физическо домашно насилие, винаги има психологически тормоз, заяви психиатърът Веселин Герев