ТПС: Израелски студенти използваха изкуствения интелект, за да разчетат надписи на иврит и на староарамейски


Студенти от израелския университет "Бен-Гурион" в Негев изпробваха силата на изкуствения интелект, за да възстановят нечетливи букви и думи в древни надписи на иврит и староарамейски по свой проект, предаде израелската новинарска агенция ТПС.
Всяка година археолозите откриват много древни текстове, написани на иврит и староарамейски език в целия Близък изток. Тези надписи са безценни за разбирането на богатото културно и историческо наследство на региона. Много от тези текстове обаче са претърпели щети с течение на времето, което затруднява учените да ги дешифрират. Природните бедствия, политическите конфликти и следите на времето са оказали своето въздействие върху тези древни артефакти.
Иновативният подход на университета "Бен-Гурион" обаче може да доведе до революция в областта на епиграфиката - науката за идентифициране, класифициране и тълкуване на надписи, открити върху древни артефакти като монети, паметници, статуи, сгради или надписи, открити върху древни папируси, пергаменти или свитъци.
"Този пробив има потенциала да направи революция в областта на епиграфиката", каза професор Марк Ласт, който ръководи студентския проект. "Можем не само да помогнем на историците да разчетат по-точно древните текстове, но също така смятам, че този модел може да бъде адаптиран към други морфологични древни езици."Традиционно епиграфите разчитат на отнемащи време ръчни методи за сглабяне на липсващи части от повредени надписи. Тези методи обаче са податливи на грешки", обясни той.
Студентите от Факултета по софтуерно инженерство и информационни системи, които се заеха с проекта, подходиха към предизвикателството като към "автоматична смяна на думи в текстa". Това се отнася до специфичен вид задача за обработка на естествен език, която се основава на концепцията за подмяна на думи в текста, които са изтрити - техника, която често се използва при предварителното обучение на широкомащабни езикови модели. Повреденото съдържание може да се състои от единични символи, частични думи, единични пълни думи и многословни думи.
Бакалаврите Нив Фоно, Харел Мошайоф, Елдар Карол и Итай Асраф приложиха подхода за автоматична смяна на думи в текстa към повредени надписи на иврит и староарамейски език. Това включваше обучение на системата върху набор от данни, състоящ се от 22 144 изречения от Стария завет, и тестването ѝ върху 536 изречения, като беше постигнат забележителен успех.
Използвайки набор от модели за предполагане на думи и символи, те успяха да постигнат висока точност при възстановяването на повреден текст. Техният модел, наречен "Ембайбъл", беше представен през март на срещата на европейския клон на Асоциацията за компютърна лингвистика.
"Можем да помогнем на историците, които са посветили живота си на пресъздаването на тези древни текстове с възможно най-голяма точност", каза ръководителят на студентите, "Освен това смятам, че моделът може да намери по-широко приложение, за да обхване и други богати на морфология древни езици", добави той.
(Тази информация се разпространява по споразумение между БТА и ТПС)