Събитието ще се състои на 8 октомври в централната сграда на Академията и ще събере експерти от научните среди, технологичните компании и публичната администрация. Участниците ще обсъдят значението на езиковите данни за развитието на иновации и ИИ решения, насочени към българския език.
В рамките на форума участие ще вземе и Свобода Тодорова, ръководител на проект „План за възстановяване и устойчивост“ в БТА. Тя ще вземе участие в панел на тема „Създаване и управление на езикови данни в Българската телеграфна агенция. Архиви, дигитализация, достъпност и бъдеще с изкуствен интелект“.
Тодорова ще представи усилията на БТА за дигитализация и съвременно управление на текстовите и фотоархивите на агенцията, които включват над 5 милиона страници и 1,8 милиона снимки. Тя ще акцентира върху необходимостта от единна инфраструктура, стандартизирани метаданни и обществен достъп до информацията, както и върху ролята на изкуствения интелект за автоматична анотация, семантично търсене и изграждане на езикови корпуси.
БТА планира и партньорство с Националния отбор по изкуствен интелект, което ще подпомогне внедряването на ИИ технологии за съхранение и интелигентно използване на архивите.
По време на събитието ще бъде представена и европейската платформа „Европейско пространство за езикови данни“, която цели събиране, създаване, споделяне и повторна употреба на многоезикови и многомодални езикови данни. Очаква се да бъдат обсъдени и предизвикателствата при създаването, управлението и разпространението на такива данни в България, посочиха от БАН.
/ИПД