България се бори за AI независимост

Успехът зависи от много фактори и неизвестни, но семената вече са посети - пример са новите AI модели от българския технологичен институт INSAIT

Константин Николов

DemistifAI

Седмичният бюлетин на Капитал и Digitalk DemistifAI е вашия източник на информация за еволюцията на изкуствения интелект и неговото въздействие върху бизнеса.

Темата накратко

Страната може да е сред лидерите в сферата на изкуствения интелект чрез разработването на български модели.
Успехът в областта на изкуствения интелект зависи от много фактори и неизвестни, но семената вече са посети.
Пример са новите AI модели от българския технологичен институт INSAIT.

Електричеството промени съвременния свят. Преобърна из основи производството, транспорта, здравеопазването и много други сектори. В по-ново време интернет имаше подобна трансформационна сила. А последната технология, която ще разтърси (и вече го прави) света ни, е изкуственият интелект. Печелят и ще спечелят онези, които отрано са готови за интеграцията му във всички сфери. Ще спечелят и държавите, които имат ясни стратегии за въвеждането и регулацията му. И за разлика от други случаи, този път България има шанс да играе роля в развитието на технологията. В центъра на възможността е създаденият преди две години български технологичен институт INSAIT, около който се изгражда AI екосистема, свързваща български и чужди компании, държавата и академичната общност. Успехът зависи от много фактори и неизвестни, но семената вече са посети - пример са новите AI модели, по които INSAIT работи, като най-известен стана специализираният за български език отворен модел BgGPT. Извън INSAIT вече се подготвят и други подобни модели на български език от по-малки компании, както и от независими общности от специалисти, които също ще стават все по-добри.

"BgGPT е стратегически проект за България, тъй като осигурява аналог на "енергийна независимост" на държавата и бизнеса, но в AI", обяви основателят на INSAIT Мартин Вечев при пускането на проекта.

Науката е слънце

И възможностите са налице, защото INSAIT е насочен към научна дейност и изследвания в областта на deep tech технологии и специално към изкуствения интелект. Той беше открит през пролетта на 2022 г. като изследователски институт към СУ "Св. Климент Охридски" в партньорство с водещите швейцарски политехники ETH Zurich и EPFL, които гарантират качеството на научната работа в него и на обучението. Организацията е финансирана както от държавата, така и от международни гиганти като Google, Amazon, VMware и български компании като SiteGround и други частни дарители. Една от основните идеи на Мартин Вечев, който е професор в ETH Zurich (виж интервюто), беше привличането на водещи учени и докторанти в София, които да поставят института в топ 50 в света. Такъв е например проф. Люк ван Гуул, едно от най-влиятелните имена в областта на изкуствения интелект и компютърното зрение. Допреди време беше крайно невероятно подобни учени да работят от София, но за по-малко от две години това се случи.

Всъщност INSAIT не е нова идея, но за първи път се прави в държава като България, което показва и амбициите му. Идеята е той да бъде като швейцарския ETH, щатския MIT или израелския Technion. Те не са просто университети, а и много други неща на едно място: от изследователски лаборатории, през инкубатори на стартъпи до обучаващи студенти и докторанти. Целта е INSAIT да бъде именно такъв хъб в сферата на изкуствения интелект и компютърните науки.

Собствени модели = AI независимост

Основните езикови модели като ChatGPT на OpenAI, Llama на Мeta и Gemini на Google са обучавани предимно на английски. По тази причина работят и по-трудно на по-слабо представените езици като български, съответно и така се ограничава цялостното им ползване в тези държави. По тази причина е важно разработването на собствени специализирани модели на съответния език.

При пускането на BgGPT в началото на март много Facebook "експерти" се подиграваха на отговорите му, които включваха и тъй наречените халюцинации (при които моделът си измисля отговори - това се случи и с далеч по-големи проекти като ChatGPT). Но идеята му не е да е просто чатбот на български, а тъй като е с отворен достъп, да бъде използван от държавни или частни организации за изпълняване на определени задачи, след като бъде обучен вътрешно от тях.

"В AI (както и в живота) нещата са структурирани във вертикали (специализации) и трябва всяка организация да може бързо и евтино да създаде собствен AI модел на базата на отворен такъв (като BgGPT), като го специализира в дадена тематика, без да трябва да плаща за всяко ползване и без да споделят данните си", заяви Вечев при пускането на BgGPT. Според него той е така нареченият базов модел - сегашната му версия е тренирана със 7 млрд. параметъра, като скоро ще бъде пуснат десет пъти по-голям модел. Но дори и сегашният сет е напълно напълно достатъчен за много компании и организации. И вече има немалко примери на внедрявания за изключително кратко време.

"Не знам колко хора в държавата разбират, че за България е стратегически важно да има такива модели. Иначе си зависим, както например си енергийно зависим от други държави, които по всяко време може да те затворят, да използват данните ти, да искат повече пари", казва Мартин Вечев. И предимството за ползващите го е, че те сами обучават модела според своите цели - той може бързо да търси спрямо определени критерии в базите им данни, да отговаря на въпроси според техните изисквания и да автоматизира определени мануални задачи. "Например, говорим с Министерството на иновациите и растежа, където има много европейски програми, при които трудно можеш да се ориентираш коя е най-подходяща за теб. Те искат да изградят чатбот, който да те насочва по определени критерии", казва Вечев. Най-важното - данните остават вътре в организацията и не се споделят навън и с INSAIT, а моделът е безплатен и може да бъде ползван за комерсиални цели.

"Моделът може бързо да се вертикализира и специализира, което означава, че не толкова големи модели като него всъщност са достатъчни за много бизнеси. Всеки може да го специализира според своите изисквания, дали в областта на правото или данъците или пък нещо друго. Самият модел ще става все по-точен, по-мощен, по-малко ще халюцинира. Вече имаме десет пъти по-голяма версия, която ще пуснем в следващите седмици. И няма да може да се използва за лоши цели", допълва основателят на INSAIT. Моделът вече се ползва и от стартъпи, и от големи компании, например в сферата на строителството, и от министерства и агенции.

BgGPT е само една част от работата на INSAIT. Извън този модел има и редица други в сферите на роботиката, сателитните данни, умните градове и т.н., по които INSAIT работи с компании и специалисти от цял свят. "Даже за нас BgGPT не е толкова интересен от гледна точка на изследвания. Просто го правим, за да изградим нужната ни независимост в изкуствения интелект", коментира Мартин Вечев. Според него особено важно е сега бързо да има българска политика в сферата на изкуствения интелект и страната ни да се позиционира като лидер в областта. Ето защо от INSAIT са готови за кратко време да изградят езикови модели и за други държави в региона. Според Вечев е нужно държавата да иска внедряването на модела на всякакви нива, за да става и все по-добър. "След като видяхме как бизнесът толкова бързо го внедрява, ясно е, че следващите версии ще бъдат по-добри и по-мощни. И така страната ни може да бъде една от първите държави, в които навсякъде се ползва", казва той. Като стъпка към подобен момент е и очакването чрез постановление на МС държавните организации да могат да предоставят различни публични данни, които са разхвърляни на най-различни места и трябва да се систематизират. И те да могат да бъдат използвани както от INSAIT, така и от други компании и общности. Такива вече има и скоро ще бъдат обявени и други модели. Отделно INSAIT подготвя и модел в сферата на създаване на изображения.

Дори и за най-големите скептици положителното около работата с изкуствения интелект в България досега е, че покрай INSAIT и другите специализиращи в областта компании и организации в крачка се създава общност, която тепърва ще си помага и ще дърпа сектора напред. Има проекти за нови AI стартъпи, а в София идват учени и докторанти, за да работят по свои AI изследвания. Тази общност и сътрудничество с държавата (от която идват и най-големите средства за института) тепърва може да привлекат и по-големи компании, които да инвестират и работят с тези хора, например чрез отварянето на свои центрове тук. И за такива проекти вече се преговаря съвсем конкретно.