Технологии

Петър Цанков, LatticeFlow: Повечето AI модели не работят заради лош набор от данни

Съоснователят и изпълнителен директор на компанията за диагностициране на изкуствен интелект пред "Капитал"

Петър Цанков, съосновател и изпълнителен директор на LatticeFlow

Йоан Запрянов

Петър Цанков, съосновател и изпълнителен директор на LatticeFlow © Цветелина Белутова

Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

Визитка

Петър Цанков е съосновател и изпълнителен директор на LatticeFlow, компания за диагностирицане и поправяне на изкуствен интелект (AI). LatticeFlow е регистрирана в Швейцария, като освен Цанков в екипа от съоснователи има и друг българин - Мартин Вечев, ръководител на института INSAIT. В края на 2022 г. LatticeFlow набра 12 млн. долара при оценка от около 50 млн. долара.

Цанков ще бъде един от участниците на тазгодишното издание на конференцията Digitalk, която ще се проведе на 18 май в Sofia Event Center. Там той ще говори именно за проблемите при разработка и развитие на AI модели. Повече подробности и билети можете да намерите на сайта на конференцията.

Въпреки успеха на ChatGPT според статистиката около 80% от разработваните модели на изкуствен интелект се провалят. Защо?

- Първо, защото са различни неща. ChatGPT е езиков модел, който взе готова технология, добави още един слой към нея и се превърна в много добър събеседник за разговори по широк набор от теми. Генеративните изкуствени интелекти са точно такива - те са добри в много неща, но нито един от тях не е много добър в нещо конкретно. Ако един специалист започне да си говори с него за финанси например, веднага ще си проличат пропуските.

Другото са съответно специализираните модели, които трябва да решават конкретен проблем и то изключително добре. Това са и различни подходи. Не можем да ползваме ChatGPT да диагностицира пациенти в болница, това би довело до хаос. Но пък за диагностика, разчитане на снимки и др. има специализирани модели, които се ползват и в момента.

Но остава въпросът: защо повечето от тях не стигат до момента, в който могат да се ползват на практика?

- Основният проблем е, че е много трудно да ги направиш толкова добри, че да можеш да им се довериш. При повечето модели в първия момент всички са впечатлени. Така стана и с ChatGPT. Бързо след това бяха открити пропуски и че моделът, макар и впечатляващ, е далеч от перфектен. Когато става дума за специализирани модели, които ти карат колата или решават медицински въпроси, тогава няма място за такива грешки.

Въпрос на систематични грешки при вкарването на данни или друго?

- Основният проблем е наборът на данни. Качеството на данните е особено важно, но не е единствeният фактор. Тук рискът е да се каже, че качеството на данните е най-важно и всичко останало да остане на заден план. В LatticeFlow често виждаме, че клиентите имат по-дълбоки проблеми, като например как са подадени софтуерно тези данни, как са анотирани и т.н. Това е човешката част - хора, които показват на модела кой е верният отговор в дадена ситуация и след милион подобни малки частички тестване, той се научава.

Много често данните са небалансирани - например 99% снимки, които са добри и 1% снимки, които са специфични. Такъв дисбаланс прави работата много трудно. Представи си, че си ученик и решаваш 99% алгебра и 1% тригонометрия. Очевидно няма да си много добър по тригонометрия. Грешно анотираните данни са друг проблем - това е като да не разбереш какво е заданието на задачата. Тук отново проблемът е човешки. Например, ако хората не са анотирали добре дадени модели, могат да се получат грешки като дали колата е кола или целият паркинг е кола.

От гледна точка на LatticeFlow забелязвате ли значителни промени в сектора след пускането на ChatGPT?

- Основното, което видяхме е, че на крайния потребител му просветна един прост факт: изкуственият интелект не е нещо, което ще се случи след десет години, а нещо, което се случва сега. Това, което ChatGPT направи, е да покаже на всички какви са възможностите на тази технология.

От компаниите забелязахме предимно засилен интерес към езиковите модели и генеративния AI. Цялата индустрия разбра, че трябва да започне да инвестира в тази сфера, защото не е игра, а въпрос на бизнес оцеляване.

Когато диагностицирате един модел, кой е най-честият проблем?

- Грешно анотираните данни са най-масовия проблем. Между 20 и 50% от данните обичайно имат някакъв проблем, което е огромен процент. Често виждаме и т. нар. "слепи петна", т.е. данни, където моделът въобще не разбира какво вижда и съответно не работи.

Винаги в разговор за изкуствен интелект се стига до "Терминатор" въпроса. Предвид бързото развитие на технологията, и особено ако приемем, че то ще продължи експоненциално, има ли от какво да се страхуваме по отношение на пазара на труда?

- Това за мен са два въпроса. Според мен ще има синергия между хората и изкуствения интелект, тоест те ще си помагат. Същевременно има реален риск, понеже технологията се развива много бързо, да се случат драстично бързи промени в живота ни, което ще повлияе на много хора. Някои професии ще се автоматизират, това вече се случва. Съответно има реална опасност нагаждането на хората да бъде по-бавно, отколкото развитието на технологията. Една държавна политика обичайно е в рамките на години, докато тук си говорим за дни и седмици.

Има ли възможност, както казва Ювал Ноа Харари, да се появи една "безполезна" класа хора, чиято дейност може да се автоматизира?

- Да, има такава възможност и тя вече се случва. Ако тези хора не се преквалифицират, те няма да има какво да правят.

Логичният последващ въпрос е, ако технологията се движи толкова бързо, има ли въобще смисъл от преквалификация?

- О, винаги. Никога не бих отговорил "не" на този въпрос. Винаги има смисъл да научиш нещо ново. Сега това е все по-наложително, все по-важно.

Какво в тази тема ви притеснява?

- Аз не съм особено притеснен. Положително мислещ човек съм. Не мисля, че трябва да слагаме бариери и да забавяме изкуствено технологията. Има други методи, с които можем да се справим - всяка развита икономика може да се погрижи за гражданите си и да защити тази част от обществото, която трябва да се преквалифицира.

И обратното: какво ви кара да бъдете оптимистичен в работата ти?

- Това е технология, която ще промени наистина всичко около нас, всяка индустрия. Това е огромно. В медицината например това ще бъде една от най-големите промени някога. Медицината е сфера, където автоматизацията е добре дошла, защото на места тя откровено деградира. В САЩ например разходите за здравеопазване се повишават, докато здравето на обществото се влошава. Това е абсурд. За мен това са проблеми, които могат да се решават с технология и в широк мащаб всички хора да имат добро здравеопазване. Без скъпи застраховки и недостиг на лекари.

2 коментара

Най-харесваните
Най-новите
Най-старите

1
:-|
Божидар Здравков 12:05, 06 апр 23 , Неутрално
"В САЩ например разходите за здравеопазване се повишават, докато здравето на обществото се влошава. Това е абсурд."
Не това е логичен резултат на целта. Фундаменталната цел е печалба. Резултатът е постигнат.
" За мен това са проблеми, които могат да се решават с технология и в широк мащаб всички хора да имат добро здравеопазване. Без скъпи застраховки и недостиг на лекари." Да бе, някой ще инвестира про боно. Когато инвестициите с благотворителна цел значително надхвърлят инвестициите с цел печалба, тогава ще се появи лееека промяна. Не в този живот/свят.

Нередност?
2
:-|
Божидар Здравков 12:35, 06 апр 23 , Неутрално
„Има други методи, с които можем да се справим - всяка развита икономика може да се погрижи за гражданите си и да защити тази част от обществото, която трябва да се преквалифицира.“
Пожелателно мислене. Има такива методи. Никъде не са открити.
Логическа задача. 1.Има огромен недостиг на квалифицирани хора. „…тази част от обществото…“ става все по-голяма. 2.Обществото не може да мотивира хората да учат, вие ще „преквалифицирате“ функционално неграмотни.
Решение. Задачата няма решение в областта на реалните числа (при тези начални условия, казано математически).

Нередност?

Нов коментар

За да публикувате коментари,
трябва да сте регистриран потребител.

Капитал - брой 16

К10 - Най-добрите банки за 2023 г.

Имоти и инвестиции

ПАРИ: Финанси, технолигии, дигитализация, доходност

Брандирана памучна торба

Digitalk Conference 2024

Среща на бизнеса от Черноморието

Ecommerce and Retail Summit: Towards smarter, faster and more sustainable shopping

Какво не знаем за професията "Охранител"

Да затвориш цикъла

Завръщане във Виена