Запознайте се с френския стартъп, който се надява да се противопостави на OpenAI

Mistral представя най-новия си голям езиков модел - и сделка с Microsoft

"Вече не е важно да си по-голям - важно е да си креативен и бърз." Артър Менш, главен изпълнителен директор на Mistral
"Вече не е важно да си по-голям - важно е да си креативен и бърз." Артър Менш, главен изпълнителен директор на Mistral
"Вече не е важно да си по-голям - важно е да си креативен и бърз." Артър Менш, главен изпълнителен директор на Mistral    ©  Reuters
"Вече не е важно да си по-голям - важно е да си креативен и бърз." Артър Менш, главен изпълнителен директор на Mistral    ©  Reuters
Бюлетин: Вечерни новини Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

Някои състезания приключват, преди наистина да са започнали. Така поне изглежда надпреварата за създаването на най-добрите големи езикови модели (LLM). Тези алгоритми задвижват генеративния изкуствен интелект, който може да произведе подобни на човешките текстове и други материали. OpenAI, американският създател на ChatGPT, изглежда, е много по-напред. Той е създал най-мощния LLM в света, наречен GPT-4. Компанията трупа таланти, данни и изчислителна мощ, за да създаде по-умни модели. В резултат на това тя привлича все повече потребители, а с тях и повече капитал, който да влее в още по-сложни модели.

Но френският стартъп Mistral се опитва да разклати този AI маховик. На 26 февруари той пусна нов LLM. Моделът, наречен Mistral-Large, е по-малък от GPT-4, измерван по броя на параметрите, които използва (обичаен показател за мощността на модела). Въпреки това той почти съперничи на GPT-4 във важни аспекти на производителността, като например разсъжденията. Mistral също така представи и задвижван от Mistral-Large конкурент на ChatGPT - Le Chat (произнася се le shah, като френската дума за котка, а не като английския омограф). И обяви сделка с Microsoft - AI гигант, който вече има задълбочено партньорство с OpenAI. Технологичният гигант ще придобие малък дял в Mistral и ще направи моделите на френската компания достъпни чрез своя облак Azure.

Отваряне на индустрията

Mistral е доказателство, че индустрията вече става по-отворена - и по-малко американска. Ако той наистина отправи сериозно предизвикателство към OpenAI, това ще потвърди подозренията на някои представители на индустрията, че при генеративния AI размерът не е всичко. "Вече не е важно да си по-голям - важно е да си креативен и бърз", каза Артър Менш, главен изпълнителен директор на Mistral.

Възходът на френската фирма е бил толкова бърз, колкото северозападният зимен вятър, на който е кръстена. Тя е основана преди по-малко от година и все още има само 25 служители. Въпреки това нейните LLM са водещи в нарастващия брой модели с отворен код, чиито статистически вътрешности, за разлика от затворените черни кутии като GPT-4, са публично достъпни и могат да бъдат променяни от всеки. Това позволи на Mistral да привлече впечатляващите 490 млн. евро (531 млн. долара), което оценява компанията на повече от 2 млрд. долара. Сред големите инвеститори са водещи рискови капиталисти от Силициевата долина като Andreessen Horowitz и General Catalyst, както и технологични светила като Ерик Шмидт, бивш главен изпълнителен директор на Google.

Mistral дължи ранния си успех на умелото съчетаване на основните технически съставки на AI - талант, данни и изчислителна мощ - с политиката, която става все по-важна за AI индустрията, тъй като световните правителства проучват потенциала на технологията.

Да започнем с таланта. Тук Mistral е "чудесно съчетание" между френското инженерно образование и американските технологични гиганти, казва Станислас Полу, съосновател на Dust, друга от множеството AI фирми, които се появяват в Париж. Трима от шестте основатели на Mistral и техническите ѝ умове - Менш, Тимоте Лакроа и Гийом Лампле - са възпитаници на елитните френски технически училища. Подобно на много други водещи AI изследователи, те са работили в изследователските лаборатории на Google и Meta, друг американски технологичен гигант - обаче в случая на триото те са изграждали LLM в парижките филиали на тези лаборатории, а не в Лондон или Силициевата долина. Това ги поставя сред около 100-те души в световен мащаб, които наистина знаят как да обучават най-съвременните модели.

Те, изглежда, са особено умели в събирането на данни за обучението на техните модели - втората съставка на успеха на AI. Менш не иска да говори как точно Mistral подготвя своите учебни набори; това е източникът на конкурентното предимство на неговата фирма, казва той. Но браншови експерти потвърждават, че Mistral е по думите на един от тях "много умел" в подбора, например филтрирайки информация, която се повтаря или е безсмислена. Това е позволило на моделите на Mistral да са много по-малки; статистически тежести или "параметри" на моделите на Mistral се измерват в милиарди спрямо около 1.8 трлн. за GPT-5 на OpenAI (и двете фирми не съобщават точните размери). Това позволява на клиентите да ги изпълняват на собствените си компютри, а не в огромен център за данни, какъвто изискват много затворени модели.

Според Менш фокусът на Mistral върху подбора на данни позволява на фирмата да използва изчислителната мощ, третият важен компонент на AI, по-ефикасно от нейните конкуренти. Обучението на последния модел на Mistral струва много по-малко от 100-те млн. долара, които OpenAI очевидно е изхарчил за разработването на GPT-4. Подходът на Mistral също така прави по-евтино за клиентите както прецизното обработване на техните модели със собствени данни, така и последващото им изпълнение.

В техническо отношение стартъпи като Mistral се радват на "предимство на вторите", възползвайки се от всичката работа, която OpenAI и други са свършили, твърди Жанет цу Фюрстенберг от General Catalyst. Решаващо в случая на Mistral е, че тези технологични способности се допълват от политически нюх, което е от ползва, тъй като много правителства смятат, че домашните LLM ще им осигурят икономически и стратегически предимства.

За това помага и фактът, че друг от съоснователи на Mistral е Седрик О, бивш френски министър на цифровите технологии. Седрик О поддържа пряка връзка с президента на страната - Енанюел Макрон, който проявява силен интерес към всичко, свързано с AI. Когато миналата година проектът на Европейския съюз за Закон за изкуствения интелект заплаши да принуди Mistral да разкрие рецептата си за данни, О с подкрепата на Макрон успешно координира френско-германско усилие да се противопостави на подобни разпоредби. Те надлежно бяха изключени от законопроекта.

Преход към печалба

Въпросът сега е дали Mistral, който все още не е генерирал значими приходи, може да превърне този примамлив технико-политически микс в печалба. Фирмата залага, че много бизнеси, особено европейски, искат да има по-голям контрол върху използваните от тях LLM, отколкото OpenAI е готов да им предостави, и не искат да се обвързват с друга американска технологична платформа. Такива клиенти според тяхната идея ще бъдат склонни да плащат на Mistral за поддръжка и управление на техните модели.

Един въпрос, който потенциалните клиенти може да си зададат, е как светът ще регулира моделите с отворен код. Разгорещеният дебат дали те ще позволят на терористи и други злонамерени играчи да създадат биологични и кибернетични оръжия затихна. Вместо да се говори за рисковете, дискусията сред политиците се насочва към потенциалните ползи: по-голяма прозрачност, повече иновации и по-малка зависимост от шепа мощни компании, които контролират технологията. Регулаторите от двете страни на Атлантическия океан досега толерираха LLM с отворен код. Но Седрик О може отново да се окаже в затруднено положение, ако тези модели продължат да стават все по-мощни или се установи, че се използват неправилно, като например за разпространение на дезинформация по време на множеството избори през тази година.

Избягването на политическия отпор очевидно е в интерес на Mistral - но лобисткият успех има и обратна страна. Регулаторната снизходителност почти сигурно ще доведе до по-голяма конкуренция в областта на отворения код. На 20 февруари финландската фирма Silo AI представи нов LLM, който е дори по-отворен от този на Mistral, предоставяйки информация за данните, върху които е обучен, и за софтуера, който е свършил тази работа. Нова версия, която трябва да излезе през следващите няколко месеца, ще бъде толкова добра на повечето европейски езици, колкото е в момента на финландски и английски.

Най-важното е, че все още не се знае дали размерът има значение за генеративния AI. Това ще бъде проверено, когато OpenAI най-накрая пусне следващия си модел - GPT-5. Ако той изпревари значително Mistral-Large и други по-малки модели с отворен код, тогава думите на Менш за креативност и бързина може да се окажат кухи. Дотогава обаче историята на Mistral ще продължи да отеква.

2024, The Economist Newspaper Limited. All rights reserved

6 коментара
  • Най-харесваните
  • Най-новите
  • Най-старите
  • 3
    abcdefgh avatar :-P
    Milen Ivanov
    • - 1

    Французите вечно се мъчат да бият янките на американски "футбол". :)

    Е нема как да им се получи!

    Нередност?
  • 5
    roumen avatar :-|
    roumen
    • - 3

    Видяла жабата че подковават вола и тя вдигнала крак. Тези жалки напъни на французите още повече подчертават колко е изостанала Европа в IT сектора. И за съжаление няма светлина в тунела, но за това трябва да благодарим със цялото си сърце на ЕС

    Нередност?
Нов коментар