🗞 Новият брой на Капитал е онлайн >>

Google oжесточава конкуренцията при изкуствения интелект с "могъщия" Gemini

Технологичната компания стартира малко по-късно с AI продукти, но за сметка на това с още по-големи амбиции

Бюлетин: Вечерни новини Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

Google е на път да извърши значителна промяна при изкуствения интелект (AI) с пускането на своя нов модел, Gemini, за който се твърди, че е по-мощен от всеки друг, пускан досега. "Това е началото на новата ера за AI в Google", както заявява изпълнителният директор Сундар Пичай. Gemini е най-новият голям езиков модел (Large Language Model - LLM) на Google, който Пичай първоначално представи на конференцията за разработчици I/O през юни, a вече е готов за пускане и може да се интегрира в много от продуктите на Google, включително и в браузъра Chrome.

Така състезанието в сферата на изкуствения интелект става още по-ожесточено - Gemini влиза в директна конкуренция с Илон Мъск и неговия AI продукт Grok, както и с компанията OpenAI, която в момента заема водеща позиция със своя модел GPT-4. Всеки от тези модели играе ключова роля в определянето на посоката, в която ще се развиват технологиите за изкуствен интелект, като същевременно оформят как тези технологии ще се интегрират в бизнеса и живота на хората.

Един от примерите за използване на тази технология с помощта на Google беше също обявен тази седмица - платформата Jasper генерира маркетиногово съдържание за компании на цена, която много е по-конкурентна от разходите за заплати на хора.

Gemini се състои от три основни версии: Gemini Nano, Gemini Pro и Gemini Ultra. Gemini Nano е лека версия, оптимизирана за устройства с Android, като предлага интелигентни функции за потребителите. Gemini Pro, от друга страна, е по-мощен и е предназначен за интеграция в Google AI услуги и ще бъде основата на Bard. Gemini Ultra, е разработен за използване в центрове за данни и предприятия, като предлага висококачествено обработване на множество видове информация.

И докато всичко изглежда и звучи прекрасно, се оказа, че клипът с представянето на продуктът на Google e бил фалшив, дежавю за компанията, което ни препраща към представянето на Bard. Скандалът около видеото "на живо" с Google's Gemini AI, което беше представено по време на неговия старт, предизвика значителен обществен интерес и дебати. Google призна, че видеото не е изцяло реалистично, но е по-скоро представяне на "какво би могло да бъде Gemini", а не демонстрация в реално време, както мнозина са си мислили.

Въпреки че видеото показва способността на Gemini да разбира и взаимодейства с текст и изображения едновременно, начинът, по който са представени възможностите на Gemini, не е напълно достоверен. Според допълнителна информация, предоставена от Google, видеото е било създадено с цел да "вдъхнови", а не да заблуждава. Всички потребителски команди и резултати във видеото са реални, но са много съкратени и монтирани.

Gemini използва мултимодален подход от самото начало, което ще рече, че позволява да обработва и взаимодейства с текст, аудио- и видеоданни. Този подход отличава Gemini от други модели като DALL-E или Whisper на OpenAI, които разчитат на отделни модели за различни видове "сензорни входове", тоест текст, изображение, аудио- или видеосъдържание. Gemini е обучен на Tensor Processing Units на Google, което според експерти го прави не само по-бърз, но и по-икономичен в изпълнението в сравнение с предишните модели на компанията. За последно от OpenAI трябваше да "се обясняват", че моделът им не е станал мързелив, защото от компанията се решили да спестят от изразходвана енергия

Важен аспект от разработката на Gemini е неговата сигурност, според прессъобщенията на Google. Отново според тях те са извършили задълбочени вътрешни и външни тестове, както и red-teaming, за да гарантира безопасността и надеждността на модела. Това включва осигуряване на сигурността на данните, което е особено важно за продуктите, насочени към предприятия и бизнеси.

Моделът ще даде тласък на различни сектори, включително здравеопазване, образование и бизнес, като предоставя нови възможности за иновации. Gemini ще бъде представен на широката общественост през следващите месеци, като Google планира редица демонстрации и обучения за разработчици и потребители.

Как да го ползваме сега

Google пусна своя модел на изкуствен интелект Gemini в 170 страни чрез Bard на 8 декември. Ако искате да използвате Google Gemini AI, първата стъпка е да попитате Bard за текущия използван модел на езика. След като потвърдите, че Bard във вашата локация е актуализиран с Gemini AI, може да започнете да използвате най-новия езиков модел на Google. Ето как става това:

1. Посетете уебсайта на чатбота Bard.

2. Влезте с вашия Google акаунт.

3. След като влезете, започнете да взаимодействате с Bard по обичайния начин.

4. По време на разговора си можете изрично да посочите, че искате да използвате Gemini за конкретни задачи. Например може да кажете: "Хей, Bard, можеш ли да използваш Gemini, за да ми помогнеш да напиша стихотворение за българската политика?"

Bard ще използва възможностите на Gemini, за да ви помогне с вашата заявка. Имайте предвид, че Gemini AI е достъпен само на английски език в настройките на Bard Chatbot, но според последния блогпост на Google компанията планира скоро да разшири обхвата си и на други езици.
Все още няма коментари
Нов коментар