Технологии

Google oжесточава конкуренцията при изкуствения интелект с "могъщия" Gemini

Технологичната компания стартира малко по-късно с AI продукти, но за сметка на това с още по-големи амбиции

Робърт Христов

DALL-E 3

Вечерни новини

Всяка делнична вечер получавате трите най-четени статии от деня, заедно с още три, препоръчани от редакторите на "Капитал"

Google е на път да извърши значителна промяна при изкуствения интелект (AI) с пускането на своя нов модел, Gemini, за който се твърди, че е по-мощен от всеки друг, пускан досега. "Това е началото на новата ера за AI в Google", както заявява изпълнителният директор Сундар Пичай. Gemini е най-новият голям езиков модел (Large Language Model - LLM) на Google, който Пичай първоначално представи на конференцията за разработчици I/O през юни, a вече е готов за пускане и може да се интегрира в много от продуктите на Google, включително и в браузъра Chrome.

Seeing some qs on what Gemini *is* (beyond the zodiac :). Best way to understand Gemini's underlying amazing capabilities is to see them in action, take a look ⬇️ pic.twitter.com/OiCZSsOnCc

- Sundar Pichai (@sundarpichai) December 6, 2023

Така състезанието в сферата на изкуствения интелект става още по-ожесточено - Gemini влиза в директна конкуренция с Илон Мъск и неговия AI продукт Grok, както и с компанията OpenAI, която в момента заема водеща позиция със своя модел GPT-4. Всеки от тези модели играе ключова роля в определянето на посоката, в която ще се развиват технологиите за изкуствен интелект, като същевременно оформят как тези технологии ще се интегрират в бизнеса и живота на хората.

we've heard all your feedback about GPT4 getting lazier! we haven't updated the model since Nov 11th, and this certainly isn't intentional. model behavior can be unpredictable, and we're looking into fixing it 🫡

- ChatGPT (@ChatGPTapp) December 8, 2023

Един от примерите за използване на тази технология с помощта на Google беше също обявен тази седмица - платформата Jasper генерира маркетиногово съдържание за компании на цена, която много е по-конкурентна от разходите за заплати на хора.

Gemini се състои от три основни версии: Gemini Nano, Gemini Pro и Gemini Ultra. Gemini Nano е лека версия, оптимизирана за устройства с Android, като предлага интелигентни функции за потребителите. Gemini Pro, от друга страна, е по-мощен и е предназначен за интеграция в Google AI услуги и ще бъде основата на Bard. Gemini Ultra, е разработен за използване в центрове за данни и предприятия, като предлага висококачествено обработване на множество видове информация.

И докато всичко изглежда и звучи прекрасно, се оказа, че клипът с представянето на продуктът на Google e бил фалшив, дежавю за компанията, което ни препраща към представянето на Bard. Скандалът около видеото "на живо" с Google's Gemini AI, което беше представено по време на неговия старт, предизвика значителен обществен интерес и дебати. Google призна, че видеото не е изцяло реалистично, но е по-скоро представяне на "какво би могло да бъде Gemini", а не демонстрация в реално време, както мнозина са си мислили.

Въпреки че видеото показва способността на Gemini да разбира и взаимодейства с текст и изображения едновременно, начинът, по който са представени възможностите на Gemini, не е напълно достоверен. Според допълнителна информация, предоставена от Google, видеото е било създадено с цел да "вдъхнови", а не да заблуждава. Всички потребителски команди и резултати във видеото са реални, но са много съкратени и монтирани.

Gemini използва мултимодален подход от самото начало, което ще рече, че позволява да обработва и взаимодейства с текст, аудио- и видеоданни. Този подход отличава Gemini от други модели като DALL-E или Whisper на OpenAI, които разчитат на отделни модели за различни видове "сензорни входове", тоест текст, изображение, аудио- или видеосъдържание. Gemini е обучен на Tensor Processing Units на Google, което според експерти го прави не само по-бърз, но и по-икономичен в изпълнението в сравнение с предишните модели на компанията. За последно от OpenAI трябваше да "се обясняват", че моделът им не е станал мързелив, защото от компанията се решили да спестят от изразходвана енергия

Важен аспект от разработката на Gemini е неговата сигурност, според прессъобщенията на Google. Отново според тях те са извършили задълбочени вътрешни и външни тестове, както и red-teaming, за да гарантира безопасността и надеждността на модела. Това включва осигуряване на сигурността на данните, което е особено важно за продуктите, насочени към предприятия и бизнеси.

Моделът ще даде тласък на различни сектори, включително здравеопазване, образование и бизнес, като предоставя нови възможности за иновации. Gemini ще бъде представен на широката общественост през следващите месеци, като Google планира редица демонстрации и обучения за разработчици и потребители.

Как да го ползваме сега

Google пусна своя модел на изкуствен интелект Gemini в 170 страни чрез Bard на 8 декември. Ако искате да използвате Google Gemini AI, първата стъпка е да попитате Bard за текущия използван модел на езика. След като потвърдите, че Bard във вашата локация е актуализиран с Gemini AI, може да започнете да използвате най-новия езиков модел на Google. Ето как става това:

1. Посетете уебсайта на чатбота Bard.

2. Влезте с вашия Google акаунт.

3. След като влезете, започнете да взаимодействате с Bard по обичайния начин.

4. По време на разговора си можете изрично да посочите, че искате да използвате Gemini за конкретни задачи. Например може да кажете: "Хей, Bard, можеш ли да използваш Gemini, за да ми помогнеш да напиша стихотворение за българската политика?"

Bard ще използва възможностите на Gemini, за да ви помогне с вашата заявка. Имайте предвид, че Gemini AI е достъпен само на английски език в настройките на Bard Chatbot, но според последния блогпост на Google компанията планира скоро да разшири обхвата си и на други езици.