реклама
Теги → искусственный интеллект
Быстрый переход

Google представил сверхбыструю ИИ-модель Gemini 1.5 Flash

Google продолжает расширять свою линейку моделей искусственного интеллекта Gemini. На стартовавшей вчера конференции Google I/O компания анонсировала новую модель, ориентированную на задачи, в которых требуется высокая скорость — Gemini 1.5 Flash. Модель способна обрабатывать данные практически молниеносно, без задержек.

 Источник изображения: Google

Источник изображения: Google

По словам вице-президента Google Labs Джоша Вудворда (Josh Woodward), Gemini 1.5 Flash оптимизирована для «узких, приоритетных задач, где требуется низкая задержка». Нейросеть способна обрабатывать текст, изображения и видео с высокой скоростью. Это делает её идеальной для приложений, требующих мгновенных ответов в режиме реального времени, например для общения с пользователями или клиентами, или мгновенной генерации простых изображений, сообщает издание The Verge.

В то же время для задач, не требующих молниеносных ответов, лучше подойдет обновленная модель Gemini 1.5 Pro. Она может анализировать большие объемы текста, делать обобщения и переводы. Gemini 1.5 Pro также получила расширенные возможности машинного логического рассуждения и написания программного кода. Обе модели используют контекстное окно в 1 миллион токенов, что позволяет учитывать больше информации при генерации ответов. Для сравнения, контекстное окно GPT-4 составляет 128 000 токенов.

Помимо AI Studio, Gemini 1.5 Pro скоро станет доступна и в Google Workspace. Пользователи смогут использовать возможности модели в почте Gmail и PDF-документах. А подписчики расширенной версии Gemini Advanced получат доступ к модели на 35 языках.

Обе модели будут доступны через Google AI Studio и Gemini API в более чем 200 странах, включая Европейский Союз, Великобританию и Швейцарию.

Google анонсировала Gemma 2 — открытую ИИ-модель с 27 млрд параметров

Сегодня началась ежегодная конференция для разработчиков Google I/O, в рамках которой уже было представлено немало любопытных новинок, таких как серверный ИИ-процессор Trillium и генератор изображений Imagen 3. Вместе с этим разработчики анонсировали скорое появление модели искусственного интеллекта Gemma 2 с открытым исходным кодом, которая включает 27 млрд параметров. Её запуск должен состояться в июне этого года.

 Источник изображения: techcrunch.com

Источник изображения: techcrunch.com

Ранее в этом году Google выпустила версии Gemma 2B и Gemma 7B с 2 млрд и 7 млрд параметров соответственно. Появление версии ИИ-модели с 27 млрд параметров можно назвать существенным продвижением в развитии этого алгоритма. Во время презентации вице-президент Google Labs Джош Вудворд (Josh Woodward) рассказал, что ИИ-модели Gemma были загружены более «миллиона раз» в разные сервисы, где и продолжают работать. Он подчеркнул, что новая версия нейросети Gemma 2 предложит лучшую в отрасли производительность в компактных размерах благодаря оптимизации для работы на графических процессорах Nvidia следующего поколения или одном хосте Google Cloud TPU в сервисе Vertex AI.

Размер большой языковой модели может отойти на второй план, если окажется, что она работает не слишком качественно. Google ещё не раскрыла подробностей касательно алгоритма Gemma 2. Это означает, что оценить его качество, вероятно, можно будет только после того, как ИИ-модель попадёт в руки разработчиков. По заявлениям Google, ИИ-модель Gemma 2 превосходит в плане производительности вдвое более крупные модели.

Google представила мощнейший серверный ИИ-процессор Trillium — почти в пять раз быстрее предшественника

В рамках конференции Google I/O компания Google представила шестое поколение своего фирменного тензорного процессора (Tensor Processing Unit) с кодовым названием Trillium. Он предназначен для центров обработки данных, ориентированных на работу с искусственным интеллектом. По словам компании, новый чип почти в пять раз производительнее предшественника.

 Источник изображения: The Verge

Источник изображения: The Verge

«Промышленный спрос на компьютеры для машинного обучения вырос в миллион раз за последние шесть лет и каждый год продолжает увеличиться в десять раз. Я думаю, что Google была создана для этого момента. Мы являемся новаторами в разработке чипов для искусственного интеллекта уже более десяти лет», — заявил генеральный директор Alphabet Сундар Пичаи (Sundar Pichai) в разговоре с журналистами.

Разрабатываемые Alphabet, материнской компанией Google, специализированные чипы для центров обработки данных, ориентированных на ИИ, представляют собой одну из немногих жизнеспособных альтернатив решениям компании Nvidia. Вместе с программным обеспечением, оптимизированным для работы с тензорными процессорами Google (TPU), эти решения позволили компании занять значительную долю на рынке.

По данным издания Reuters, Nvidia по-прежнему доминирует на рынке чипов для ИИ-дата-центров с долей 80 %. Значительная часть от оставшихся 20 % приходятся на различные версии TPU от Google. В отличие от Nvidia, компания Google не продаёт свои процессоры, а использует их сами и сдаёт в аренду облачные вычислительные платформы, которые на них работают.

Для шестого поколения TPU под названием Trillium компания заявляет прибавку вычислительной производительности в 4,7 раза по сравнению с TPU v5e в задачах, связанных с генерацией теста и медиаконтента с помощью больших языковых моделей ИИ (LLM). При этом Trillium на 67 % энергоэффективнее, чем TPU v5e, отмечают в компании. Как пишет портал TechCrunch, значительного увеличения производительности у Trillium компания смогла добиться благодаря увеличения количества используемых матричных умножителей (MXU), а также повышения тактовой частоты чипа. Кроме того, компания удвоила для Trillium пропускную способность памяти. Более конкретных технических деталей Trillium не приводится.

Вычислительные мощности нового процессора станут доступны для клиентов облачных сервисов Google к «концу 2024 года», отмечают в компании.

Однако от решений Nvidia компания Google не отказывается. В рамках конференции Google I/O также было заявлено, Google станет одним из первых облачных провайдеров, который с начала будущего года будет предлагать облачные услуги на базе специализированных ИИ-ускорителей нового поколения Nvidia Blackwell.

TikTok тестирует поиск с использованием ИИ

Сервис коротких видео TikTok тестирует новую функцию поиска с использованием генеративного ИИ, получившую название Search Highlights («основные моменты поиска»), сообщает ресурс The Verge.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Теперь в верхней части некоторых страниц результатов поиска TikTok появляется фрагмент с результатами, сгенерированными ИИ, и при нажатии на него открывается новая страница с развёрнутым ответом. В пояснении сообщается, что результаты сгенерированы с использованием ChatGPT, и что TikTok отображает контент, «когда [алгоритм] считает его релевантным для поискового запроса пользователя». На данный момент функция ограничена, и не на все запросы предоставляются результаты поиска, полученные с использованием ИИ.

Как отметил The Verge, у видеосервиса также есть аналогичная функция, которая не помечена как использующая ИИ. Этот перечень тоже отображается вверху результатов поиска, но неясно, откуда взята эта информация. Во всяком случае, TikTok пока не ответил на просьбу ресурса дать комментарии по этому поводу.

Похоже, что TikTok пытается использовать появившуюся у отдельных пользователей, особенно молодых людей, привычку использовать видеосервис в качестве поисковой системы, предпочитая с его помощью находить ответы на интересующие вопросы. И теперь TikTok опирается на результаты поиска с ИИ, добавляя их над контентом авторов, чтобы ещё больше заинтересовать аудиторию в использовании видеосервиса.

Власти рекомендовали китайским техногигантам отдавать предпочтение ускорителям вычислений местной разработки

Само по себе стремление китайских компаний добиться технологического суверенитета в сфере разработки и выпуска ускорителей вычислений не является новостью, та же Huawei давно предлагает свои ускорители семейства Ascend, но в производительности они до сих пор уступали решениям Nvidia. Теперь продвигать ускорители китайской разработки взялись власти страны, рекомендуя участникам рынка воздерживаться от покупки продукции Nvidia.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

Напомним, что власти США планомерно ограничивают ассортимент поставляемых в КНР по легальным каналам ускорителей вычислений Nvidia, и последняя волна таких ограничений к началу этого года породила специальные решения для Китая: H20, L20 и L2, которые соответствуют требованиям США в области экспортного контроля. Теперь китайские регуляторы, как сообщает The Information со ссылкой на представителей китайских компаний технологического сектора (ByteDance, Tencent, Alibaba и Baidu), рекомендуют им ограничить закупки ускорителей вычислений иностранного производства и отдавать предпочтение отечественным.

При этом H20 — наиболее производительное из доступных в Китае решений Nvidia, в Китае можно заказывать с марта этого года, и некоторые местные компании успели понять, что купив достаточное количество таких ускорителей, они смогут в значительной степени компенсировать отсутствие доступа к более производительным решениям этой марки. Китайские компании уже заказали в поставку не менее 350 000 ускорителей H20 на общую сумму около $4 млрд, хотя она и меньше прошлогодних $5 млрд, направленных на закупку более производительных ускорителей. Рекомендация правительства КНР покупать больше китайских ускорителей поступила ещё несколько месяцев назад, но пока сложно судить, насколько сильно она изменит расстановку сил на китайском рынке.

Для самой Nvidia подобные рекомендации являются потенциальным источником снижения выручки на китайском рынке, даже без учёта американских санкций как таковых. Если в 2023 фискальном году Китай отвечал за 19 % всей выручки компании, то в 2024 фискальном году эта доля сократилась до 14 %. Рекомендации властей КНР должны ударить и по доходам компаний Intel и AMD, также поставляющим в Китай определённый ассортимент ускорителей вычислений.

OpenAI обновила интерфейс ChatGPT — теперь это чёрная дыра

OpenAI обновила интерфейс ChatGPT, сделав его минималистичным. Теперь пользователь будет «общаться» с большой чёрной точкой, которая изменяется в зависимости от происходящих событий. Когда ИИ говорит, круг меняется, визуально усиливая ощущение диалога и взаимодействия.

 Источник изображения: OpenAI

Источник изображения: OpenAI

По словам технического директора OpenAI Миры Мурати (Mira Murati), новый интерфейс должен свести к минимуму отвлекающие факторы, чтобы пользователи могли полностью сосредоточиться на диалоге с ИИ. Чёрный круг, выступающий в роли собеседника, превращается в стилизованные волны звука, когда ChatGPT даёт ответ. Это визуально усиливает у пользователя ощущение коммуникации.

Интересно, что выбор минималистичного дизайна в духе Apple может показаться смелым и неожиданным, но, похоже, он основан на тщательном анализе. Более яркие цвета или образ человека могут отвлекать и даже вызывать дискомфорт, а вот нейтральный чёрный круг, как считают разработчики OpenAI, универсален и легко адаптируем для отображения в дальнейшем новых функций ChatGPT.

При этом такая простая геометрическая форма помогает избежать самых тревожных ассоциаций с «всевидящим и всезнающим» ИИ из мира научной фантастики. Например, нельзя не вспомнить компьютер HAL 9000 с его красным «глазом» из фильма Стэнли Кубрика «Космическая одиссея 2001 года». Или же суперкомпьютер-провидец «Небесная машина» из романов Артура Кларка (Arthur Clarke), который фактически управлял всем человечеством.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как отмечает Techcrunch, упрощенный интерфейс, основанный на простой форме, похоже, хорошо вписывается в общий тренд в индустрии ИИ. Компании вроде Apple, Meta и другие также экспериментируют с минималистичными аватарками для своих голосовых помощников. По сравнению с некоторыми из них, круг ChatGPT выглядит даже довольно скромно.

Пока обновленный интерфейс будет доступен только для настольных и мобильных приложений ChatGPT. В веб-версии по-прежнему используется стандартный текстовый интерфейс.

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

Представители британской прессы заявили, что нововведения Apple iOS оставят их без средств к существованию

Операционная система Apple iOS 18 ещё не представлена, но обсуждаемые нововведения затрагивают интересы целых отраслей, поэтому представители британской прессы обратились к американской компании с призывом внимательно оценить последствия внедрения новых способов блокировки онлайн-рекламы для пользователей и инструмента для автоматического редактирования статей.

 Источник изображения: Unsplash, Austin Distel

Источник изображения: Unsplash, Austin Distel

Как сообщает Financial Times, члены ассоциации News Media Association, которая объединяет около 900 изданий, выразили свою обеспокоенность перспективами появления в iOS 18 основанных на искусственном интеллекте функций, блокирующих в браузере Safari рекламу и автоматически удаляющих тот или иной контент. Представители британской прессы озабочены тем, что блокировка рекламы сократит и без того измельчавший в последние годы финансовый поток, поддерживающий интернет-издания на плаву. Письмо подписано рядом крупных СМИ, включая The Times, The Guardian и The Daily Telegraph.

С одной стороны, представители прессы заявили об угрозе для своих доходов со стороны блокирующего рекламу инструмента. С другой стороны, они возмутились потенциальной автоматической цензурой, которая будет удалять те или иные фрагменты публикаций, тем самым противореча редакционной политике. Авторы письма попытались внушить Apple мысль о существовании угрозы для британской журналистики в целом, призвав компанию не лишать свою аудиторию такого важного канала получения информации.

Политика Apple по защите персональной информации пользователей и неприкосновенности их частной жизни постепенно привела к потере эффективности некоторых алгоритмов, которые использовались рекламодателями для более точного позиционирования своих товаров и услуг среди интернет-аудитории. Соответственно, рекламодатели снизили финансирование этого канала продвижения своих товаров и услуг, и на интернет-изданиях это уже сказалось отрицательным образом. Поддержка новостного бизнеса со стороны администрации определённых социальных сетей тоже ослабла, ухудшая и без того незавидное положение интернет-изданий. Раздражение представителей СМИ вызывает и тот факт, что социальные сети часто используют публикации интернет-изданий для привлечения и наращивания своей аудитории, а первоисточники в этом случае почти не получают выгоды.

В Великобритании запустили платформу для оценки безопасности ИИ

Британский Институт безопасности ИИ (AISI), созданный в ноябре 2023 года, запустил платформу Inspect, предназначенную для тестирования и оценки безопасности ИИ. Она упростит оценку ИИ для применения в промышленных, исследовательских и научных организациях.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Набор инструментов Inspect, доступный по лицензии с открытым исходным кодом, включая лицензии MIT, предназначен для оценки определённых возможностей моделей ИИ в различных сферах, включая основные знания моделей и способность рассуждать, и выработки оценки на основе полученных результатов.

По данным ресурса TechCrunch, платформа Inspect состоит из трех основных компонентов: наборов данных, инструментов решения и инструментов оценки. Наборы данных предоставляют образцы для оценочных тестов. Инструменты решения выполняют работу по проведению тестов. А инструменты оценки оценивают результаты и суммируют баллы тестов в метрики.

Компоненты Inspect можно дополнить с помощью сторонних пакетов, написанных на Python. «Мы надеемся, что глобальное сообщество ИИ будет использовать Inspect не только для проведения собственных испытаний на безопасность моделей, но и для адаптации и развития платформы с открытым исходным кодом, чтобы мы могли производить высококачественные оценки по всем направлениям», — заявил председатель AISI Ян Хогарт (Ian Hogarth).

Платформа Inspect была представлена спустя несколько дней после того, как Национальный институт стандартов и технологий США (The National Institute of Standards and Technology, NIST) анонсировал в конце апреля программу NIST GenAI, предназначенную для оценки различных технологий генеративного ИИ, включая модели, генерирующие текст и изображения.

В апреле США и Великобритания объявили о партнёрстве, в рамках которого «правительства будут обмениваться техническими знаниями, информацией и талантливыми специалистами в области безопасности ИИ». В рамках сотрудничества в США будет создан институт безопасности ИИ, который займётся оценкой рисков, связанных с ИИ и генеративным ИИ.

OpenAI представит ИИ-ассистента с пониманием сарказма и добавит в ChatGPT звонки

Компания OpenAI может вскоре представить цифрового помощника с поддержкой мультимодального искусственным интеллектом. Как сообщает ресурс The Information, новый ассистент OpenAI способен даже распознать сарказм.

 Источник изображения: Mariia Shalabaieva/unsplash.com

Источник изображения: Mariia Shalabaieva/unsplash.com

По данным источников The Information, OpenAI продемонстрировала ряду клиентов новую мультимодальную ИИ-модель, способную как вести диалог с пользователем, так и распознавать объекты. Не исключено, что она будет представлена завтра, 13 мая, на мероприятии, которое начнётся в 20:00 мск.

Новая модель обеспечивает более быструю и точную интерпретацию изображений и аудио по сравнению с существующими ИИ-моделями для транскрипции или преобразования текста в речь. Как предполагает The Information, она может помочь сотрудникам службы поддержки клиентов «лучше понимать интонацию голосов звонящих или то, саркастичны ли они». «Теоретически» модель может помочь студентам в решении задач по математике или переводе реальных обозначений. По словам источников ресурса, новая ИИ-модель может превзойти GPT-4 Turbo в «ответах на некоторые типы вопросов», но все же будет более склонна к ошибочным решениям.

По словам разработчика Ананая Ароры (Ananay Arora), OpenAI также готовится добавить чат-боту ChatGPT функцию телефонных звонков. Арора утверждает, что нашёл доказательства того, что OpenAI уже предусмотрела использование серверов для аудио- и видеосвязи в реальном времени.

Следует отметить, что этой функции не будет у модели GPT-5, если её вдруг представят на следующей неделе, поскольку гендиректор Сэм Альтман (Sam Altman) отрицает тот факт, что предстоящее мероприятие будет иметь какое-либо отношение к последователю ИИ-модели GPT-4. Он также опроверг слухи о том, что компания на следующей неделе представит новую поисковую систему на базе ИИ.

Arm разработает собственный ИИ ускоритель — его массовое производство запустят в 2025 году

Базирующаяся в Великобритании компания Arm, 90 % которой принадлежит японскому конгломерату SoftBank Group, займётся разработкой ИИ-ускорителй, для чего будет сформировано отдельное подразделение, пишет ресурс Nikkei Asia. Как ожидается, первый прототип ИИ-чипа Arm будет готов к весне 2025 года, а уже осенью будет запущено его массовое производство, которым будут заниматься контрактные производители.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Гендиректор SoftBank Масаёси Сон (Masayoshi Son) решил преобразовать свою компанию в крупного игрока ИИ-рынка, на что готов выделить как минимум 10 трлн иен (около $64 млрд). Как сообщается, Arm возьмёт на себя первоначальные траты на разработку ИИ-чипа, которые могут достичь сотен миллиардов иен, но при этом SoftBank также внесёт свой вклад в финансирование проекта. Как только будет запущено массовое производство, новый бизнес могут передать в управление SoftBank.

По данным Nikkei Asia, SoftBank уже ведёт переговоры с TSMC и другими контрактными производителями, чтобы забронировать необходимые производственные мощности. Масаёси Сон также провёл встречи с руководителями ряда компаний, чтобы заручиться поддержкой в реализации проекта.

В соответствии с представлениями Сона о революции ИИ, SoftBank планирует объединить новейшие технологии ИИ, полупроводников и робототехники, чтобы стимулировать инновации в различных отраслях. В основу проекта лягут ИИ-ускорители, способные обрабатывать большие объёмы данных.

Уже в 2026 году SoftBank планирует построить ЦОД, оснащённые чипами собственного производства, в США, Европе, Азии и на Ближнем Востоке. Поскольку ЦОД потребуется огромное количество электроэнергии, SoftBank также будет заниматься производством электроэнергии. Компания собирается строить ветряные и солнечные электростанции, при этом уделяя особое внимание термоядерным технологиям следующего поколения.

В прошлом SoftBank уже не раз меняла основной бизнес, чтобы идти в ногу с технологическими трендами. В конце 1990-х годов она управляла интернет-бизнесом через совместное предприятие с Yahoo в США, в конце 2000-х годов переключилась на мобильный бизнес, приобретя британскую компанию Vodafone и американскую Spring. Теперь SoftBank пытается трансформироваться в группу, ориентированную на ИИ.

По данным Precedence Research of Canada, в настоящее время ИИ-рынок оценивается в $30 млрд и к 2029 году превысит $100 млрд, а к 2032 году — $200 млрд. Лидирующая сейчас на рынке Nvidia не может удовлетворить растущий спрос и SoftBank видит в этом для себя большие возможности.

Meta✴ использует для обучения ИИ контент из Instagram✴ и Facebook✴

В то время как технологические компании, занимающиеся разработкой ИИ, находятся в поиске источников данных для обучения своих ИИ-моделей, у Meta, как оказалось, есть большое преимущество перед ними, поскольку она может использовать для этих целей контент Instagram и Facebook. Об этом сообщил директор по продукту Meta Крис Кокс (Chris Cox) на саммите Bloomberg Tech Summit, прошедшем на этой неделе.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Крис Кокс уточнил, что Meta использует для обучения своего генератора изображений по текстовым запросам на базе ИИ общедоступные фотографии и текст из Instagram и Facebook. «Мы не тренируемся на личных данных, мы не тренируемся на данных, которыми люди делятся со своими друзьями, мы тренируемся на публичных данных», — сказал он.

Крис Кокс отметил, что Meta AI позволяет создавать изображения «действительно потрясающего качества», поскольку в Instagram много фотографий «искусства, моды, культуры, а также просто изображений людей и нас». Чтобы создать изображение с помощью Meta AI, пользователю достаточно набрать запрос, начинающийся со слова «нарисовать», и, как указано на сайте сайт Meta.ai, он сгенерирует четыре изображения.

Для получения данных, используемых для обучения ИИ, компании объединяют усилия с другими фирмами. Например, OpenAI договорилась о сотрудничестве с несколькими СМИ, чтобы лицензировать их контент для разработки своих ИИ-моделей. В свою очередь, Meta рассматривала возможность приобретения издательства Simon & Schuster, чтобы получить больше данных для обучения собственных ИИ-моделей, сообщила в прошлом месяце газета The New York Times.

Помимо наборов необработанных данных, компании используют так называемые «петли обратной связи», представляющие собой процесс использования результатов работы системы ИИ и соответствующих действий конечного пользователя для переобучения и улучшения моделей.

Гендиректор Meta Марк Цукерберг (Mark Zuckerberg) ранее заявил, что циклы обратной связи будут «более ценными», чем любой «предварительный контент».

Глава OpenAI опроверг слухи о запуске ИИ-поисковика на следующей неделе

Глава OpenAI Сэм Альтман (Sam Altman) опроверг сообщение Reuters о том, что компания в следующий понедельник, за день до конференции Google I/O, представит свой собственный ИИ-поисковик, который будет позиционироваться как потенциальный конкурент поисковику Google и ИИ-поисковику стартапа Perplexity.

 Источник изображения: OpenAI

Источник изображения: OpenAI

На своей станице в соцсети X Альтман подтвердил, что компания действительно собирается представить некий новый продукт, который, по его мнению, «ощущается словно магия», но это «не GPT-5 и не поисковый движок».

Альтман также ретвитнул сообщение официального канала OpenAI, в котором говорится, что компания в понедельник, в 10:00 утра по местному времени (20:00 мск) расскажет о свежих обновлениях для чат-бота ChatGPT и языковой модели GPT-4.

По информации The Verge, OpenAI активно пытается переманивать сотрудников Google в свою команду, которая ведёт разработку некоего нового продукта. Издания Bloomberg и The Information ранее сообщали, что речь может идти о разработке поисковой системы.

Появление функций ChatGPT в iOS 18 — вопрос почти решённый

Сфера систем искусственного интеллекта с точки зрения практического его использования и реализации разного рода сотрудничества в последнее время полна событиями как более или менее явными, так и скрытыми. К последним Bloomberg относит почти достигнутую Apple договорённость об использовании чат-бота ChatGPT компании OpenAI в операционной системе iOS 18.

 Источник изображения: Unsplash, Solen Feyissa

Источник изображения: Unsplash, Solen Feyissa

Об этом событии агентство Bloomberg традиционно сообщает со ссылкой на собственные источники, но с учётом близости конференции для разработчиков WWDC 2024, которая начнёт работу в середине июня, подобная новость достаточно скоро может получить официальное подтверждение. По данным источника, Apple и OpenAI уже находятся на заключительных этапах подписания соглашения о сотрудничестве, которое позволит первой использовать элементы ChatGPT в операционной системе Apple iOS 18. Попутно отмечается, что переговоры Apple с Google о внедрении чат-бота Gemini в экосистему первой из компаний успехом пока не увенчались, хотя попытки продолжаются.

Как поясняет Bloomberg, на данном этапе нет твёрдых гарантий, что о соглашении между Apple и OpenAI будет объявлено официально в ближайшие недели, но скорое начало конференции WWDC 2024 вполне предсказуемо подгоняет первую из сторон. Сотрудничество с OpenAI может стать одним из шагов Apple по развитию собственной экосистемы искусственного интеллекта. Ранее сообщалось, что она собирается не только развивать способность фирменных процессоров ускорять работу искусственного интеллекта с использованием аппаратных ресурсов клиентских устройств, но и до конца года внедрить процессоры M2 Ultra в серверную инфраструктуру соответствующего назначения. При этом часть облачной экосистемы Apple продолжит опираться на мощности сторонних провайдеров из соображений экономической целесообразности.

Apple обновит Siri: виртуальный помощник устарел и отстаёт от конкурентов

Компания Apple осознала, что её виртуальный помощник Siri безнадёжно отстаёт от конкурентов, в частности от ChatGPT, разработанного OpenAI. Это привело к масштабной реорганизации внутри компании и срочным усилиям по модернизации Siri с использованием новейших технологий ИИ. Apple сосредоточится на улучшении существующей функциональности Siri, а не на создании нового чат-бота.

 Изображение: Kandinsky

Изображение: Kandinsky

В начале прошлого года топ-менеджеры Apple по программному обеспечению пришли к выводу, что виртуальный помощник Siri нуждается в переменах. Siri слишком часто неправильно понимает вопросы и не может вести диалоги. Поводом для этого стало тестирование нового чат-бота ChatGPT компании OpenAI. Использование передовых технологий генеративного искусственного интеллекта, способного создавать стихи, код и вести диалог с пользователями, заставило Siri выглядеть устаревшей.

Осознав отставание Siri, руководство Apple во главе с Тимом Куком (Tim Cook) решило сделать модернизацию виртуального помощника приоритетным проектом компании и догнать конкурентов в сфере AI любой ценой. Apple уже работает над тем, чтобы виртуальный помощник смог вести диалог по принципу чат-ботов, а не просто отвечать на отдельные запросы. Сможет ли Siri сочинять стихи и писать код, пока не известно. В любом случае, все подробности станут известны на ежегодной конференции Apple для разработчиков 10 июня.

Стоит отметить, что модернизация Siri — это лишь часть более масштабных планов Apple по интеграции технологий генеративного ИИ в свои продукты и сервисы. В частности, компания планирует увеличить объём памяти в новых моделях iPhone, чтобы поддерживать расширенные возможности Siri. Кроме того, обсуждается приобретение лицензий на использование передовых моделей ИИ таких компаний как Google, Cohere и OpenAI.

Как сообщает The New York Times, топ-менеджмент Apple обеспокоен тем, что новые технологии ИИ могут подорвать доминирующие позиции компании на рынке смартфонов. В частности, есть опасения, что генеративный ИИ может со временем стать альтернативной мобильной операционной системой, вытеснив полностью iOS. Кроме того, ИИ открывает путь для создания экосистемы «интеллектуальных агентов», способных заменить множество приложений из AppStore.

Чтобы не допустить такого развития событий, Apple решила сконцентрироваться на усилении собственных позиций в сфере ИИ. В частности, не так давно компания отменила проект по созданию беспилотных автомобилей стоимостью 10 млрд долларов и вместо этого сотни инженеров были переведены на разработку в области ИИ.

Хотя Apple не планирует создавать аналог ChatGPT, основные усилия сосредоточены на расширении возможностей Siri как помощника для решения повседневных задач. Помимо улучшенного диалога, обновленная Siri сможет точнее устанавливать таймеры, планировать встречи, составлять списки покупок и резюмировать тексты. При этом в Apple подчёркивают, что новая Siri будет более приватной, чем конкурирующие ИИ, так как обработка запросов будет производиться непосредственно на iPhone, а не на удалённых серверах.

window-new
Soft
Hard
Тренды 🔥
Paradox перенесла на неопределённый срок симулятор жизни Life by You от команды ветерана The Sims, но игроки даже рады 2 ч.
Кибершпионаж на дне океана: США заподозрили Китай в краже данных через морские интернет-кабели 3 ч.
«Пять лет разработки пролетели как один миг»: стратегия Songs of Conquest в духе «Героев Меча и Магии» попрощалась с ранним доступом и взяла курс на консоли 3 ч.
Флибустьеры поневоле: в 2024 году почти три четверти российских игроков оказались пиратами 5 ч.
«Образ Джокера на Железном троне останется со мной навсегда»: релизный трейлер MultiVersus взбудоражил фанатов перед воскрешением игры 6 ч.
Подписка требует жертв: инсайдеры предупредили о подорожании Game Pass из-за Call of Duty 7 ч.
OpenAI отключила в ChatGPT голос Sky в из-за удивительного сходства с голосом Скарлетт Йоханссон 7 ч.
Google обвинила Microsoft в неспособности защитить клиентов от кибератак 7 ч.
Опубликованы первые тесты видеокарт в бенчмарке 3DMark Steel Nomad, который выйдет завтра 8 ч.
Гендиректор Take-Two: Rockstar постарается выпустить GTA VI без багов, но это не главное 11 ч.
Новая статья: Обзор ноутбука Digma Pro Breve: максимум производительности в бюджетном сегменте 34 мин.
Microsoft анонсировала планшет Surface Pro с Arm-процессоом Snapdragon X и множеством ИИ-функций 2 ч.
Intel рассказала, насколько процессоры Lunar Lake будут быстрее конкурентов 2 ч.
Antec выпустит портативную приставку Core HS — это переименованная и подешевевшая AyaNeo Slide 3 ч.
Microsoft отказалась от AI PС и представила Copilot Plus PC — ИИ-ноутбуки будущего 4 ч.
NASA доставит на Марс европейский ровер «Розалинд Франклин» вместо «Роскосмоса» 5 ч.
FPGA с HBM2e: AMD без лишнего шума выпустила ускоритель Alveo V80 стоимостью всего $9,5 тыс. 6 ч.
Asus выпустила первый в мире WOLED-монитор с глянцевым экраном без бликов — 26,5-дюймовый ROG Strix OLED XG27AQDMG 6 ч.
HMD Global готовит смартфон с дизайном легендарного Nokia Lumia 920 6 ч.
В погоне за ИИ: большинство строящихся в Северной Америке ЦОД арендуют ещё до того, как они готовы, несмотря на рост цен 7 ч.