Google представила два новых TPU одновременно, впервые разделив чипы для обучения и инференса, корпоративные AI-агенты запускаются повсеместно

Google представила два новых TPU одновременно, впервые разделив чипы для обучения и инференса, корпоративные AI-агенты запускаются повсеместно

华尔街见闻2026/04/22 13:03

Показать оригинал

Автор:华尔街见闻

Bitget предлагает комплексные решения для торговли криптовалютами, акциями и золотом. Торгуйте сейчас!

Приветственный бонус 6,200 USDT для новых пользователей! Зарегистрироваться

Google Cloud, входящий в состав Alphabet, на ежегодной конференции разработчиков представил сразу множество новинок, одновременно выпустив новое поколение собственных чипов и набор корпоративных AI-агентов, бросив тем самым вызов одновременно Nvidia, OpenAI и Anthropic как на аппаратном, так и на программном фронте.

В среду по местному времени на конференции Google Cloud Next 2026 в Лас-Вегасе Google Cloud анонсировал две новые разработки восьмого поколения тензорных процессоров (TPU): TPU 8T, специально предназначенный для обучения AI-моделей, и TPU 8i, оптимизированный под задачи вывода (inference), которые ожидаются в продаже позже в этом году. Это первый случай, когда Google разделил задачи обучения и вывода на разные чипы, что свидетельствует о значительном изменении стратегии AI-оборудования компании.

Google представила два новых TPU одновременно, впервые разделив чипы для обучения и инференса, корпоративные AI-агенты запускаются повсеместно image 0

Одновременно Google выпустил целый ряд инструментов для разработки AI-агентов, включая платформу Gemini Enterprise Agent Platform, напрямую нацеленных на рынок корпоративной автоматизации.

Презентация новых чипов происходит на фоне стремительного роста спроса на AI-инференс. Вице-президент по облачным вычислениям и AI-инфраструктуре Google Марк Ломейер заявил: "Ключевой вопрос — как добиться минимальной задержки отклика при минимальных издержках на одну транзакцию. Объем транзакций резко увеличивается, а стоимость каждой операции должна значительно снижаться для масштабирования". Обе новинки появятся в продаже позднее в этом году.

Разделение обучения и вывода: качественный скачок в производительности чипов

Решение Google разделить восьмое поколение TPU на две независимые разработки — это прямая реакция на растущую дифференциацию AI-рабочих нагрузок.

Старший вице-президент Google и главный технический директор по AI и инфраструктуре Амин Вахдат в своем блоге написал: "С развитием AI-агентов мы считаем, что отрасль получит выгоду от чипов, специально оптимизированных под разные задачи — обучение и вывод."

TPU 8t оптимизирован для обучения AI-моделей и способен "сократить цикл разработки передовых моделей с нескольких месяцев до нескольких недель".

С точки зрения производительности, энергоэффективность TPU 8t на ватт увеличилась на 124% по сравнению с предыдущим поколением, TPU 8i — на 117%. По сравнению с моделью седьмого поколения Ironwood TPU, представленной в ноябре прошлого года, TPU 8t при той же цене демонстрирует прирост производительности в 2,8 раза, а TPU 8i — на 80%.

Модуль для обучения TPU 8t позволяет собрать систему из 9600 чипов — по данным Google, именно энергопотребление становится ключевым ограничением для столь масштабных систем в дата-центрах, и улучшение энергоэффективности чрезвычайно важно.

TPU 8i преимущественно ориентирован на задачи вывода и подходит для работы с AI-моделями и выполнения задач AI-агентов. Его архитектура акцентирована на высокую емкость встроенной памяти — каждый чип оснащен 384 МБ статической оперативной памяти (SRAM), что в три раза больше, чем у предыдущей Ironwood.

Обе модели планируется вывести на внешний рынок в конце 2026 года.

Генеральный директор Alphabet Сундар Пичаи в своем блоге пояснил, что новая архитектура направлена на то, чтобы "экономично обеспечить необходимую для одновременной работы миллионов агентов огромную пропускную способность и низкие задержки". Увеличение местной памяти позволяет чипу реже обращаться к внешним данным, что особенно важно для AI-задач с многошаговым выводом.

Платформа AI-агентов выводится на полноформатную арену — прямой вызов OpenAI и Anthropic

Со стороны ПО Google представила целый комплекс корпоративных инструментов для работы с AI-агентами, напрямую конкурируя с OpenAI и Anthropic за рынок корпоративных решений.

По информации Bloomberg, многие основатели стартапов говорят, что инженеры в Силиконовой долине для программирования AI обычно выбирают между Claude Code от Anthropic и Codex от OpenAI, тогда как Google даже не рассматривается — эта ситуация вызывает серьезные опасения у высшего руководства Google.

Генеральный директор Google Cloud Томас Курян отметил в блоге: "Речь идет не о предоставлении отдельных модулей, а о полноценной инновационной базисной инфраструктуре."

В новой платформе Gemini Enterprise Agent Platform появились функции Memory Bank и Memory Profile, позволяющие агентам запоминать историю взаимодействия с пользователем и компенсировать проблемы с короткой памятью ранее существовавших AI-инструментов; функция Agent Simulation дает разработчикам возможность тщательнее тестировать свой инструмент до релиза.

Также Google запустила платформу для совместной работы Projects, объединяющую данные из Workspace, Microsoft OneDrive и внутренних корпоративных мессенджеров, обеспечивая агентов необходимым контекстом. Кроме этого, компания выпустила приложение Gemini Enterprise для рядовых сотрудников, позиционируя его как "AI-помощник для каждого сотрудника" — пользователи могут создавать агентов без написания кода.

Ускоряется внедрение TPU, параллельно продолжается кооперация с Nvidia

Несмотря на то, что Google наращивает инвестиции в собственные чипы, сотрудничество с Nvidia продолжается.

Марк Ломейер уточнил, что Google планирует стать одной из первых компаний, кто начнет внедрение новых чипов Nvidia во второй половине этого года, и по-прежнему будет поддерживать клиентов, желающих работать на системах Nvidia.

Параллельно коммерческое использование TPU от Google также ускоряется.

Hedge-фонд Citadel Securities уже построил программное обеспечение для квантативных исследований на базе TPU от Google, а все 17 национальных лабораторий Министерства энергетики США используют AI-софта для научного сотрудничества, созданное на TPU. Компания Meta подписала с Google многолетний контракт стоимостью в несколько миллиардов долларов на использование TPU, а AI-стартап Anthropic также пообещал задействовать вычислительные мощности TPU от Google в гига-ваттном масштабе.

По оценкам аналитика DA Davidson, озвученным в сентябре прошлого года, совокупная стоимость бизнеса TPU и подразделения Google DeepMind AI составляет около 900 миллиардов долларов.

Стоит отметить, что Google не приводил прямых сравнений производительности новых чипов с продукцией Nvidia. Со своей стороны, Nvidia готовит к запуску новое семейство чипов, включающее технологии Groq, приобретённые за 20 миллиардов долларов, специально для задач с ультранизкой задержкой вывода.

Генеральный директор Nvidia Хуанг Жэньсюнь ранее заявлял, что более 20% AI-рабочих нагрузок могут оказаться наиболее эффективными именно на таких чипах. Groq был основан в 2016 году группой бывших инженеров Google.

Для дальнейшего расширения доступа к TPU Google уже тестирует внедрение TPU в дата-центры клиентов и повышение совместимости с программными инструментами сторонних разработчиков. Однако основными неопределенностями при масштабировании остаются ограничения поставок чипов, а также разрыв между быстрым развитием AI-моделей и многолетними циклами проектирования оборудования.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!

Вам также может понравиться

FIDA выросла более чем на 80% за 24 часа: объемы торгов в экосистеме Solana резко увеличились

Bitget Pulse•2026/05/20 19:52

BDXN за 24 часа колебался на 48,2%: типичные резкие колебания токена с низкой капитализацией, нет явных новостей или событий на блокчейне.

Bitget Pulse•2026/05/20 19:30

PHB за 24 часа колебался на 40,7%: новость о делистинге на бирже продолжает вызывать сильные колебания

Bitget Pulse•2026/05/20 18:36

LABNEW за 24 часа колебался на 22,8%: V-образный отскок, вызванный накоплением китов, в сочетании с последствиями предыдущего распределения токенов

Bitget Pulse•2026/05/20 18:03

Google представила два новых TPU одновременно, впервые разделив чипы для обучения и инференса, корпоративные AI-агенты запускаются повсеместно

Разделение обучения и вывода: качественный скачок в производительности чипов

Платформа AI-агентов выводится на полноформатную арену — прямой вызов OpenAI и Anthropic

Ускоряется внедрение TPU, параллельно продолжается кооперация с Nvidia

Вам также может понравиться

Популярное

Цены на крипто