Google представила два новых TPU одновременно, впервые разделив чипы для обучения и инференса, корпоративные AI-агенты запускаются повсеместно
Google Cloud, входящий в состав Alphabet, на ежегодной конференции разработчиков представил сразу множество новинок, одновременно выпустив новое поколение собственных чипов и набор корпоративных AI-агентов, бросив тем самым вызов одновременно Nvidia, OpenAI и Anthropic как на аппаратном, так и на программном фронте.
В среду по местному времени на конференции Google Cloud Next 2026 в Лас-Вегасе Google Cloud анонсировал две новые разработки восьмого поколения тензорных процессоров (TPU): TPU 8T, специально предназначенный для обучения AI-моделей, и TPU 8i, оптимизированный под задачи вывода (inference), которые ожидаются в продаже позже в этом году. Это первый случай, когда Google разделил задачи обучения и вывода на разные чипы, что свидетельствует о значительном изменении стратегии AI-оборудования компании.

Одновременно Google выпустил целый ряд инструментов для разработки AI-агентов, включая платформу Gemini Enterprise Agent Platform, напрямую нацеленных на рынок корпоративной автоматизации.
Презентация новых чипов происходит на фоне стремительного роста спроса на AI-инференс. Вице-президент по облачным вычислениям и AI-инфраструктуре Google Марк Ломейер заявил: "Ключевой вопрос — как добиться минимальной задержки отклика при минимальных издержках на одну транзакцию. Объем транзакций резко увеличивается, а стоимость каждой операции должна значительно снижаться для масштабирования". Обе новинки появятся в продаже позднее в этом году.
Разделение обучения и вывода: качественный скачок в производительности чипов
Решение Google разделить восьмое поколение TPU на две независимые разработки — это прямая реакция на растущую дифференциацию AI-рабочих нагрузок.
Старший вице-президент Google и главный технический директор по AI и инфраструктуре Амин Вахдат в своем блоге написал: "С развитием AI-агентов мы считаем, что отрасль получит выгоду от чипов, специально оптимизированных под разные задачи — обучение и вывод."
TPU 8t оптимизирован для обучения AI-моделей и способен "сократить цикл разработки передовых моделей с нескольких месяцев до нескольких недель".
С точки зрения производительности, энергоэффективность TPU 8t на ватт увеличилась на 124% по сравнению с предыдущим поколением, TPU 8i — на 117%. По сравнению с моделью седьмого поколения Ironwood TPU, представленной в ноябре прошлого года, TPU 8t при той же цене демонстрирует прирост производительности в 2,8 раза, а TPU 8i — на 80%.
Модуль для обучения TPU 8t позволяет собрать систему из 9600 чипов — по данным Google, именно энергопотребление становится ключевым ограничением для столь масштабных систем в дата-центрах, и улучшение энергоэффективности чрезвычайно важно.
TPU 8i преимущественно ориентирован на задачи вывода и подходит для работы с AI-моделями и выполнения задач AI-агентов. Его архитектура акцентирована на высокую емкость встроенной памяти — каждый чип оснащен 384 МБ статической оперативной памяти (SRAM), что в три раза больше, чем у предыдущей Ironwood.
Обе модели планируется вывести на внешний рынок в конце 2026 года.
Генеральный директор Alphabet Сундар Пичаи в своем блоге пояснил, что новая архитектура направлена на то, чтобы "экономично обеспечить необходимую для одновременной работы миллионов агентов огромную пропускную способность и низкие задержки". Увеличение местной памяти позволяет чипу реже обращаться к внешним данным, что особенно важно для AI-задач с многошаговым выводом.
Платформа AI-агентов выводится на полноформатную арену — прямой вызов OpenAI и Anthropic
Со стороны ПО Google представила целый комплекс корпоративных инструментов для работы с AI-агентами, напрямую конкурируя с OpenAI и Anthropic за рынок корпоративных решений.
По информации Bloomberg, многие основатели стартапов говорят, что инженеры в Силиконовой долине для программирования AI обычно выбирают между Claude Code от Anthropic и Codex от OpenAI, тогда как Google даже не рассматривается — эта ситуация вызывает серьезные опасения у высшего руководства Google.
Генеральный директор Google Cloud Томас Курян отметил в блоге: "Речь идет не о предоставлении отдельных модулей, а о полноценной инновационной базисной инфраструктуре."
В новой платформе Gemini Enterprise Agent Platform появились функции Memory Bank и Memory Profile, позволяющие агентам запоминать историю взаимодействия с пользователем и компенсировать проблемы с короткой памятью ранее существовавших AI-инструментов; функция Agent Simulation дает разработчикам возможность тщательнее тестировать свой инструмент до релиза.
Также Google запустила платформу для совместной работы Projects, объединяющую данные из Workspace, Microsoft OneDrive и внутренних корпоративных мессенджеров, обеспечивая агентов необходимым контекстом. Кроме этого, компания выпустила приложение Gemini Enterprise для рядовых сотрудников, позиционируя его как "AI-помощник для каждого сотрудника" — пользователи могут создавать агентов без написания кода.
Ускоряется внедрение TPU, параллельно продолжается кооперация с Nvidia
Несмотря на то, что Google наращивает инвестиции в собственные чипы, сотрудничество с Nvidia продолжается.
Марк Ломейер уточнил, что Google планирует стать одной из первых компаний, кто начнет внедрение новых чипов Nvidia во второй половине этого года, и по-прежнему будет поддерживать клиентов, желающих работать на системах Nvidia.
Параллельно коммерческое использование TPU от Google также ускоряется.
Hedge-фонд Citadel Securities уже построил программное обеспечение для квантативных исследований на базе TPU от Google, а все 17 национальных лабораторий Министерства энергетики США используют AI-софта для научного сотрудничества, созданное на TPU. Компания Meta подписала с Google многолетний контракт стоимостью в несколько миллиардов долларов на использование TPU, а AI-стартап Anthropic также пообещал задействовать вычислительные мощности TPU от Google в гига-ваттном масштабе.
По оценкам аналитика DA Davidson, озвученным в сентябре прошлого года, совокупная стоимость бизнеса TPU и подразделения Google DeepMind AI составляет около 900 миллиардов долларов.
Стоит отметить, что Google не приводил прямых сравнений производительности новых чипов с продукцией Nvidia. Со своей стороны, Nvidia готовит к запуску новое семейство чипов, включающее технологии Groq, приобретённые за 20 миллиардов долларов, специально для задач с ультранизкой задержкой вывода.
Генеральный директор Nvidia Хуанг Жэньсюнь ранее заявлял, что более 20% AI-рабочих нагрузок могут оказаться наиболее эффективными именно на таких чипах. Groq был основан в 2016 году группой бывших инженеров Google.
Для дальнейшего расширения доступа к TPU Google уже тестирует внедрение TPU в дата-центры клиентов и повышение совместимости с программными инструментами сторонних разработчиков. Однако основными неопределенностями при масштабировании остаются ограничения поставок чипов, а также разрыв между быстрым развитием AI-моделей и многолетними циклами проектирования оборудования.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
FIDA выросла более чем на 80% за 24 часа: объемы торгов в экосистеме Solana резко увеличились
PHB за 24 часа колебался на 40,7%: новость о делистинге на бирже продолжает вызывать сильные колебания
