За пределами показателей PUE и WUE — переосмысление показателей эффективности для центров обработки данных на базе искусственного интеллекта
По всей Европе и на Ближнем Востоке внедрение искусственного интеллекта (ИИ) набирает обороты с беспрецедентной скоростью. Гипермасштабируемые компании, операторы колокационных центров, корпоративные центры обработки данных и новые «фабрики ИИ» стремительно расширяют свою ИТ-инфраструктуру для поддержки всё более сложных моделей и огромных массивов данных. Этот всплеск приводит к росту спроса на электроэнергию, в результате чего требования к охлаждению достигают новых экстремальных значений.
Традиционно операторы полагались на показатели эффективности использования электроэнергии (PUE) и эффективности использования воды (WUE) в качестве основных критериев операционной эффективности. Эти показатели долгие годы хорошо служили отрасли — это простые и интуитивно понятные индикаторы того, насколько эффективно объект использует энергию и воду.
Однако современные рабочие нагрузки ИИ, передовые микросхемы и архитектуры с жидкостным охлаждением меняют ситуацию. По мере того как вычислительная мощность становится доминирующим фактором энергопотребления, сообщество специалистов по центрам обработки данных задается вопросом: могут ли показатели PUE и WUE сами по себе в полной мере отражать эффективность, экологическую устойчивость или эксплуатационные характеристики?
Чипы нового поколения, разработанные для ИИ и ускоренных вычислений, работают с тепловыми профилями и характеристиками производительности, значительно отличающимися от традиционных процессоров. Они генерируют гораздо более высокие тепловые нагрузки, в значительной степени зависят от жидкостного охлаждения и обеспечивают кардинально разную вычислительную мощность в зависимости от рабочей температуры.
Это создает три критических вызова для операторов
PUE не учитывает вычислительную мощность
Объект может демонстрировать отличный показатель PUE, но при этом обеспечивать относительно низкую вычислительную производительность. Поскольку, по прогнозам McKinsey & Company, глобальный спрос на вычислительные ресурсы утроится — с 82 ГВт в 2025 году до более чем 220 ГВт к 2030 году — организациям необходимы показатели, учитывающие полезную работу, а не только соотношение потребляемой и выдаваемой энергии.
Изменения климата и системы охлаждения искажают результаты измерений
Центры обработки данных для ИИ, расположенные в жарком климате или в регионах с дефицитом воды, сталкиваются с условиями окружающей среды, которые по своей сути влияют как на показатель PUE, так и на WUE. Объект с высокооптимизированной системой охлаждения может по-прежнему казаться «неэффективным» скорее из-за географических факторов, чем из-за инженерных решений.
Рабочие нагрузки ИИ изменяют взаимосвязь между охлаждением, температурой и производительностью
Чип может «адекватно» работать при более высоких температурах — улучшая показатель PUE за счет сокращения механического охлаждения — но обеспечивать более высокую вычислительную производительность при более низких температурах. В этом случае показатель PUE ухудшается, вычислительная производительность увеличивается, а общая производительность системы растёт. Это противоречие подчеркивает, почему современные показатели не подходят для сред, основанных на ИИ.
Чтобы оценить эффективность современных объектов — особенно тех, которые поддерживают приложения ИИ, гипермасштабируемые и высокоплотные колокационные решения — операторы должны сочетать показатели энерго- и водопотребления с ключевыми показателями эффективности (KPI), ориентированными на вычислительную мощность. Растущий набор передовых показателей обеспечивает более полное и масштабируемое представление о производительности.
• Производительность на ватт (PPW) измеряет вычислительную мощность на единицу энергии. Это комплексный подход к согласованию ИТ-производительности с эффективностью объекта.
• Энергетическая производительность центра обработки данных (DCeP) оценивает , какой объём «полезной работы» (выполненные задачи, обработанные данные и т. д.) производится на каждую единицу потребленной энергии.
• Энергоэффективность вычислений (CPE) отражает вычислительную мощность, обеспечиваемую на единицу энергии. Идеально подходит для операций с интенсивным использованием ИИ.
• Вычисления, пропорциональные энергопотреблению (EPC) оценивают , насколько эффективно система регулирует потребление энергии в зависимости от рабочей нагрузки. Чем ближе энергопотребление соответствует вычислительной нагрузке, тем лучше.
• Экологическая эффективность (GE) связывает вычислительную производительность с углеродным следом, что позволяет принимать решения с учетом принципов устойчивого развития.
• Производительность на литр (PPL) соотносит потребление воды с вычислительной производительностью — это критически важно для регионов, сталкивающихся с нехваткой воды или жестким регулированием.
Почему эти показатели важны
Эти новые показатели позволяют заинтересованным сторонам оценивать не только эффективность использования ресурсов объекта, но и ценность, создаваемую каждым киловаттом, литром и тонной охлаждающей мощности. Они меняют подход операторов к оценке проектных решений, архитектуры систем охлаждения, температур микросхем и стратегий устойчивого развития.
Однако этот расширенный набор инструментов также влечет за собой большую сложность. Слияние таких факторов, как охлаждение высокой плотности, электрификация, стратегия водопользования, передовые системы управления, моделирование и региональные различия в нормативных требованиях, требует более интегрированного подхода.
Комплексный партнер для будущего, основанного на искусственном интеллекте
Для достижения успеха организациям необходим партнер в области инжиниринга и управления тепловым режимом, обладающий обширным опытом в проектировании на системном уровне, сокращении выбросов углерода, оптимизации производительности и масштабируемых решениях . Ключевое значение имеет раннее сотрудничество — от концепции и проектирования до интеграции и текущей эксплуатации.
Компания Trane обладает непревзойденным опытом в понимании всей экосистемы центров обработки данных — от крыши до микросхемы. Наш консультативный подход включает моделирование, тестирование, интеллектуальные системы управления, рекуперацию энергии, тепловое накопление, аналитику в режиме реального времени и профилактическое техническое обслуживание. Мы помогаем операторам максимально использовать вычислительный потенциал, одновременно учитывая потребности местного сообщества, экологические требования и приоритеты в области устойчивого развития. Обратитесь к одному из наших экспертов по центрам обработки данных!
Ваш надежный инноватор в области охлаждения и управления тепловым режимом центров обработки данных в средах, критически важных для выполнения задач
В компании Trane мы помогаем центрам обработки данных нового поколения работать более эффективно, экологично и интеллектуально, удовлетворяя требования искусственного интеллекта, высокоплотных рабочих нагрузок и глобального роста. Благодаря интегрированному оборудованию, проектированию систем, аналитике и постоянному сопровождению мы помогаем обеспечить максимальную вычислительную мощность вашего объекта при минимальном воздействии на окружающую среду.
Узнайте, как Trane может поддержать вашу комплексную стратегию управления тепловым режимом:
https://trane.eu/data-center.html
Эта статья основана на техническом документе, автором которого является Даниэль Росси, глобальный директор по системам охлаждения критически важных объектов в Trane Technologies.
Скачайте полную версию технического документа.
Свяжитесь с нами
Свяжитесь с местным экспертом Trane
Мы поможем вам найти необходимое решение

