Колко вода използва ИИ?

Колко вода използва изкуственият интелект?

Обзалагам се, че сте чували всичко - от „Изкуственият интелект изпива бутилка вода на всеки няколко въпроса“ до „това са основно няколко капки“. Истината е по-нюансирана. Водният отпечатък на изкуствения интелект варира в широки граници в зависимост от това къде се изпълнява, колко дълго е вашето запитване и как центърът за данни охлажда сървърите си. Така че, да, водещата цифра съществува, но тя се крие в гъсталак от предупреждения.

По-долу ще разгледам ясни, готови за вземане на решения числа, ще обясня защо оценките се различават и ще покажа как строителите и обикновените потребители могат да намалят разходите за вода, без да се превръщат в монаси, подкрепящи устойчивостта.

Статии, които може да ви харесат след тази:

🔗 Какво е набор от данни с изкуствен интелект
Обяснява как наборите от данни позволяват машинно обучение и разработване на модели.

🔗 Как изкуственият интелект предсказва тенденции
Показва как изкуственият интелект анализира модели, за да прогнозира промени и бъдещи резултати.

🔗 Как да измерим производителността на изкуствения интелект
Разбива основните показатели за оценка на точността, скоростта и надеждността.

🔗 Как да говорим с изкуствен интелект
Насочва ефективни стратегии за подтикване за подобряване на яснотата, резултатите и последователността.


Колко вода използва изкуственият интелект? Бързи числа, които всъщност можете да използвате 📏

  • Типичен диапазон днес за подкана: от под милилитър за среден текстов подкана на една масова система, до десетки милилитри за по-дълъг отговор с по-висока изчислителна мощност на друга. Например, производственото счетоводство на Google отчита среден текстов подкана ~0,26 мл (с включени пълни режийни разходи за обслужване) [1]. Оценката на жизнения цикъл на Mistral определя отговор на асистент с 400 токена на ~45 мл (пределен извод) [2]. Контекстът и моделът са от голямо значение.

  • Обучение на модел в граничен мащаб: може да достигне милиони литри , предимно от охлаждане и вода, използвана за производство на електроенергия. Широко цитиран академичен анализ оценява ~5,4 милиона литра за обучение на модел от клас GPT, включително ~700 000 литра, консумирани на място за охлаждане - и твърди за интелигентно планиране за намаляване на интензитета на водата [3].

  • Центрове за данни като цяло: големите обекти обхващат средно стотици хиляди галони на ден

Нека бъдем честни: тези цифри на пръв поглед изглеждат противоречиви. Така е. И има основателни причини за това.

 

Жаден изкуствен интелект

Показатели за потребление на вода с изкуствен интелект ✅

Добър отговор на въпроса „Колко вода използва изкуственият интелект?“ трябва да отметне няколко квадратчета:

  1. Яснота на границите
    Включва ли само охлаждащата вода на място или и извън обекта , използвана от електроцентралите за производство на електроенергия? Най-добрите практики разграничават водовземането спрямо потреблението на вода и обхващат 1-2-3, подобно на въглеродното отчитане [3].

  2. Чувствителност към местоположението
    Водата на kWh варира в зависимост от региона и мрежовия състав, така че едно и също запитване може да има различно въздействие върху водата в зависимост от това къде се обслужва - ключова причина, поради която литературата препоръчва планиране, съобразено с времето и мястото [3].

  3. Реализъм на работното натоварване
    Отразява ли числото средните производствени подкани , включително капацитет на празен ход и натоварване на центъра за данни, или само ускорителя в пиков режим? Google набляга на отчитането на цялата система (неактивен режим, CPU/DRAM и натоварване на центъра за данни) за изводите, а не само на математиката на TPU [1].

  4. Технология на охлаждане
    Изпарителното охлаждане, течното охлаждане със затворен контур, въздушното охлаждане и нововъзникващите директно към чипа променят драстично интензитета на водата. Microsoft въвежда проекти, предназначени да елиминират използването на охлаждаща вода за определени обекти от следващо поколение [4].

  5. Време на деня и сезон
    Топлината, влажността и условията на мрежата променят ефективността на потреблението на вода в реалния живот; едно влиятелно проучване предлага да се планират основни задачи, когато и където интензитетът на водата е по-нисък [3].


Обяснение на оттеглянето на вода спрямо потреблението на вода 💡

  • Вземане = вода, взета от реки, езера или водоносни хоризонти (някои върнати).

  • Консумация = вода, която не се връща обратно, защото се изпарява или е включена в процеси/продукти.

Охладителните кули консумират вода предимно чрез изпаряване. Производството на електроенергия може да изтегли големи обеми (понякога консумирайки част от нея), в зависимост от инсталацията и метода на охлаждане. Достоверни етикети с числови стойности на водата, които се отчитат от изкуствения интелект [3].


Къде отива водата в изкуствения интелект: трите кофи 🪣

  1. Обхват 1 - охлаждане на място
    Видимата част: вода, изпарена в самия център за данни. Избор на дизайн като изпарително спрямо въздушно или затворен течен контур определя базовата линия [5].

  2. Обхват 2 - производство на електроенергия
    Всеки kWh може да носи скрит воден етикет; сместа и местоположението определят сигнала от литри на kWh, който вашето работно натоварване наследява [3].

  3. Обхват 3 - верига за доставки
    Производството на чипове разчита на ултрачиста вода в процеса на изработка. Няма да го видите в метриката „за всеки подкана“, освен ако границата изрично не включва въплътени въздействия (напр. пълна LCA) [2][3].


Доставчици по брой, с нюанси 🧮

  • Подкани на Google Gemini.
    Метод за обслужване на пълен стек (включително празен ход и режийни разходи за съоръжението). Средната текстова подкана е ~0,26 мл вода, заедно с ~0,24 Wh енергия; цифрите отразяват производствения трафик и общите граници [1].

  • Жизнен цикъл на Mistral Large 2.
    Рядък независим LCA (с ADEME/Carbone 4) разкрива ~281 000 m³ за обучение + ранна употреба и пределна стойност на извода ~45 mL за с 400 токена [2].

  • Амбицията на Microsoft за нулево охлаждане.
    Центровете за данни от следващо поколение са проектирани да не консумират вода за охлаждане , разчитайки на подходи директно към чипа; административните приложения все още изискват известно количество вода [4].

  • Общ мащаб на центрове за данни.
    Големите оператори публично отчитат стотици хиляди галони на ден средно на отделни обекти; климатът и дизайнът тласкат числата нагоре или надолу [5].

  • По-ранната академична база.
    Основополагащият анализ на „жадния изкуствен интелект“ оцени милиони литри за обучение на модели от клас GPT и че 10–50 средни отговора биха могли приблизително да се равняват на от 500 мл - силно зависимо от това кога/къде се изпълняват [3].


Защо оценките се различават толкова много 🤷

  • Различни граници
    Някои цифри отчитат само охлаждането на място ; други добавят електричеството и водата ; LCA може да добавят производството на чипс , ябълки, портокали и плодова салата [2][3].

  • Различни натоварвания
    Краткият текстов подкаст не е дълго мултимодално/кодово изпълнение; пакетирането, паралелизмът и целите за латентност променят използването [1][2].

  • Различни климатични условия и мрежи
    Изпарително охлаждане в горещ, сух регион ≠ въздушно/течно охлаждане в хладен и влажен. Интензитетът на водата в мрежата варира в широки граници [3].

  • Методологии на доставчиците
    Google публикува метод за обслужване в цялата система; Mistral публикува официална LCA. Други предлагат точкови оценки с разредени методи. Широко разпространено „една петнадесета от чаена лъжичка“ на подкана попадна в заглавията - но без гранични подробности, то не е сравнимо [1][3].

  • Движеща се цел
    Охлаждането се развива бързо. Microsoft пилотира безводно охлаждане на определени обекти; внедряването му ще намали потреблението на вода на място, дори ако електричеството нагоре по веригата все още носи сигнал за вода [4].


Какво можете да направите днес, за да намалите водния отпечатък на изкуствения интелект 🌱

  1. Правилно оразмеряване на модела
    По-малките, настроени към задачите модели често постигат съвпадение на точността, като същевременно изразходват по-малко изчислителни ресурси. Оценката на Mistral подчертава силни корелации между размера и заеманата площ - и публикува гранични числа на извода, така че да можете да разсъждавате върху компромисите [2].

  2. Избирайте региони с по-малко вода.
    Предпочитайте региони с по-хладен климат, ефективно охлаждане и мрежи с по-нисък интензитет на водата на kWh; работата върху „жадния изкуствен интелект“ показва, че съобразено с времето и мястото, помага [3].

  3. Планирайте
    обучение/интензивно групово извеждане за часове с ефективно използване на водата (по-хладни нощи, благоприятни условия на мрежата) [3].

  4. Попитайте вашия доставчик за прозрачни показатели
    за търсене на вода за всяко запитване , дефиниции на границите и дали числата включват неизползван капацитет и режийни разходи за съоръжения. Политическите групи настояват за задължително оповестяване, за да се направят възможни сравнения на постигнати резултати [3].

  5. Технологията за охлаждане е важна.
    Ако използвате хардуер, оценете охлаждането със затворен контур/директно към чипа ; ако работите в облак, предпочитайте региони/доставчици, които инвестират в дизайни с водно осветление [4][5].

  6. Използвайте сива вода и опции за повторна употреба.
    Много кампуси могат да заместят непитейните източници или да рециклират в рамките на цикли; големите оператори описват балансиране на източниците на вода и вариантите за охлаждане, за да се сведе до минимум нетното въздействие [5].

Бърз пример, за да го илюстрираме (не е универсално правило): преместването на нощно обучение от горещ и сух район през лятото в по-хладен и по-влажен район през пролетта - и провеждането му в извънпикови, по-хладни часове - може да промени както потреблението на вода на място, извън мрежата . Това е видът практично планиране с ниска драматичност, което може да отключи [3].


Сравнителна таблица: бързи съвети за намаляване на разхода на вода от изкуствения интелект 🧰

инструмент публика цена защо работи
По-малки, настроени към задачите модели Екипи за машинно обучение, продуктови ръководители Ниско-средно По-малко изчисления на токен = по-малко охлаждане + електричество и вода; доказано в отчитане в стил LCA [2].
Избор на регион по вода/kWh Облачни архитекти, снабдяване Среден Преминаване към по-хладен климат и мрежи с по-нисък интензитет на водоснабдяване; съчетаване с маршрутизация, съобразена с търсенето [3].
Прозорци за обучение по време на деня MLOps, планировчици Ниско По-хладните нощи + по-добрите условия на мрежата намаляват ефективния интензитет на водата [3].
Директно охлаждане към чипа/затворен контур Операции в центрове за данни Средно-високо Избягва изпарителни кули, където е възможно, намалявайки потреблението на място [4].
Контрол на дължината на подканата и партидите Разработчици на приложения Ниско Ограничавайте неконтролируемите токени, групирайте интелигентно, кеширайте резултатите; по-малко милисекунди, по-малко милилитри [1][2].
Контролен списък за прозрачност на доставчиците CTO, ръководители по устойчиво развитие Безплатно Налага яснота на границите (на място спрямо извън място) и отчитане на принципа „ябълки към ябълки“ [3].
Сива вода или регенерирани източници Съоръжения, общини Среден Заместването на непитейната вода облекчава напрежението върху питейните запаси [5].
Партньорства за повторно използване на топлина Оператори, местни съвети Среден По-добрата топлинна ефективност косвено намалява търсенето на охлаждане и изгражда местна репутация [5].

(„Цената“ е мека по дизайн - внедряванията варират.)


Дълбоко потапяне: барабанният ритъм на политиката става все по-силен 🥁

Инженерните организации призовават за задължително оповестяване на енергията и водата в центровете за данни, така че купувачите и общностите да могат да преценят разходите и ползите. Препоръките включват дефиниции на обхвата, отчитане на ниво обект и насоки за избор на място - защото без сравними, съобразени с местоположението показатели, ние спорим на тъмно [3].


Дълбоко проучване: не всички центрове за данни използват данни по един и същи начин 🚰

Съществува упорит мит, че „въздушното охлаждане не използва вода“. Не съвсем. Системите, работещи с много въздух, често изискват повече електричество , което в много региони носи скрита вода от мрежата; обратно, водното охлаждане може да намали мощността и емисиите за сметка на водата на място. Големите оператори изрично балансират тези компромиси за всеки обект поотделно [1][5].


Дълбоко гмуркане: бърза проверка на реалността относно вирусните твърдения 🧪

Може би сте виждали смели твърдения, че една единствена подсказка е равна на „бутилка вода“ или, от друга страна, „само няколко капки“. По-добра стойка: смирение с математика . Днешните достоверни стойности са ~0,26 мл за средна производствена подсказка с пълни режийни разходи за сервиране [1] и ~45 мл за отговор на асистент с 400 жетона (пределен извод) [2]. Много споделяното „една петнадесета от чаена лъжичка“ няма публична граница/метод; третирайте го като прогноза за времето без града [1][3].


Мини-ЧЗВ: Колко вода използва изкуственият интелект? отново, на разбираем английски 🗣️

  • И така, какво трябва да кажа на среща?
    „Според подкана, количеството варира от капки до няколко глътки , в зависимост от модела, дължината и мястото, където се провежда. Тренировката се провежда в басейни , а не в локви.“ След това цитирайте един или два примера по-горе.

  • Уникално лош ли е изкуственият интелект?
    Той е уникално концентриран : мощните чипове, струпани заедно, създават големи охладителни товари. Но центровете за данни са и мястото, където най-ефективните технологии обикновено се появяват първи [1][4].

  • Ами ако просто прехвърлим всичко на въздушно охлаждане?
    Може да намалим потреблението на място , но да увеличим потреблението извън обекта чрез електричество. Умелите оператори преценяват и двете [1][5].

  • А какво ще кажете за бъдещите технологии?
    Проекти, които избягват охлаждането на водата в голям мащаб, биха променили правилата на играта за Scope 1. Някои оператори се насочват в тази посока; електричеството нагоре по веригата все още носи воден сигнал, докато мрежите не се променят [4].


Заключителни бележки - Твърде дълго, не го прочетох 🌊

  • За всяка подкана: помислете за количества от под милилитър до десетки милилитри , в зависимост от модела, дължината на подкана и къде се изпълнява. Медианна подкана ~0,26 mL на един основен стек; ~45 mL за отговор с 400 токена на друг [1][2].

  • Обучение: милиони литри за гранични модели, което прави планирането, разположението и технологиите за охлаждане критични [3].

  • Какво да направите: модели с правилния размер, изберете райони с по-добро водопоглъщане, преместете тежките задачи в по-хладни часове, предпочитайте доставчици, доказващи се в дизайна на осветлението с водна струя, и изисквайте прозрачни граници [1][3][4][5].

Леко погрешна метафора за край: Изкуственият интелект е жаден оркестър - мелодията е изчислителна, но барабаните се охлаждат и пускат вода в мрежата. Настройте групата и публиката пак ще чуе музиката, без пръскачките да се включват. 🎻💦


Референции

  1. Блог на Google Cloud - Колко енергия използва изкуственият интелект на Google? Направихме изчисленията (методология + ~0,26 mL медианно запитване, пълни режийни разходи за обслужване). Връзка
    (PDF технически документ: Измерване на въздействието върху околната среда от предоставянето на изкуствен интелект в мащаб на Google .) Връзка

  2. Mistral AI - Нашият принос към глобален екологичен стандарт за ИИ (LCA с ADEME/Carbone 4; ~281 000 m³ обучение + ранна употреба; ~45 mL на 400 токена , маргинален извод). Връзка

  3. Ли и др. - Да направим ИИ по-малко „жаден“: Разкриване и справяне с тайния воден отпечатък на ИИ моделите (обучение на милиони литри , , съобразено с времето и мястото , оттегляне спрямо потребление). Връзка

  4. Microsoft - Центровете за данни от следващо поколение не консумират вода за охлаждане (дизайн с директно охлаждане към чип, насочен към безводно охлаждане на определени места). Връзка

  5. Центрове за данни на Google - Устойчива работа (компромиси при охлаждането за всеки обект; отчитане и повторна употреба, включително регенерирана/сива вода; типична дневна употреба на ниво обект от порядъка на величината). Връзка

Намерете най-новия изкуствен интелект в официалния магазин за асистенти с изкуствен интелект

За нас

Обратно към блога