Throttling cpu что это: CPU Throttling что это и как исправить?

Содержание

CPU Throttling что это и как исправить?

Всем привет. Сегодня мы затронем тему процессоров, а если быть точнее, то такое явление как CPU Throttling. Скажу сразу ребята, что это явление не совсем хорошее и может отрицательно влиять на работу ПК, если ничего с этим не делать. А все дело в том, что CPU Throttling это термозащита процессора от перегрева. Но давайте обо всем разберемся подробнее.

Итак ребята, CPU Throttling это троттлинг процессора. Что такое троттлинг? Процессор пропускает часть тактов для того, чтобы немного себя успокоить. То есть проц сам себе урезает производительность, пока температура не снизится. Сам по себе троттлинг опасен тем, что проц работает на оч высокой температуре и при этом термопаста над кристаллом может спокойно высохнуть. Кстати засохшая термопаста очень часто и приводит к троттлингу… =(

Ребята, я тут написал свои мысли. То есть то, как думаю я лично. Я не претендую там на супер шарящего чувака, но кое какой опыт в обращении с процом у меня есть. Также я тут расскажу об одном трюке.. Искренно надеюсь моя инфа вам немного, да поможет..

Вы подумаете, ну и что делать теперь? Итак, первое что нужно сделать, это выключить все проги на компе, которые его нагружают. То есть в игры играть разумеется не стоит, это думаю понятное дело. Нужно все отключить так бы сказать до выяснения обстоятельств.

Теперь давайте думать и думать логично. Троттлинг это явление, которое появляется при высокой температуре. Но если проц нагружать по полной, то все равно температура не должна приводить к троттлингу. То есть что-то не так.. Первым делом нужно разобрать ПК или ноут и посмотреть что творится с радиатором, может он жутко пыльный, забит всяким мусором и именно этот мусор мешает отводу тепла. Но может быть такое, что визуально все вроде норм, радиатор в меру пыльный. Тогда радиатор нужно снять и провести осмотр процессора, подошвы радиатора (по следам термопасты можно сделать вывод о том насколько плотный контакт).

У меня есть еще новости. Может быть такой прикол, что вы ноут или ПК разобрали, сняли радиатор, выбрали проц и прикол в том, что вроде все норм. Термопаста есть, радиатор вроде плотно прилегает, проц стоит ровно и все пучком. Однако ребята, я могу вас расстроить. Дело в том что в самом процессоре, между чипом и теплораспределительной крышкой тоже есть термопаста, ну типа термоинтерфейс. В ноутах не знаю есть ли такая крышка на чипе. И вот если термоинтерфейс чуть подсох, то его теплопроводность в разы ухудшается. И тут уже ничего не поможет кроме как менять этот термоинтерфейс, а кстати можно туда поставить жидкий металл, но это дело нужно чтобы делал спец, напартачить можно оч легко…

Вот ребята нашел картинку, примерно такое и творится внутри проца, ну то есть под его крышкой:

Посередине прямоугольный чип, это и есть проц, а вот на нем как раз термоинтерфейс. Вот еще одна картинка, тут уже проц почищен от старого термоинтерфейса:

Ребята, вот перед вами обычный радиатор проца с вентилятором в обычном ПК:

И он может быть грязный, забит пылью, из-за чего процу тупо жарко.

Вот еще один пример и тут тоже радиатор, но уже другой, попроще и здесь он как раз грязный, куча пыли и всякой дичи на нем:

Нужно чистить одним словом.

А вот система охлаждения ноута, которая выталкивает горячий воздух из корпуса, но здесь на картинке как видите радиатор уже покрылся шубкой из пыли и шерсти:

Еще один пример, почти тоже самое, только другая система охлаждения, тоже от ноутбука, смотрите:

Ну короч вы поняли, да, что этот момент с грязным радиатором нужно проверить, чтобы знать уж точно в этом дело или нет…

Мерять температуру я советую прогой AIDA64, ее можно спокойно скачать в нете, вот как она выглядит:

Есть еще прога Speccy, тоже неплохая, но в целом инфы она дает меньше.

РЕБЯТА, ЧУТЬ НЕ ЗАБЫЛ ВАМ РАССКАЗАТЬ ОБ ОДНОМ ТРЮКЕ… В ТЕОРИИ ОН МОЖЕТ ПОМОЧЬ… Этот трюк позволит как бэ облегчить состояние проца, который уже дошел до кондиции, ну то есть до троттлинга.. Короче знаете что можно сделать? Можно принудительно запретить процу работать на максимальной частоте. Это можно сделать в самой винде, я покажу на примере Windows 7, но в Windows 10 там все почти также. Итак, смотрите. Нажимаете Пуск, там выбираете Панель управления:

Далее находите значок Электропитание:

Потом неважно какая у вас стоит схема, главное, это нажать на Настройка перехода в спящий режим:

Выбираем изменить дополнительные параметры:

Ну и теперь самое главное. Появится окошко Электропитание, там будет куча настроек и опций, здесь нужно пойти в Управление питанием процессора, и вот тут самое нужное. Вы можете вручную ограничить загрузку проца, само ограничение указывается в процентах. В теории это должно помочь, проц станет менее производительным, температура снизится. Вот например я выставил, чтобы максимально проц загружался только на 20%, гляньте как это сделать:

После всех действий жмете ОК. Попробуйте, вдруг это поможет?.

Вот такие ребята пироги невеселые, это если кратко все. Надеюсь вам тут все было понятно, ну а если что-то не так, то прошу простить… Удачи вам и всех благ!

Троттлинг процессора или почему падает производительность

Троттлинг (от английского throttling) представляет собой механизм защиты процессора от термических повреждений при перегреве системы. Чем выше температура действует на микропроцессор, тем больше машинных тактов он пропускает. Такты пропускаются, соответственно снижается эффективность и производительность – это и есть троттлинг процессора.

Стоит отметить, что у каждого компьютера, работающего на процессоре Intel, температура срабатывания данного механизма защиты индивидуальная – на одном ноутбуке это может быть 70 градусов, на другом — 100. При этом в некоторых устройствах этот параметр можно самостоятельно переопределить в BIOS.

Предположим, у нас есть процессор Pentium 4 с ядром Northwood. При полном покое рабочая температура «камня» составляет всего 34 градуса. Запустив тестовую утилиту CPU Stability Test, нагрузим процессор до 100% — температура поднимается до 50 градусов. Чтобы показать, как работает троттлинг процессора, можно отключить вентилятор системы охлаждения. После этого действия при 100% нагрузке температура мигом поднимается до 75 градусов и постепенно растет.

Достигнув отметки 82 градуса, на нашем Pentium 4 Northwood включается троттлинг, сначала сильными скачками, а затем более плавно производительность снижается. Этот процесс виден на скрине ниже. После возвращения температуры в разумные рамки, процессор выходит из троттлинга и продолжает работать в штатном режиме.

Механизм Thermal Throttling в интеловских процессорах заслуживает внимания и права на существование. Конечно, технология не вытянет систему в рабочее состояние при отказавшем вентиляторе или других форс-мажорах за счет снижения производительности, однако она имеет другое преимущество. Что обычно происходит при перегреве системы? Срабатывает аппаратный shutdown, то есть при достижении критической температуры происходит остановка процессора и отключение системы питания. Технология троттлинга процессора выглядит более изящно – в случае внештатной ситуации система не следует жесткому правилу остановки, а пытается нормализовать работу через приостановку роста температуры, и лишь на втором плане у нее стоит крайняя мера — выключение.

Что такое троттлинг процессора на ПК и можно ли его отключить?

  1. Что такое троттлинг процессора?
  2. Можно ли отключить троттлинг?
  3. Как бороться с троттлингом процессора?

Во время работы компьютера можно заметить резкое снижение производительности. Особенно это заметно, когда запущено 2-3 мощные программы, например, видеоредактор и утилита для обработки фотографий. Одна из причин снижения производительности — перегревание процессора. Когда повышается температура ЦП, запускается защитный механизм. Он называется троттлинг.

Что такое троттлинг процессора?

Троттлинг — специальный механизм, который защищает процессор от термических повреждений. Он снижает температуру ЦП, тем самым уменьшая риск выхода чипа из строя.

Чтобы уменьшить нагрев и дать возможность чипу выводить тепло, начинается процесс пропуска машинных тактов (когда процессор достигает определенной отметки температуры). Чем больше тактов пропущено, тем медленнее работает система.

Показатели температуры, при которых начинается троттлинг, могут быть разные. Например, на одном компьютере с процессором Intel, защитный механизм может запуститься при достижении отметки 70 градусов. Другая модель ЦП может работать до 100 градусов и только после преодоления этого порога начинается троттлинг.

Когда процессор достигнет критической отметки температуры, компьютер отключится в принудительном порядке. Это нужно, чтобы чип не сгорел от перегрева.  Критическая температура — максимально возможное значение температуры работы кристалла. В процессоре есть термодатчики. Они измеряют температуру ЦП. Посмотреть показатели можно с помощью сторонних программа (AIDA64) или через BIOS.

Можно ли отключить троттлинг?

Отключить троттлинг можно, но делать это крайне не рекомендуется. Если отключить защитный механизм процессора от термических повреждений, чип быстро выйдет из строя. В этом случае владельцу ПК предстоит дорогостоящая замена ЦП, так как отремонтировать старый не получится.

Несмотря на возможные последствия, некоторые пользователи деактивируют троттлинг. В разных версиях BIOS Legacy и UEFI есть опция, которая отключает защитный механизм процессора. Для этого нужно изменить показатель критической температуры чипа.

В BIOS этот пункт называется «CPU Warning Temperature». По умолчанию может быть установлена отметка 70 градусов — после этого запускается троттлинг. Изменив этот параметр на более высокий показатель, можно отключить троттлинг.

Еще один вариант — использование программы ThrottleStop. Утилита бесплатная. Установка не требуется — достаточно скачать и распаковать архив на ПК. В софте есть разные опции, которые позволяют ограничить троттлинг. Рассмотрим их более подробно:

  • Clock Modulation, Chipset Modulation. Этот параметр дает возможность ограничить троттлинг процессора, если он инициирован материнской платой или самим ЦП. Если исправить базовые значения, то можно повысить производительность работы чипа — при достижении определенной отметки нагрева, процесс пропуска машинных тактов не запустится. При этом, есть серьезный риск критического перегрева ЦП.
  • Turbo Boost. В некоторых случаях этот режим помогает ограничить троттлинг. Он увеличивает тактовую частоту процессора, если начинается принудительный пропуск тактов.
  • C1E. Если активировать эту опцию, то производительность процессора будет снижаться только когда компьютер находится в состоянии бездействия. В обратном случае, чип работает на максимальной мощности.

Как бороться с троттлингом процессора?

Самый эффективный способ борьбы с троттлингом процессора — обеспечение оптимального режима охлаждения. Пользователи ПК должны следить за тем, чтобы процессор не перегревался. Для этого нужно чистить кулеры от скопившейся пыли и периодически менять термопасту на ЦП. Чтобы отслеживать показатели температуры чипа, необходимо пользоваться дополнительным программным обеспечением — например, Core Temp или CPU-Z.

Когда температура достигает критической отметки при повышенной нагрузке на систему, значит пришло время замены термопасты. В обратном случае снова начнется троттлинг.

Остались вопросы, предложения или замечания? Свяжитесь с нами и задайте вопрос.

CPU Throttling — что это: как эта технология работает?

Опубликовано 21.01.2020 автор — 0 комментариев

Здравствуйте, дорогие читатели! Сегодня мы с вами обсудим CPU trottling: что такое, зачем он нужен и как это работает. А также как отключить эту функцию и нужно ли. В предыдущем посте мы говорили о том, что такое CPU frequency, кстати рекомендую почитать.

Что такое троттлинг процессора и зачем он нужен

Эта технология чаще используется в планшетах и смартфонах и гораздо реже в настольных ПК и ноутбуках. С данным явлением сталкивалось большинство юзеров, часто не обращая на него внимания.

Троттлингом, что переводится как «дросселирование», называется принудительное ограничение мощности процессора — снижение тактовой частоты или пропуск тактов. Делается это при чрезмерной нагрузке на чип для защиты от перегрева. Как вы знаете, ЦП создается на кристаллах кварца, которые очень чувствительны к повышению температуры.

Механизм включается, если нагрузка на «камень» становится чрезмерной и система охлаждения уже не успевает отводить тепло в должной мере. Главная задача троттлинга — страховка от повреждения дорогого компонента.

Иногда компьютер попросту отключается с сообщением «Overheating detected». Что это значит? То, что даже механизм троттлинга не справляется с чрезмерным нагреванием детали. Компу нужно не просто остыть: необходимо уже что-то делать с системой охлаждения, так как она не справляется с такой нагрузкой.

Можно ли отключить

Можно, ну лучше этого не делать. Перед тем как убрать эту опцию, следует помнить, что без проверки степени нагрева ЦП становится эдаким «самоубийцей», работающим на износ. В случае перегрева ничто не убережет дорогую деталь от выхода из строя.

Не помогут и специализированные утилиты для слежения за параметрами компа — например, AIDA64 или Speccy. Такие программы только проверяют параметры работы ЦП, но не влияют на них и в случае опасности никаких экстренных мер не предпримут.

Единственное, что может в таком случае пользователь — мониторить работу компьютера и отключить его при перегреве. Метод ненадежен, так как это не всегда можно заметить вовремя.

Также не рекомендуется проводить thermal test, то есть температурный тест, чтобы проверить, как работает троттлинг. В случае, если такой механизм реализован плохо, вы рискуете выходом процессора из строя.

Как убрать троттлинг

Первый способ, к которому я не рекомендую прибегать, заключается в отключении слежения за процессором в настройках в BIOS. Как сказано выше, без проверки температуры компонентов существенно возрастает риск выхода их из строя.

Второй способ — бороться с перегревом, чтобы ограничить вероятность срабатывания троттлинга. В этом случае нужно наладить нормальную работу системы охлаждения — почистить от пыли все кулеры, поставить дополнительный, обеспечить нормальную циркуляцию воздуха внутри корпуса.

Владелец ноутбука может воспользоваться специальной охлаждающей подставкой, оборудованной дополнительными кулерами. Также не забывайте о регулярной замене термопасты. Это нужно выполнять не реже одного раза в год.

Для вас могут быть полезными публикации «Что такое техпроцесс» и «Что важнее —частота или количество ядер ЦП». Буду признателен, если вы расшарите этот пост в социальных сетях. До скорой встречи!

С уважением, автор блога Андрей Андреев.

Вконтакте

Facebook

Twitter

Одноклассники

CPU throttling overheating detected что это?

Пользователи, которые хотя бы раз открывали программу AIDA64, отлично подходящую для проверки температуры процессора и видеокарты, могли видеть в ней надпись красными буквами – CPU throttling overheating detected. Но далеко не все знают что эта надпись означает.

В данной статье мы расскажем вам о значении фразы CPU throttling overheating detected, а также что нужно делать при ее появлении.

Что такое CPU throttling overheating detected?

Как мы уже неоднократно говорили, при появлении какой – либо англоязычной фразы первым делом нужно узнать ее перевод на русский язык. Этим мы сейчас и займемся.

Первое слово CPU – это центральный процессор компьютера или ноутбука. Далее идет слово throttling. Это специальная защита, встроенная в процессор, которая призвана снижать его производительность, пропуская рабочие такты, чтобы не допустить перегрева процессора. Ну и в конце идут слова overheating detected, которые переводятся как “обнаружен перегрев”.

Сложив все воедино получаем следующий перевод – обнаружен троттлинг и перегрев центрального процессора.

cpu throttling overheating detected что это

Троттлинг в Aida64

Пара слов о троттлинге

Как уже писалось выше, троттлинг это защита процессора от перегрева путем снижения его производительности. Меньше производительность – меньше потребление энергии и соответственно меньшее тепловыделение.

Говоря простыми словами, если на вашем процессора активируется троттлинг, то компьютер или ноутбук будет явно медленнее работать или как минимум подтормаживать.

Что делать и как убрать троттлинг процессора?

Здесь все довольно просто. Если есть троттлинг, значит есть перегрев. Если есть перегрев, то нужно разобрать компьютер или ноутбук, почистить его от пыли и заменить термопасту.

Также нужно обратить внимание на вентилятор процессора. Крутится ли он и с нормальной ли скоростью.

Выводы

Из всего вышесказанного можно сделать вывод, что как только вы заметили фразу CPU throttling overheating detected в любой диагностирующей программе, включая Aida64, то это явный признак перегрева компьютера или ноутбука. Требуется срочное обслуживание системы охлаждения чисткой и заменой термопасты.

Исследуем функционирование механизма Thermal Throttling в процессорах Pentium 4 с ядрами Northwood и Prescott

Мы неоднократно затрагивали тему снижения быстродействия процессоров Pentium 4 при перегреве (интересующиеся могут почитать архивные материалы «Тепловой режим процессоров Pentium 4 и Athlon XP» и «Разгон Intel Pentium 4 1,6A ГГц: мифы и факты влияния Thermal Monitor на производительность»). Но по-прежнему ходят самые разные мифы о Thermal Monitor и собственно технологии Thermal Throttling (это самое снижение). Поэтому, не углубляясь в теорию (ее с избытком хватает в указанных выше статьях), мы решили обновить свои практические знания в этой области. Для этого мы произвели очень простой эксперимент с двумя топовыми процессорами Pentium 4 3.2 ГГц на различных ядрах (Northwood и Prescott): отключили питание вентилятора на кулере при загрузке процессора в 100%, и отследили рост температуры и падение производительности во временной перспективе. Данный материал является отчетом о проделанном эксперименте и его результатах.

Тестовые стенды

  • Процессоры:
    • Intel Pentium 4 3.2 ГГц (Northwood)
    • Intel Pentium 4 3.2E ГГц (Prescott)
  • Материнские платы:
  • Память:
    • 2×512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги: 2-2-2-5)
  • Видеокарта: Manli ATI Radeon 9800Pro 256 МБ
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин
  • Кулер: Thermaltake SPARK 6 (медный радиатор, 5500 об/мин)
  • Термопаста: КПТ-8.

Для достижения 100% загрузки процессора (точнее, обоих виртуальных CPU, т.к. использованные нами Pentium 4 поддерживают технологию Hyper-Threading), использовался подтест CPU Stability из последней версии тестового пакета CPU RightMark т.к. он позволяет динамически отслеживать производительность процессора. Напомним, что частота работы ядра у Pentium 4 при включении Thermal Throttling не меняется , поэтому отслеживать следует именно производительность! Для измерения температуры, дабы не мудрствовать лукаво, и не завязываться на утилиты от конкретных изготовителей системных плат, была использована достаточно популярная программа Motherboard Monitor версии 5.3.6.0, окно которой («Dashboard», пользуясь терминологией авторов) было выведено рядом с окном CPU Stability Test (или даже поверх него).

Отдельно остановимся на выборе системной платы. Желая смоделировать типичный случай, мы специально взяли такую модель, которая не содержит в BIOS Setup функций управления Thermal Throttling. Т.е. была воспроизведена ситуация, когда контролировать процесс вручную возможности нет, и все работает в соответствии с установками по умолчанию. Тестирование

Дальнейшее повествование мы построим самым логичным для рассматриваемой ситуации образом: в виде скриншотов, иллюстрирующих стадии эксперимента в той последовательности, в которой все происходило в реальности, и комментариев к ним.

Pentium 4 3,2 ГГц «Northwood»

Исходное положение: система загружена и была в состоянии полного покоя в течение 10 минут. Температура «за бортом» 22 градуса, корпус тестового стенда открыт. Как легко заметить, температура процессора составляет 34 градуса Цельсия.

Запущен RightMark CPU Stability Test, время, приблизительно, 5 секунд после старта. Температура выросла на 8 градусов, в окне программы начал отрисовываться график производительности. График условно можно назвать гладким.

Заметим, что мы отключили в опциях Stability Test самый неточный из всех способов определения производительности — Multimedia Timer, оставив только графики Performance Counter и Time Stamp Counter. Если присмотреться, то на скриншоте можно увидеть зеленую линию Multimedia Timer на уровне нуля по оси Y (нуля — поскольку он отключен). Также можно заметить, что две линии — красная Time Stamp и желтая Performance Counter, практически слились в одну.

6 минут после старта теста. Температура процессора окончательно стабилизировалась и составляет 50 градусов (время от времени возникают кратковременные всплески до 51-52 градусов). Линия графика ровная — производительность не меняется, Thermal Throttling (в дальнейшем — просто «троттлинг») не задействован.

После снятия скриншота (это, как-никак, еще одна дополнительная нагрузка на процессор, помимо создаваемой тестовым пакетом), график стал периодически незначительно «скакать». Однако вряд ли это троттлинг, скорее в определение производительности программой RightMark CPU Stability Test начали вмешиваться другие процессы, параллельно выполняющиеся в системе. Все-таки достигнуть идеальной стабильности результатов программных измерений в многозадачной ОС практически нереально. Мы приводим этот скриншот в основном для тех, кто захочет повторить наши эксперименты, чтобы они не пугались подобных всплесков — это нормально.

Состояние через минуту после отключения питания вентилятора на кулере. Температура выросла на 20 градусов (обратите внимание — для этого понадобилась целая минута работы CPU при 100% загрузке с остановившимся вентилятором!). Троттлинг не включается — процессор все еще пытается удерживать производительность на номинальном уровне.

Минута и 7-10 секунд после отключения питания вентилятора. Температура выросла еще на 4 градуса, и процессор начинает постепенно «сваливаться» в троттлинг. Обратите внимание на два первых зубца на графике — робкие попытки вернуться к нормальному состоянию все же наблюдаются, но проходят довольно быстро.

Типичная картина сваливания в троттлинг. Этот скриншот снят в другой итерации т.к. снятие предыдущего скриншота сильно «расплескало» график. Впрочем, временные интервалы и температуры все равно повторяются с довольно высокой точностью — плюс/минус 3-4 секунды и 1-2 градуса. В общей сумме, от начала сваливания в троттлинг до завершающего этапа (производительность замирает примерно на 50% от номинальной) проходит примерно 20-25 секунд. «Полный троттлинг» наступает при температуре процессора приблизительно 80 градусов.

Температура продолжает расти, график производительности стабилизировался. Самое время дождаться, что будет дальше, однако мы проведем перед этим еще один эксперимент: снова включим вентилятор…

Этот скриншот, опять-таки, снят не в процессе того же эксперимента, что и прошлый, однако суть от этого не меняется — нам нужно лишь увидеть процесс выхода из троттлинга и засечь время. Northwood тратит на это около 5-7 секунд, возвращаясь к нормальной производительности так же «ступенчато», как и спускался вниз. График стабилизируется при той же температуре, при которой мы наблюдали стабильную работу без троттлинга с выключенным вентилятором — около 70 градусов.

Вот и обещанный апофеоз: пара секунд до полной «смерти» системы, 94 градуса. В нашем случае (22 градуса в помещении, открытый корпус), троттлингу не удалось спасти процессор от перегрева, возник thermtrip, и процессор вместе со всей системой ушел в shutdown. Оставаясь при этом в живых, естественно. И это нельзя назвать случайностью, поскольку мы намеренно доводили наш тестовый стенд до такой ситуации раз 10 подряд. Температура «последнего вздоха» в случае с Pentium 4 3,2 ГГц Northwood колебалась в районе от 94 до 98 градусов по показаниям Motherboard Monitor.

Pentium 4 3,2E ГГц «Prescott»

Первое различие сразу бросается в глаза: температура покоя у Prescott в нашем случае составила 50 градусов (против 34 у Northwood). Разумеется, это всего лишь наш случай , однако, учитывая то, что кроме процессора на стенде ничего не менялось, данные цифры позволяют, как нам кажется, сделать вполне корректный вывод о величине относительной разницы между температурными режимами Prescott и Northwood.

Около 5 секунд после старта теста. Температура растет еще стремительнее, чем в случае с Northwood — практически, со скоростью 2 градуса за секунду.

А вот стабилизировалась она на 76 градусах, что также намного больше, Northwood’овских 50. Сравним: 34 покоя против 50 при 100% загрузке на Northwood: 47% прироста температуры. Prescott: 50 против 76 — 52%. Не то что бы очень большая разница, однако все-таки она есть, и снова не в пользу Prescott.

После снятия скриншота на графике опять начинают появляться характерные зубцы, но намного более глубокие и частые. И вот здесь уже труднее определить, о чем они свидетельствуют — о вмешательстве ли посторонних процессов, или о первых намеках на троттлинг. Почему? Во-первых, потому что зубцы намного более глубокие и примерно соответствуют 50%-ной потере производительности. А во-вторых — читайте следующий комментарий.

Итак, мы отключаем питание вентилятора. Уже через 5-6 секунд температура возрастает примерно до 80 градусов, и начинается «скачущий троттлинг» — производительность то резко падает, то опять столь же резко возвращается к номинальному значению. Совершенно не похоже на более-менее плавное падение, которое мы наблюдали в случае с Northwood. И — обратите внимание: если порог между нормальной рабочей температурой и началом троттлинга у Northwood составляет 74/50~=48%, то в случае с Prescott это всего лишь 80/76~=5%.

Всего 5% разницы между нормальной температурой при 100% загрузке и порогом, на котором начинает срабатывать троттлинг! Соответственно, мы можем также констатировать, что по времени между остановкой вентилятора и возникновением первой аварийной ситуации, Prescott обогнал Northwood на целую минуту.

Еще 6-8 секунд — и процессор окончательно уходит в глухой троттлинг при температуре около 88-90 градусов. В принципе, кривую снижения производительности можно с большой натяжкой назвать плавной (в целом, так сказать), однако амплитуда колебаний намного больше, чем в случае с Northwood.

Кстати, сделаем небольшое разъяснение по поводу постоянно мелькающих в тексте «около», «приблизительно» и прочих синонимов, обозначающих отсутствие абсолютной точности. Дело в том, что приводить все скриншоты, полученные в процессе тестирования, никакого смысла нет — они примерно одинаковы. Поэтому мы ограничиваемся одним, наиболее характерным. А вот возможные интервалы значений, указанные в тексте статьи, базируются на данных нескольких реально проведенных однотипных экспериментов.

Включение вентилятора. Первое отличие от Northwood: примерно в течение 4-5 секунд не происходит вообще ничего. На графике это «ничего», понятное дело, увидеть невозможно. И только после этого температура достаточно резко (3-4 секунды) снижается до 85-83 градусов, и начинаются попытки выхода из троттлинга. Сам выход выглядит так же пилообразно, как и вход (снова вспомним достаточно плавную кривую на Northwood).

Приблизительно 30 секунд после включения вентилятора соответствует левой части графика (т.е. самой ранней). Видно, что даже после того, как график производительности в целом стабилизировался, его временами довольно сильно лихорадит. Продолжается это приблизительно 2 минуты.

…После чего мы снова возвращаемся к температуре 76-77 градусов, и график становится ровным. Выход из троттлинга полностью завершен, рабочая температура примерно такая же, как и до выключения вентилятора.

«Final Cowntdown» (C) Europe. Система с процессором Prescott аварийно завершает работу при несколько большей температуре, чем Northwood. Максимум для Northwood в нашем случае составил 98 градусов, Prescott же иногда доживал до 105, и никогда не выключался при температуре менее 101 градуса.

Выводы

Итак, обобщим результаты наших экспериментов:

  1. Механизм Thermal Monitor / Thermal Throttling в процессорах Pentium 4 на ядрах Northwood и Prescott присутствует, и функционирует в точности так, как он должен функционировать согласно документации производителя. Впрочем, как говорится, кто бы сомневался…
  2. Безусловно, полученные данные в плане абсолютных значений временных интервалов и некоторых температур, вряд ли могут быть применены к любой системе, ввиду различий в аппаратной части (частота процессора, связка кулер + термопаста, модель системной платы, температура окружающего воздуха, открытость / закрытость корпуса). Однако механизм функционирования самого троттлинга и закономерности его работы экспериментально выяснены (подтверждены).
  3. Гипотеза о том, что троттлинг может «вытянуть» любую систему в любом случае и предотвратить срабатывание аппаратного shutdown, не выдержала проверки. При стандартном значении снижения производительности (порядка 50%), этой меры иногда не хватает, чтобы предотвратить перегрев CPU, после которого следует автоматическое выключение с целью предотвратить его выход из строя. С другой стороны, пороговое значение температуры нам уже известно, поэтому основное направление работы над системным блоком — не допустить, чтобы оно было достигнуто. Грамотная вентиляция, корпусные кулеры… или, в конце концов, выставление более жестких опций троттлинга в BIOS Setup системной платы, если эта управляющая функция предусмотрена ее производителем.
  4. А вот сжечь процессор Pentium 4 с помощью остановки кулера (при наличии на CPU грамотно установленного радиатора с термопастой), похоже, то ли очень сложно, то ли вообще невозможно. По крайней мере, нам не удалось это сделать. И это притом, что температура в районе 100 градусов для такого сложного устройства — довольно серьезная угроза, тем более, когда она воздействует на CPU в течение отнюдь не микросекунд…
  5. Тепловой режим, в котором работают процессоры на ядре Northwood — гораздо более гладкий и щадящий, чем в случае с Prescott. Однако следует учесть то, что производитель (Intel) особенно не скрывает данного факта, апеллируя к необходимости тщательного подхода к организации системы охлаждения и ее более высокой «прецезионности». Иными словами, работа на грани троттлинга, по сути, декларируется как совершенно нормальное для Prescott явление, а задача интеллектуальной системы охлаждения как раз и состоит в том, чтобы в любых нормальных условиях процессор не переходил эту грань.
  6. В целом, технология Thermal Monitor / Thermal Throttling заслуживает похвалы. Даже как отдельно взятая технология, без учета всего остального. Сама идея, состоящая в том, чтобы в случае внештатной ситуации сначала попытаться приостановить (или хотя бы замедлить) рост температуры, а потом уже, в случае необходимости, применять крайнюю меру — остановку процессора и отключение питания системы, выглядит более изящно и логично с инженерной точки зрения, чем просто остановка процессора по достижению им определенной температуры.

CPU-лимиты и агрессивный троттлинг в Kubernetes / Блог компании Флант / Хабр

Прим. перев.: эта поучительная история Omio — европейского агрегатора путешествий — проводит читателей от базовой теории до увлекательных практических тонкостей в конфигурации Kubernetes. Знакомство с такими случаями помогает не только расширять кругозор, но и предотвращать нетривиальные проблемы.

Доводилось ли вам сталкиваться с тем, что приложение «застревало» на месте, переставало отвечать на запросы о проверке состояния (health check’и) и вы не могли понять причину такого поведения? Одно из возможных объяснений связано с лимитом квот на ресурсы CPU. О нем и пойдет речь в этой статье.

TL;DR:

Мы настоятельно рекомендуем отказаться от CPU limit’ов в Kubernetes (или отключить квоты CFS в Kubelet), если используется версия ядра Linux с ошибкой CFS-квот. В ядре имеется серьезный и хорошо известный баг, который приводит к избыточному троттлингу и задержкам
.

В Omio вся инфраструктура управляется Kubernetes. Все наши stateful- и stateless-нагрузки работают исключительно на Kubernetes (мы используем Google Kubernetes Engine). В последние полгода мы стали наблюдать рандомные подтормаживания. Приложения зависают или перестают отвечать на health check’и, теряют связь с сетью и т.п. Подобное поведение долго ставило нас в тупик, и, наконец, мы решили заняться проблемой вплотную.

Краткое содержание статьи:

  • Несколько слов о контейнерах и Kubernetes;
  • Как реализованы CPU request’ы и limit’ы;
  • Как CPU limit работает в средах с несколькими ядрами;
  • Как отслеживать троттлинг CPU;
  • Решение проблемы и нюансы.

Несколько слов о контейнерах и Kubernetes

Kubernetes, по сути, является современным стандартом в мире инфраструктуры. Его основная задача — оркестровка контейнеров.

Контейнеры

В прошлом нам приходилось создавать артефакты вроде Java JAR’ов/WAR’ов, Python Egg’ов или исполняемых файлов для последующего запуска на серверах. Однако, чтобы заставить их функционировать, приходилось проделывать дополнительную работу: устанавливать среду выполнения (Java/Python), размещать необходимые файлы в нужных местах, обеспечивать совместимость с конкретной версией операционной системы и т.д. Другими словами, приходилось уделять пристальное внимание управлению конфигурациями (что часто служило причиной раздоров между разработчиками и системными администраторами).

Контейнеры всё изменили. Теперь артефактом выступает контейнерный образ. Его можно представить в виде этакого расширенного исполняемого файла, содержащего не только программу, но и полноценную среду выполнения (Java/Python/…), а также необходимые файлы/пакеты, предустановленные и готовые к запуску. Контейнеры можно развертывать и запускать на различных серверах без каких-либо дополнительных действий.

Кроме того, контейнеры работают в собственном окружении-песочнице. У них есть свой собственный виртуальный сетевой адаптер, своя файловая система с ограниченным доступом, своя иерархия процессов, свои ограничения на CPU и память и т. д. Все это реализовано благодаря особой подсистеме ядра Linux — namespaces (пространства имен).

Kubernetes

Как было сказано ранее, Kubernetes — это оркестратор контейнеров. Он работает следующим образом: вы предоставляете ему пул машин, а затем говорите: «Эй, Kubernetes, запусти-ка десять экземпляров моего контейнера с 2 процессорами и 3 Гб памяти на каждый, и поддерживай их в рабочем состоянии!». Kubernetes позаботится обо все остальном. Он найдет свободные мощности, запустит контейнеры и будет перезапускать их при необходимости, выкатит обновление при смене версий и т.д. По сути, Kubernetes позволяет абстрагироваться от аппаратной составляющей и делает все разнообразие систем пригодным для развертывания и работы приложений.

Kubernetes с точки зрения простого обывателя

Что такое request’ы и limit’ы в Kubernetes

Окей, мы разобрались с контейнерами и Kubernetes. Также мы знаем, что несколько контейнеров могут находиться на одной машине.

Можно провести аналогию с коммунальной квартирой. Берется просторное помещение (машины/узлы) и сдается нескольким арендаторам (контейнерам). Kubernetes выступает в роли риэлтора. Возникает вопрос, как удержать квартирантов от конфликтов друг с другом? Что, если один из них, скажем, решит занять ванную комнату на полдня?

Именно здесь в игру вступают request’ы и limit’ы. CPU Request нужен исключительно для планирования. Это нечто вроде «списка желаний» контейнера, и используется он для подбора самого подходящего узла. В то же время CPU Limit можно сравнить с договором аренды — как только мы подберем узел для контейнера, тот не сможет выйти за установленные пределы. И вот тут возникает проблема…

Как реализованы request’ы и limit’ы в Kubernetes

Kubernetes использует встроенный в ядро механизм троттлинга (пропуска тактов) для реализации CPU limit’ов. Если приложение превышает лимит, включается троттлинг (т.е. оно получает меньше тактов CPU). Request’ы и limit’ы для памяти организованы иначе, поэтому их легче обнаружить. Для этого достаточно проверить последний статус перезапуска pod’а: не является ли он «OOMKilled». С троттлингом CPU все не так просто, поскольку K8s делает доступными только метрики по использованию, а не по cgroups.

CPU Request

Как реализован CPU request

Для простоты давайте рассмотрим процесс на примере машины с 4-ядерным CPU.

K8s использует механизм контрольных групп (cgroups) для управления распределением ресурсов (памяти и процессора). Для него доступна иерархическая модель: потомок наследует limit’ы родительской группы. Подробности распределения хранятся в виртуальной файловой системе (/sys/fs/cgroup). В случае процессора это /sys/fs/cgroup/cpu,cpuacct/*.

K8s использует файл cpu.share для распределения ресурсов процессора. В нашем случае корневая контрольная группа получает 4096 долей ресурсов CPU — 100% доступной мощности процессора (1 ядро = 1024; это фиксированное значение). Корневая группа распределяет ресурсы пропорционально в зависимости от долей потомков, прописанных в cpu.share, а те, в свою очередь, аналогичным образом поступают со своими потомками, и т.д. В типичном узле Kubernetes корневая контрольная группа имеет три потомка: system.slice, user.slice и kubepods. Две первых подгруппы используются для распределения ресурсов между критически важными системными нагрузками и пользовательскими программами вне K8s. Последняя — kubepods — создается Kubernetes’ом для распределения ресурсов между pod’ами.

На схеме выше видно, что первая и вторая подгруппы получили по 1024 доли, при этом подгруппе kuberpod выделено 4096 долей. Как такое возможно: ведь корневой группе доступны всего 4096 долей, а сумма долей ее потомков значительно превышает это число (6144)? Дело в том, что значение имеет логический смысл, поэтому планировщик Linux (CFS) использует его для пропорционального распределения ресурсов CPU. В нашем случае первые две группы получают по 680 реальных долей (16,6% от 4096), а kubepod получает оставшиеся 2736 долей. В случае простоя первые две группы не будут использовать выделенные ресурсы.

К счастью, в планировщике есть механизм, позволяющий избежать потери неиспользуемых ресурсов CPU. Он передает «простаивающие» мощности в глобальный пул, из которого они распределяются по группам, нуждающимся в дополнительных мощностях процессора (передача происходит партиями, чтобы избежать потерь от округления). Аналогичный метод применяется и ко всем потомкам потомков.

Этот механизм обеспечивает справедливое распределение мощностей процессора и следит за тем, чтобы ни один процесс не «воровал» ресурсы у других.

CPU Limit

Несмотря на то, что конфигурации limit’ов и request’ов в K8s выглядят похоже, их реализация кардинально отличается: это самая вводящая в заблуждение и наименее задокументированная часть.

K8s задействует механизм квот CFS для реализации лимитов. Их настройки задаются в файлах cfs_period_us и cfs_quota_us в директории cgroup (там же расположен файл cpu.share).

В отличие от cpu.share, квота основана на периоде времени, а не на доступной мощности процессора. cfs_period_us задает продолжительность периода (эпохи) — это всегда 100000 мкс (100 мс). В K8s есть возможность изменить это значение, однако она пока доступна только в альфа-версии. Планировщик использует эпоху для перезапуска использованных квот. Второй файл, cfs_quota_us, задает доступное время (квоту) в каждой эпохе. Обратите внимание, что она также указывается в микросекундах. Квота может превышать продолжительность эпохи; другими словами, она может быть больше 100 мс.

Давайте рассмотрим два сценария на 16-ядерных машинах (наиболее распространенный тип компьютеров у нас в Omio):

Сценарий 1: 2 потока и лимит в 200 мс. Без троттлинга

Сценарий 2: 10 потоков и лимит в 200 мс. Троттлинг начинается после 20 мс, доступ к ресурсам процессора возобновляется еще через 80 мс

Допустим, вы установили CPU limit на 2 ядра; Kubernetes переведет это значение в 200 мс. Это означает, что контейнер может использовать максимум 200 мс процессорного времени без троттлинга.

И здесь начинается самое интересное. Как было сказано выше, доступная квота составляет 200 мс. Если у вас параллельно работают десять потоков на 12-ядерной машине (см. иллюстрацию к сценарию 2), пока все остальные pod’ы простаивают, квота будет исчерпана всего через 20 мс (поскольку 10 * 20 мс = 200 мс), и все потоки данного pod’а «зависнут» (throttle) на следующие 80 мс. Усугубляет ситуацию уже упомянутый баг планировщика, из-за которого случается избыточный троттлинг и контейнер не может выработать даже имеющуюся квоту.

Как оценить троттлинг в pod’ах?

Просто войдите в pod и выполните cat /sys/fs/cgroup/cpu/cpu.stat.

  • nr_periods — общее число периодов планировщика;
  • nr_throttled — число throttled-периодов в составе nr_periods;
  • throttled_time — совокупное throttled-время в наносекундах.

Что же на самом деле происходит?

В итоге мы получаем высокий троттлинг во всех приложениях. Иногда он в полтора раза сильнее расчетного!

Это приводит к различным ошибкам — сбоям проверок готовности (readiness), зависаниям контейнеров, разрывам сетевых подключений, таймаутам внутри сервисных вызовов. В конечном счете это выражается в увеличенной задержке и повышении количества ошибок.

Решение и последствия

Тут все просто. Мы отказались от limit’ов CPU и занялись обновлением ядра ОС в кластерах на самую свежую версию, в которой баг был исправлен. Число ошибок (HTTP 5xx) в наших сервисах сразу же значительно упало:

Ошибки HTTP 5xx

Ошибки HTTP 5xx одного критически важного сервиса

Время отклика p95

Задержка запросов критически важного сервиса, 95-я процентиль

Расходы на эксплуатацию

Число потраченных экземпляро-часов

В чем подвох?

Как было сказано в начале статьи:

Можно провести аналогию с коммунальной квартирой… Kubernetes выступает в роли риэлтора. Но как удержать квартирантов от конфликтов друг с другом? Что, если один из них, скажем, решит занять ванную комнату на полдня?

Вот в чем подвох. Один нерадивый контейнер может поглотить все доступные ресурсы процессора на машине. Если у вас толковый стек приложений (например, должным образом настроены JVM, Go, Node VM), тогда это не проблема: можно работать в таких условиях в течение длительного времени. Но если приложения оптимизированы плохо или совсем не оптимизированы (FROM java:latest), ситуация может выйти из-под контроля. У нас в Omio имеются автоматизированные базовые Dockerfiles с адекватными настройками по умолчанию для стека основных языков, поэтому подобной проблемы не существовало.

Мы рекомендуем наблюдать за метриками USE (использование, насыщение и ошибки), задержками API и частотой появления ошибок. Следите за тем, чтобы результаты соответствовали ожиданиям.

Ссылки

Такова наша история. Следующие материалы сильно помогли разобраться в том, что происходит:
Отчеты об ошибках Kubernetes:
Сталкивались ли вы с подобными проблемами в своей практике или обладаете опытом, связанным с троттлингом в контейнеризованных production-средах? Поделитесь своей историей в комментариях!

P.S. от переводчика

Читайте также в нашем блоге:

Что такое тепловое дросселирование и как его предотвратить

Тепло — неизбежный побочный продукт работы. Он возникает, когда вы запускаете двигатель автомобиля, совершаете быструю прогулку или что-то еще, что вызывает трение. Тепло также преобладает в электронике, с которой труднее справиться и которая может отрицательно сказаться на их непрерывной работе. Когда дело доходит до видеокарт, существует множество способов управления теплом, от пассивного охлаждения до вентиляторов и даже воды. Но когда эти решения не работают, у вашего графического процессора есть еще один способ справиться с перегревом: регулирование температуры.

Что такое тепловое дросселирование?

Когда ваш графический процессор принимает на себя тяжелую рабочую нагрузку, например, в играх, он нагревается. Когда ваше охлаждающее решение больше не может рассеивать тепло достаточно быстро, чтобы поддерживать температуру в безопасном диапазоне, ваша видеокарта начинает сбрасывать производительность, чтобы отводить тепло. Частоты ядра и памяти начинают падать вместе с частотой кадров, пока температура не упадет до безопасного рабочего диапазона. Все современные графические процессоры имеют эту функцию для защиты электронных компонентов от повреждений.Неуправляемое тепловое регулирование может иметь большое влияние на производительность. И хотя тепловое дросселирование само по себе не вызывает никаких повреждений, основная причина дросселирования — нагревание — может вызвать повреждение и сократить срок службы вашей видеокарты.

Как предотвратить дросселирование

Чтобы поддерживать производительность, вам необходимо контролировать нагрев, но не все видеокарты испытывают троттлинг в одинаковой степени или даже вообще. Существует множество сценариев, определяющих влияние терморегулирования на вашу систему.Выбор корпуса, решение для охлаждения и воздушный поток — три основных фактора, которые необходимо учитывать.

Небольшой корпус без открытого пространства задерживает тепло и препятствует воздушному потоку, что затрудняет охлаждение графического процессора. Если вы выберете более крупный, хорошо продуманный корпус, вы получите больше креплений для вентиляторов и дополнительные возможности для оптимизации воздушного потока. Возможность установки дополнительных вентиляторов в ваш корпус особенно выгодна, если производитель вашего графического процессора использовал специальное решение для охлаждения, которое отводит тепло в ваш корпус, а не удаляет его напрямую, как в эталонных конструкциях.

Добавление дополнительных вентиляторов в верхнюю часть корпуса гарантирует, что тепло, выделяемое вашим графическим процессором, эффективно отводится от корпуса. Он также снижает температуру воздуха внутри вашего корпуса, сохраняя при этом другие компоненты, такие как процессор и память, намного холоднее.

Марка видеокарты, которую вы выбираете, может зависеть от личных предпочтений, но решение для охлаждения, которое она использует, является важным решением. В эталонных конструкциях — вентиляторы нагнетательного типа — обычно используется один вентилятор для охлаждения карты.Холодный воздух проходит через заднюю часть видеокарты и выводится через разъемы. Такая конструкция эффективна, но один вентилятор снижает производительность.

При выборе видеокарты часто бывает идеальным выбрать ее с системой охлаждения с несколькими вентиляторами. Дополнительные вентиляторы — иногда целых три — обеспечивают достаточный воздушный поток, чтобы значительно уменьшить или даже устранить дросселирование. Следует отметить, что ваш корпус должен обеспечивать достаточный поток воздуха для обработки горячего воздуха, выкачиваемого этими типами видеокарт, поскольку их кулеры напрямую не отводят тепло от корпуса.

Типовые карты эталонного дизайна: стильные, но с одним вентилятором

Здесь еще тонна охлаждения …
(что может снизить температуру и снизить уровень шума)

Если замена или добавление оборудования невозможна, вы все равно можете снизить температуру с помощью свободно доступных инструментов.

С помощью таких утилит, как MSI Afterburner или EVGA PrecisionX, можно настроить индивидуальную кривую вентилятора. Установив кривую вентилятора вручную, вы можете установить более агрессивную скорость вращения вентилятора для данной температуры.На заводе скорость вращения вентилятора оптимизирована для достижения баланса между шумом и производительностью. В эталонных картах этот баланс часто больше склоняется к подавлению шума и может привести к тепловому дросселированию.

Уровень шума увеличится, возможно, значительно, но ваш графический процессор сможет намного быстрее рассеивать тепло и поддерживать производительность.

По умолчанию слева, настраиваемый справа

Если дополнительный шум вентилятора слишком велик, есть еще одно решение ваших проблем с тепловым дросселированием: пониженное напряжение.

Иногда величина напряжения, используемого вашей картой, устанавливается выше, чем необходимо для правильной работы вашей карты. При более высоком напряжении выделяется больше тепла, даже если частота и частота памяти остаются прежними. Пониженное напряжение вашей видеокарты даже на небольшую величину может снизить температуру настолько, чтобы уменьшить или даже устранить тепловое дросселирование. Однако это не гарантированное решение и может вызвать проблемы со стабильностью. Для большинства пользователей мы рекомендуем сочетание лучшего охлаждения в сочетании с регулировкой кривой вентилятора.

Большинство инструментов мониторинга способны не только управлять вентиляторами графического процессора и изменять напряжение. Они также отслеживают температуру, частоту ядра и памяти, а также использование графического процессора. Большинство из них также предлагают хотя бы базовые возможности разгона. Это важно, потому что вы не можете предотвратить то, чего не видите.

Мониторинг температуры вашего графического процессора, а также частоты ядра и памяти позволяет определить, когда вы испытываете троттлинг.Важно отметить, что есть несколько вещей, на которые нужно обратить внимание, прежде чем вам понадобится разобрать утилиты. Если вы испытываете заикание или замечаете видимое падение частоты кадров, вероятно, ваша видеокарта замедлилась из-за выделения тепла. Если вы не изменили кривую вентилятора видеокарты, и вентилятор начинает звучать как реактивный двигатель, есть большая вероятность, что вы достигли точки дросселирования. Затем вы можете подтвердить это с помощью любого инструмента.

Если ваша температура превышает точку дросселирования вашей видеокарты и ваши частоты начинают падать, вы знаете, что пора взглянуть на ваше охлаждение.В идеале вы хотите, чтобы температура была как можно ниже, все, что ниже 80 градусов, является нормальным и следует контролировать дросселирование. Например, у Nvidia GTX 1080 Ti точка дросселирования составляет 84 градуса. Если вы поддерживаете температуру ниже 80 градусов, у вас остается немного передышки, поэтому вы можете сосредоточиться на развлечениях, а не на мониторинге частот графического процессора.

Важно помнить, что у каждой видеокарты своя точка дросселирования. Например, GTX 980 и 970 предыдущего поколения имеют температуру 80 градусов, в то время как карты AMD серии Vega могут достичь максимальной температуры 85 градусов, прежде чем они начнут работать.Вам нужно будет узнать точку дросселирования для вашей конкретной карты, чтобы установить эффективную кривую вентилятора и напряжение.

Решая, какую утилиту использовать, важно учитывать объем того, что вы собираетесь отслеживать. Если вы собираетесь сосредоточиться на своей видеокарте, я рекомендую MSI Afterburner или Asus Tweak. Любой из этих инструментов предоставит все параметры мониторинга и конфигурации, которые могут вам понадобиться, включая разгон.

Если вы хотите контролировать всю свою систему, вам нужно посмотреть что-нибудь еще, например, программное обеспечение NZXT Cam. Хотя Cam контролирует всю вашу систему, он не предлагает столько возможностей для настройки вашей видеокарты. Не помешает установить более одной утилиты, чтобы получить более широкий спектр функций мониторинга.

Дополнительная литература

,

сообщений о дросселировании ЦП

Что ты видишь?

Много сообщений о троттлинге ЦП.

Ниже приведены примеры:

15 марта 17:34:14 rl043 ядро: CPU8: температура пакета выше порогового значения, частота процессора снижена (общее количество событий = 1)
15 марта 17:34:14 ядро ​​rl043: CPU36: температура пакета выше порога, частота процессора снижена ( всего событий = 1)
15 марта 17:34:14 rl043 ядро: CPU6: температура ядра выше порогового значения, тактовая частота процессора снижена (общее количество событий = 1)
15 марта 17:34:14 rl043 ядро: CPU34: температура ядра выше порога, Частота процессора снижена (общее количество событий = 1)
15 марта 17:34:14 rl043 ядро: CPU41: температура пакета выше порогового значения, частота процессора снижена (всего событий = 1)

Окружающая среда:

Установка новой системы

Серверная плата Intel® S2600BPB

BIOS Ver.: SE5C620.86B.00.01.0009.101920170742

BMC FW Версия: 1.29.7d703f59

Резервное копирование BMC FW Rev: 1.29.7d703f59

Идентификатор сборки: 7D703F59

SDR Версия пакета: 1.24

Mgmt Engine (ME) FW Версия: 04.00.04.288

Примечание Даже несмотря на то, что существует температура выше порогового значения, при проверке внутренних датчиков все температуры находятся в пределах спецификации.

Как это исправить:

Перезагрузите систему в BIOS платы [Руководство по утилите настройки BIOS для серверных систем Intel®].Перейдите в меню Advanced> System Acoustic and Performance Configuration и выполните следующие действия:

  1. Выберите «Производительность» в качестве параметра «Установить профиль вентилятора».
  2. Попробуйте любую из настроек смещения ШИМ вентилятора от 0 до 100, помня, что чем выше значение, тем шумнее может стать система.

Анализ, который можно также принять во внимание:

  1. Убедитесь, что BIOS обновлена.
  2. Обратитесь в службу поддержки с журналами Intel System Information Retrieval Utility (щелкните здесь, чтобы узнать подробности).Щелкните здесь, чтобы увидеть последнюю версию.

Причина и дополнительная информация:

ИНФОРМАЦИЯ В ДАННОЙ СТАТЬЕ ИСПОЛЬЗУЕТСЯ НАШИМИ КЛИЕНТАМИ, НО НЕ ИСПЫТАЕТСЯ, ПОЛНОСТЬЮ ПОВТОРНО ИЛИ ПРОВЕРЯЛАСЬ INTEL. ИНДИВИДУАЛЬНЫЕ РЕЗУЛЬТАТЫ МОГУТ РАЗНИЦАТЬСЯ. ВСЕ РАЗМЕЩЕНИЯ И ИСПОЛЬЗОВАНИЕ СОДЕРЖАНИЯ НА ДАННОМ САЙТЕ ПОДВЕРГАЮТСЯ УСЛОВИЯМ ИСПОЛЬЗОВАНИЯ САЙТА.

.

Индикаторы ограничения тока и мощности в Intel® XTU …

Что ты видишь?

Что означает, когда индикаторы ограничения тока и ограничения мощности отображают «Да» в программе Intel® XTU Utility?

Среда:

Применимо для всех процессоров Intel®, поддерживающих утилиту Intel® XTU.

Как исправить:

Процессоры имеют два режима тепловой защиты: дросселирование и автоматическое отключение.Когда температура сердечника превышает установленную температуру дроссельной заслонки, она начинает снижать мощность, чтобы вернуть температуру ниже этой точки. Температура дроссельной заслонки может варьироваться в зависимости от процессора и настроек BIOS.

Если условия таковы, что дросселирование не может поддерживать температуру, например, отказ системы охлаждения или неправильная сборка, процессор автоматически отключается, чтобы предотвратить необратимое повреждение.

Дросселирование предельного тока

Может быть несколько причин, по которым текущий предел ограничивает процессор.Три распространенные причины ограничения тока:

  1. Для ядра процессора IccMax установлено слишком низкое значение в XTU.
  2. В BIOS установлено слишком низкое ограничение тока VR (регулятор напряжения). (У разных производителей материнских плат могут быть разные имена для этого элемента управления, поэтому обратитесь к поставщику материнской платы.)
  3. Материнская плата не может обеспечить достаточно высокий ток для данного процессора. Соединение маломощной материнской платы с микросхемой с очень высокой тепловой расчетной мощностью (TDP) может вызвать дросселирование тока, даже если ограничения тока установлены на максимум.

Регулировка ограничения мощности

Может быть несколько причин, по которым ограничение мощности влияет на процессор. Три распространенные причины ограничения мощности:

  • Предел мощности процессора PL1 / PL2 установлен слишком низким в Intel® XTU.
  • Ограничение напряжения ядра установлено слишком низким в XTU.
  • Система не имеет достаточного охлаждения и питания.

Example of Current Limit Throttling

Причина и дополнительная информация:

ИНФОРМАЦИЯ В ДАННОЙ СТАТЬЕ ИСПОЛЬЗУЕТСЯ НАШИМИ КЛИЕНТАМИ, НО НЕ ИСПЫТАНА, ПОЛНОСТЬЮ ПОВТОРНА ИЛИ ПРОВЕРЕНА INTEL.ИНДИВИДУАЛЬНЫЕ РЕЗУЛЬТАТЫ МОГУТ РАЗНИЦАТЬСЯ. ВСЕ РАЗМЕЩЕНИЯ И ИСПОЛЬЗОВАНИЕ СОДЕРЖАНИЯ НА ДАННОМ САЙТЕ ПОДВЕРГАЮТСЯ УСЛОВИЯМ ИСПОЛЬЗОВАНИЯ САЙТА.

.

Что такое «тепловое дросселирование» MacBook и как это исправить?

Вы, наверное, слышали, что последние модели MacBook — популярный товар. Буквально. Споры вокруг теплового троттлинга процессора в последних MacBook, возможно, поутихли, но, вероятно, многие все еще задаются вопросом, что такое «тепловое дросселирование» в первую очередь. Это большое дело? На тебя это вообще влияет? Удивительно, но ответ не черно-белый. (Довольно болезненная) тема терморегулирования MacBook требует более глубокого взгляда на внутреннюю работу вашего ноутбука, чтобы полностью понять.

Какие MacBook затронуты?

В принципе, на любой MacBook (или действительно любой высокопроизводительный ноутбук) может повлиять терморегулирование при «правильных» обстоятельствах. Тем не менее, некоторые модели особенно подвержены тепловому удару.

Совсем недавно модели MacBooks Pro 2018 и 2019 годов показали серьезные проблемы с дросселированием. В случае 15-дюймовых и 13-дюймовых моделей MacBook Pro 2018 года (с сенсорной панелью) виновником стала исправленная ошибка прошивки.Мы провели опрос, спрашивая наших читателей, стоит ли Apple делать MacBook большей толщины, чтобы решить проблемы с температурой в будущих моделях. Результаты были в пользу более компактного MacBook с большим тепловым запасом. К сожалению, 15-дюймовый MacBook Pro 2019 года показал, что Apple все же пришлось принять агрессивные меры, чтобы снизить температуру.

В данном случае, однако, это было не дросселирование, а пониженное напряжение с завода, что указывает на то, что основная проблема ограниченного теплового запаса по-прежнему преследует линейку MacBook Pro.Это вполне может быть одной из основных причин, по которой Apple решительно движется к использованию вместо этого своих собственных холодных процессоров ARM.

Что заставляет MacBook перегревать?

Энергия в форме электричества — это магия, заставляющая компьютер работать, но побочным продуктом работы с этой энергией является тепла . Некоторая часть электроэнергии, которую ваш процессор использует для выполнения всех этих вычислений, тратится впустую и нагревает все. Это плохо, потому что существует температурный диапазон, в котором схема работает должным образом, и, конечно же, очень высокие температуры, при которых материалы, из которых состоит сам процессор, могут быть повреждены.

Производитель указывает температурный диапазон, который никогда не должен превышаться, если вы хотите, чтобы ваш процессор работал в течение своего полного естественного срока службы. Точные числа варьируются от одной модели ЦП к другой, но у каждого ЦП есть предел.

Когда вы просите ЦП сделать что-то, для чего требуется большая часть или вся его вычислительная мощность, тепло начинает быстро накапливаться. Система охлаждения вашего MacBook срабатывает, чтобы отвести тепло от процессора и из вашей системы. Обычно эта система охлаждения включает в себя металлический радиатор, непосредственно прикрепленный к корпусу процессора, и систему вентиляторов, которая перемещает воздух над ним, так что вместо этого накопленная энергия может передаваться в комнату.

Текущий статус MacBook Pro:

— внешняя клавиатура сверху, потому что внутренняя клавиатура сломана
— замороженные креветки как лед, чтобы остановить перегрев при просмотре веб-страниц pic.twitter.com/zFTzyWTeKH

— ؜ (@levelsio) 1 ноября 2019 г.

Если система охлаждения работает наилучшим образом, но температура продолжает расти, дросселирование стоит следующим в списке средств, чтобы остановить путь к тепловой смерти. Когда происходит тепловое регулирование, процессор замедляется ниже своей базовой тактовой частоты , чтобы не достичь максимальной температуры, указанной производителем процессора.В результате получается более холодный процессор, но при этом он работает медленнее, чем предполагалось.

Как уменьшить перегрев MacBook

За исключением троттлинга, вызванного ошибкой, есть несколько вещей, которые вы можете сделать, чтобы ваш MacBook не стал настолько горячим, что ему пришлось бы сделать себе временную лоботомию, чтобы справиться.

Дайте ему возможность дышать

Вокруг аппарата должен быть достаточный воздушный поток, чтобы он мог перемещать воздух через систему. Это означает, что все вентиляционные отверстия должны быть чистыми и беспрепятственными.Тепло также покидает ноутбук через сам корпус, поэтому его можно поставить на подставку, чтобы оптимизировать площадь поверхности, обеспечивающую хороший воздушный поток.

На рынке также есть активные кулеры для ноутбуков, но насколько они эффективны, до сих пор неизвестно. Таким образом, ваш опыт может отличаться, если вы решите попробовать один.

Узнать приемку

В конце концов, однако, тепловое дросселирование может быть просто ценой, которую приходится платить в обмен на невероятно тонкий и легкий форм-фактор или приемлемый шум вентилятора.Хотя дросселирующий процессор может работать хуже, чем это указано на бумаге, этот более низкий уровень производительности может быть вполне достаточным для повседневной практической работы. Это означает, что дросселирование является проблемой только тогда, когда это действительно проблема.

Обновите или замените ноутбук

Наконец, лучшим вариантом может быть обновление или замена ноутбука. Наш собственный Джефф Бенджамин в своем взгляде на MacBook Pro 2019 года ранее в этом году отметил, что эта конкретная модель, как правило, немного лучше, чем другие, дросселирует:

Хотя дросселирование всегда будет иметь значение для ноутбуков с ограниченным пространством, я обнаружил, что процессор в MacBook Pro 2019 года остается на уровне базовой тактовой частоты или выше под нагрузкой.Конечно, он не сможет работать в режиме турбонаддува в течение продолжительных периодов времени, но этого следовало ожидать.

Вы читаете 9to5Mac — экспертов, которые день за днем ​​сообщают новости об Apple и окружающей ее экосистеме. Обязательно заходите на нашу домашнюю страницу, чтобы быть в курсе всех последних новостей, и подписывайтесь на 9to5Mac в Twitter, Facebook и LinkedIn, чтобы оставаться в курсе. Не знаете с чего начать? Просмотрите наши эксклюзивные истории, обзоры, инструкции и подпишитесь на наш канал YouTube.

FTC: Мы используем автоматические партнерские ссылки для получения дохода. Подробнее.

Apple iPhone 11 case deals on Amazon


Посетите 9to5Mac на YouTube, чтобы узнать больше новостей Apple:

,

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *