Программисты

Программисты

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.

Re: Программисты

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)

Re: Программисты


Dmitry Krivitsky пишет:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Кстати, 32768 - это же 2 в 15 степени (часовые кварцы, кстати, на такой частоте работают). Т.е. как в кварцевых часах стоит 15-разрядный регистр и по переполнению переводит секундную стрелку, а тут по переполнению похожего регистра летит всё к чертям, причём "хранящуюся на нем информацию нельзя восстановить после возникновения сбоя" и глюк этот чисто программный. Кстати, у тех, у кого SSD дохли после трёх лет эксплуатации (многие раньше жаловались), не сталкивались ли именно с этой запрограммированной проблемой?

Re: Программисты

Юpa Шaлaк написал:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)


Скорее, 2. Т.е. "правильные" тоже гарантированно сдохнут, но не через 3 года работы, а через 250 тыс.

Re: Программисты

Dmitry Krivitsky <kriv@fido.fw.nu> wrote:


https://support.hpe.com/hpesc/... 



Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.



Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


марсианин не тормоз.
просто пока до марса новости дойдут...

--
Slawa Olhovchenkov

Re: Программисты


nsn пишет:

Юpa Шaлaк написал:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)


Скорее, 2. Т.е. "правильные" тоже гарантированно сдохнут, но не через 3 года работы, а
через 250 тыс.


Оно, может, и не было именно намерения, а "так получилось". Т.е. человек по привычке использовал целый двухбайтовый тип данных и не подумал, что через 3 года оно того-с, переполнится. Ну и обработку переполнения не сделал, из-за чего переменная не просто обнуляется, а невозвратно портятся данные.

В общем, ошибки у всех бывают, позорно то, что всплывают ошибки через 3 года и заканчиваются крашем девайсов и данных.

ЗЫ. Помню, у меня была тупая ошибка обработки даты. Надо было из даты вырезать двузначное значение года и я обсчитался на один символ и вырезал не последние два символа года, а 2-3 символы. Причём программа работала нормально подряд два года: в 1999 и 2000 годах. А потом случился 2001-й год и произошёл сбой :о)

Re: Программисты

On 11/02/2020 04:33, YuraS wrote:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 


Какой-то программистский гений ухитрился так написать firmware, что
SSD дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все
одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)

А вот я подозреваю, что подыхание строго до пенсионного возраста (сразу
после гарантии) - возможно, было одним из бизнес-требований хпе.
Запланированные поломки.
Куда Грета смотрит? Ведь это же запланированный вредный мусор, который
можно уменьшить в разы.

Re: Программисты

Alexander A. Golubtsov написал:

nsn пишет:

Юpa Шaлaк написал:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)


Скорее, 2. Т.е. "правильные" тоже гарантированно сдохнут, но не через 3 года работы, а
через 250 тыс.


Оно, может, и не было именно намерения, а "так получилось". Т.е. человек по привычке использовал целый двухбайтовый тип данных и не подумал, что через 3 года оно того-с, переполнится. Ну и обработку переполнения не сделал, из-за чего переменная не просто обнуляется, а невозвратно портятся данные.

В общем, ошибки у всех бывают, позорно то, что всплывают ошибки через 3 года и заканчиваются крашем девайсов и данных.

ЗЫ. Помню, у меня была тупая ошибка обработки даты. Надо было из даты вырезать двузначное значение года и я обсчитался на один символ и вырезал не последние два символа года, а 2-3 символы. Причём программа работала нормально подряд два года: в 1999 и 2000 годах. А потом случился 2001-й год и произошёл сбой :о)


Ошибки бывают, однако весьма непросто бессознательно написать код, с которым, как говорят, после 0x8000 часов работы SSD перестают выдавать наружу что-либо вообще, даже свой серийный номер, какое-то время его использовать, а потом бессознательно это исправить, так чтобы ошибка обнаружилась только месяцы спустя.

Re: Программисты

On пн, 10 фев 2020 17:18:32, Dmitry Krivitsky <kriv@fido.fw.nu> wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Прямо deja vu - в 2012 у меня с Crucial m4 был похожий bug, только часов поменьше - 5200:
https://ccm.net/faq/29514-cruc... 

--igor

Re: Программисты

On 2/11/2020 8:40 AM, snhere@gmail.com wrote:

Alexander A. Golubtsov написал:

nsn пишет:

Юpa Шaлaк написал:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)


Скорее, 2. Т.е. "правильные" тоже гарантированно сдохнут, но не через 3 года работы, а
через 250 тыс.


Оно, может, и не было именно намерения, а "так получилось". Т.е. человек по привычке использовал целый двухбайтовый тип данных и не подумал, что через 3 года оно того-с, переполнится. Ну и обработку переполнения не сделал, из-за чего переменная не просто обнуляется, а невозвратно портятся данные.

В общем, ошибки у всех бывают, позорно то, что всплывают ошибки через 3 года и заканчиваются крашем девайсов и данных.

ЗЫ. Помню, у меня была тупая ошибка обработки даты. Надо было из даты вырезать двузначное значение года и я обсчитался на один символ и вырезал не последние два символа года, а 2-3 символы. Причём программа работала нормально подряд два года: в 1999 и 2000 годах. А потом случился 2001-й год и произошёл сбой :о)


Ошибки бывают, однако весьма непросто бессознательно написать код, с которым, как говорят, после 0x8000 часов работы SSD перестают выдавать наружу что-либо вообще, даже свой серийный номер, какое-то время его использовать, а потом бессознательно это исправить, так чтобы ошибка обнаружилась только месяцы спустя.


Я так понимаю, что исправлять его стали, когда SSD начали массово дохнуть.
Они, вроде как, продают SSD с этим firmware с 2015 года - как раз в 2019
должны были начать дохнуть.

Re: Программисты


snhere пишет:

Alexander A. Golubtsov написал:

nsn пишет:

Юpa Шaлaк написал:

On 2/10/2020 8:18 PM, Dmitry Krivitsky wrote:

https://support.hpe.com/hpesc/... 

Какой-то программистский гений ухитрился так написать firmware, что SSD
дохнет после ровно 32768 часов работы. По часам.

Если в RAIDе много SSD, купленных одновременно - подохнут все одновременно.


Ну так прелесть же. На самом деле, даже хорошие программисты могут
написать редкую хню. Вот прямо сегодня разбирал один замечательный
случай, когда благими намерениями пришли ведомо куда.
Может и там были благие намерения (типа сэкономить 4 байта.)


Скорее, 2. Т.е. "правильные" тоже гарантированно сдохнут, но не через 3 года работы, а
через 250 тыс.


Оно, может, и не было именно намерения, а "так получилось". Т.е. человек по привычке использовал целый двухбайтовый тип данных и не подумал, что через 3 года оно того-с, переполнится. Ну и обработку переполнения не сделал, из-за чего переменная не просто обнуляется, а невозвратно портятся данные.

В общем, ошибки у всех бывают, позорно то, что всплывают ошибки через 3 года и заканчиваются крашем девайсов и данных.

ЗЫ. Помню, у меня была тупая ошибка обработки даты. Надо было из даты вырезать двузначное значение года и я обсчитался на один символ и вырезал не последние два символа года, а 2-3 символы. Причём программа работала нормально подряд два года: в 1999 и 2000 годах. А потом случился 2001-й год и произошёл сбой :о)


Ошибки бывают, однако весьма непросто бессознательно написать код, с которым, как
говорят, после 0x8000 часов работы SSD перестают выдавать наружу что-либо вообще, даже
свой серийный номер, какое-то время его использовать, а потом бессознательно это
исправить, так чтобы ошибка обнаружилась только месяцы спустя.


Да, в принципе, запросто. Отвели два байта под число, а когда оно вылезло за пределы этих двух байт в третий, то в этом третьем байте оказался важный участок кода, затирание которого приводило к краху. Как раз бессознательно такое сделать проще, чем сознательно. Ну и спохватились и стали разбираться, скорей всего, когда накопители уже начали резко и массово дохнуть по непонятной причине. Накопители то серверные, работают круглосуточно, потому первые партии должны были сдохнуть все практически одновременно.