-
Data: 2013-06-02 10:52:51
Temat: Re: Błędy sprzętowe wykryte przez program
Od: Edek <e...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Dnia Sat, 01 Jun 2013 09:43:38 -0700 po głębokim namyśle Piotrek rzekł:
> Zazwyczaj przyczyną błędnego działania programu jest bug w kodzie. Czy
> znacie natomiast jakieś ciekawe sytuacje, w których program był
> bezbłędny, a jego niewłaściwe działanie było spowodowane usterką samego
> sprzętu, na którym działał, tzn. przypadki programowego wykrycia błędu
> sprzętowego?
> Ja z głośniejszych znam tylko ten:
> http://en.wikipedia.org/wiki/Pentium_FDIV_bug
Oprócz błędów znanych są też przypadkowe:
http://www.cs.toronto.edu/~bianca/papers/sigmetrics0
9.pdf
Tego typu testy, autorstwa Google ale był podobny z LHC, którego
teraz nie mogę znaleźć, pokazują że niestety istnieje całkiem
realne ryzyko, że pojedyncze bity się trwale przestawią. Problem
dotyczy nawet pamięci z ECC, gdzie jeden przestawiony bit jest
"naprawiany" przez ECC, podobnie na dyskach istnieje ECC.
Mówiąc wprost, oprogramowanie często nie uwzględnia błędów
pamięci. W życiu straciłem tylko ze 3-4 systemy plików, z czego
2 przez błędy RAM - nie te przypadkowe, zdarzyły się systematyczne
pady RAM wykrywalne przez memcheck. Skutek jest taki, że oprogramowanie
niczego nie "zauważa" tylko robi manianę bo RAM zwraca złe dane,
a na błędy RAM większość oprogramowania nie jest odporna.
Podkreślam, że akurat te to wykrywalne systematyczne błędy, tych
przypadkowych w żaden sposób nie da się odtworzyć, a skutek może
być podobny chociaż w mniejszej skali.
Czyli, programiści: jeżeli zdarzy się segfault zawsze można zwalić
na promieniowanie jonizujące, które przestawiło bit w RAM i z
pewnym prawdopodobieństwem ta wymówka może być prawdziwa. Małym
prawdopodobieństwem, które w przypadku działających latami
serwerów staje się prawdopodobieństwem już dość realnym,
gdy pamięć nie ma ECC. Potem loterią są skutki, zależnie
od tego "w co trafi" może się zdarzyć albo nic, albo
regularna anomalia w strukturach danych, i albo ta zmiana
będzie chwilowa aż do padu systemu, albo zostanie utrwalona
w danych zabezpieczonych na X innych sposobów.
--
Edek
Następne wpisy z tego wątku
- 02.06.13 11:56 Wojciech Muła
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-26 Trump-2 JUŻ bardzo łaskawy [1_500 ułaskawień skazanych za Bidena za "Kawkę na Kapitolu"]
- 2025-01-26 Brak bolca ochronnego ładowarki oznacza pożar
- 2025-01-24 Elektryfikacja w ODWROCIE
- 2025-01-25 AMS spalony szybkim zasilaczem USB
- 2025-01-24 stalowe bezpieczniki
- 2025-01-23 Zenek Kapelinder - ?
- 2025-01-25 Błonie => Sales Specialist <=
- 2025-01-25 Lublin => iOS Developer (Swift) <=
- 2025-01-24 Warszawa => Java Developer <=
- 2025-01-24 Białystok => iOS Developer (Swift experience) <=
- 2025-01-24 Warszawa => Programista Full Stack (.Net Core) <=
- 2025-01-24 Warszawa => System Architect (background deweloperski w Java) <=
- 2025-01-24 Lublin => Delphi Programmer <=
- 2025-01-24 Kraków => Key Account Manager <=
- 2025-01-24 Lublin => Programista Delphi <=