自動ニュース作成G
正常なCPUがたまに“こっそり”計算ミスする「Mercurial core」とは何か 米Googleが21年に研究報告
https://www.itmedia.co.jp/news/spv/2410/09/news059.html
2024-10-14 07:37:35
>正常なCPUがまれに計算エラーを起こす。厄介なことに、このエラーは多くの場合“サイレント”であり、誤った計算結果が唯一の症状となる。そのためエラーが発生したことに気付くのが非常に難しい。エラーが検出されずに後続の計算に影響を与え、被害が拡大するケースもある。
昔の職場(大規模スパコン施設)で宇宙線等によるメモリのビット化けが問題になってたけど、それはメモリのパリティーで検出できるんよね。cpuの中でのエラーとなるとかなり対策が難しそう。コストを掛けられるならロックステップ構成にするって手はあるけど費用が・・・。cpu内部二重化くらいかな
・ふと3つのコアが同じ計算をして多数決で…って思ったけど問題のコアが偏るのなら微妙か
・車載マイコンはロックステップになってる。コスト2倍です。ASIL面倒くさい。
・映画のネタになる予感。映画じゃなくても小説のネタにはなるかな
・PC8001で一回だけ化けたのをみたことがある。3Ehのはずが2Ehになってたのでよく覚えてる
・https://gnews.jp/20201227_212541 この辺がそうなのか?
・FACOM 230-10E でみた。ラインプリンタで印字された数字は、再計算では正常な値になってたな。現在のCPUに比べて遙かに単純な回路。
・#2 なるほど車載だと二重化が基本か。ASILってのはこれかhttps://www.synopsys.com/ja-jp/automotive/what-is-asil.html 大変そうだな。俺は昔FTサーバでWINDOWSのロックステップ機の構築したことがあったけど特殊なドライバが必要だったくらいしか覚えてない。
・その昔、タンデム社の NonStopOSを使った記憶がある。理想は良かったけどよく止まってた https://ja.wikipedia.org/wiki/%E3%82%BF%E3%83%B3%E3%83%87%E3%83%A0%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E3%83%BC%E3%82%BA