自動ニュース作成G
業界最速50TOPSのNPUと、12コアのCPUを実現した「Ryzen AI 300」のカラクリ
https://pc.watch.impress.co.jp/docs/column/ubiq/1608446.html
2024-07-16 11:18:42
>XDNA 2はBlock FP16という、FP16の正確性とINT8での処理能力を両立できる新しい浮動小数点の精度に対応している。Block FP16は、符号(Sign)、指数(Exponent)、仮数(Mantissa)の3つで表現される浮動小数点のうち、指数を共通指数という固定した指数にして8bitの要素にしてそのデータを最初に処理し、その後符号+仮数で8bitの要素8つと合わせて合計で72bitのデータにして処理していく。
8つのデータで指数部を共用か!ソフトウェアを組む側で8つのデータのダイナミックレンジを正解に見積もってないと仮数部ゼロに丸められちゃって予想外の結果になるな。int8よりは良いけど
・インテルは13世代14世代で不具合出まくるわモバイル向けはLunarLakeは前世代のMetroLakeのダイサイズの2倍とかで性能はともかくコスト面で勝てそうもないけど大丈夫?
・#0 やっと理解した。指数を共通にする事で固定小数点の演算として計算出来ると言う事だな。AIで使う行列演算みたいな用途はこうしても影響が少ないとかかね。
・加算されるデータ間で指数部を共有するなら問題ないけど乗算だと配慮が必要ね