02-浮点数

表现形式：

X=(-1)^S\times M \times R^E

其中 $S$ 表示 sign 即符号位。 $M$ 表示 Mantissa 一般是一个有符号小数，尾数。 $R$ 为基数Radix，计算机中一般为2，科学计数法为10。 $E$ 表示 Exponent，阶码表示小数点移动的量。

阶码决定范围，尾数决定精度。

$M$ 满足一定条件。

一般来说是：

\frac{1}{R} \le |M| < 1 \text{或者} 1 \le |M| < R

取决于：符号数（0还是1）， $M$ 的表示（全0或全1）， $E$ （最小是全0，最大是全1）
具体看题。

就是整体偏置（ $+Bias$ ）
一般就是，把表示范围从 $[-2^{k-1} + 1, 2^{k-1}] \rightarrow [0,2^k-1]$
故， $Bias = 2^{k-1}-1$ 。
实际存储的值 $E'=E+Bias,E'\ge 0$
真实使用的值 $E=E'-Bias$

步骤：

对阶：
- 比较两个数的阶码，大的保持不变；
- 小的那个尾数右移（基数为 R 时每移一位阶码 +1），直到阶码相同。
尾数运算：
- 符号相同：尾数相加；
- 符号不同：尾数相减，并确定结果符号。
规格化结果尾数
舍入与溢出处理：
- 超出尾数位数的部分，根据“截断/舍入”等规则处理；
- 若阶码超过允许范围，发生上溢（Overflow）或下溢（Underflow），需按格式规定处理（如置成最大数/0）。

按数值大小，整体结果更多地“取决于大数”，所以更应该保护大数的尾数精度。
浮点尾数位数有限，往左移越多，越容易溢出尾数位数，后面的位被截断或舍入，导致大数本身的精度大量损失。

符号异或，阶码相加（减偏置），尾数相乘，规格化+舍入。
符号异或，阶码相减（加偏置），尾数相除，规格化+舍入。