Punto Flotante

Definición
 
Es la capacidad del procesador de representar la mayor cantidad de numeros reales extremadamente grandes y pequeñas (Notación cientifica) de una manera eficiente y compacta y con la que se pueden realizar operaciones aritméticas. En algunos procesadores se incorpora un coprocesador que se encarga de realizar estas operaciones debido a la complejidad, en el caso de no incorporar se usan bibliotecas de software que se encargar de realizar estos cálculos.
 
Representación
 
La representación de coma flotante (en inglés floating point, ‘punto flotante’) es una forma de notación científica usada en las CPU, GPU, FPU, etc, con la cual se pueden representar números racionales extremadamente grandes y pequeños de una manera muy eficiente y compacta, y con la que se pueden realizar operaciones aritméticas. El estándar para la representación en coma flotante es el IEEE 754.  El estándar del IEEE para aritmética en coma flotante (IEEE 754) es el estándar más extendido para las computaciones en coma flotante, y es seguido por muchas de las mejoras de CPU y FPU. El estándar define formatos para la representación de números en coma flotante (incluyendo el cero) y valores desnormalizados, así como valores especiales como infinito y NaN, con un conjunto de operaciones en coma flotante que trabaja sobre estos valores. También especifica cuatro modos de redondeo y cinco excepciones (incluyendo cuándo ocurren dichas excepciones y qué sucede en esos momentos).
 

IEEE 754 especifica cuatro formatos para la representación de valores en coma flotante: precisión simple (32 bits), precisión doble (64 bits), precisión simple extendida (≥ 43 bits, no usada normalmente) y precisión doble extendida (≥ 79 bits, usualmente implementada con 80 bits). Sólo los valores de 32 bits son requeridos por el estándar, los otros son opcionales. Muchos lenguajes especifican qué formatos y aritmética del IEEE implementan, a pesar de que a veces son opcionales. Por ejemplo, el lenguaje de programación C, ahora permite pero no requiere la aritmética del IEEE (el tipo de C float es típicamente usado para la precisión simple del IEEE y el tipo double usa la precisión doble del IEEE).