Al trabajar con números reales no es una buena idea comparar dos valores después de operar con ellos con el operador ==
. El mínimo error numérico es las operaciones puede hacer que dos valores que deberían ser iguales no lo sean. Algo que se puede comprobar fácilmente evaluando la expresión 0.1 + 0.2 == 0.3
en Python, la comparación devuelve False
cuando esperaríamos todo lo contrario. Para estos casos es mejor usar las funciones math.isclose()
o numpy.isclose()
. Además, en el caso de querer comprobar si todos elementos de un vector son iguales se puede usar numpy.allclose()
para vectores. Pudiendo así comparar los valores con tolerancia en Python de cualquier operación.
El problema de los números reales
Es importante saber que la cantidad de número reales que puede representar un ordenador es finitos, mientras que los números son infinitos. Por eso no todos los números que podamos pensar tiene una representación, así que el ordenador emplea la más cercana para representarlos. Este es el problema de la operación que se ha puesto como ejemplo, por eso el resultado de 0.1 + 0.2 - 0.3
en Python es 5.551115123125783e-17
, no cero como esperaríamos. Un problema que no solo tenemos en Python, sino que en todos los lenguajes de programación y herramientas. Por eso no es aconsejable comparar dos números reales con ==
sino que comprobar que su diferencia está por debajo de un nivel de tolerancia.
La función math.isclose()
En la librería matemática de Python podemos encontrar la función math.isclose()
con la que comparar dos números reales con un nivel de tolerancia. La forma básica para usar esta función es:
math.isclose(a, b, rel_tol=1e-9, abs_tol=0.0)
en donde a
y b
son los valores por comprar. Además, tenemos los valores opcionales como rel_tol
, es el nivel de tolerancia relativa, y abs_tol
, es el nivel de tolerancia absoluta. Siendo esta es una función que realiza la siguiente operación
abs(a-b) <= max(rel_tol * max(abs(a), abs(b)), abs_tol)
La función se puede probar con el ejemplo anterior math.isclose(0.1 + 0.2 , 0.3)
lo que nos devuelve True
. Esto es así porque la diferencia entre los dos valores es inferior a 1e-9.
Las funciones numpy.isclose()
y numpy.allclose()
Al igual que la librería matemática de Python, NumPy también implementa un par de funciones para comparar con tolerancia valores numéricos. Implementado una para escalares y otras para vectores. Además, en el caso de las funciones de NumPy se les puede indicar si los valores NaN se consideran iguales. La forma de llamar a numpy.isclose()
es
numpy.isclose(a, b, rtol=1e-05, atol=1e-08, equal_nan=False)
En donde el único parámetro nuevo es equal_nan
con el que se indica que los valores NaN sean considerados iguales o no. Esta función compara cada uno de los elementos de los dos vectores, si se quiere obtener un único valor que indica si todos las comparaciones son verdades se puede utilizar numpy.allclose()
.Función que se llama exactamente igual aunque solo devuelve un valor.
Hay que tener en cuenta que la comparación que realizan estas funciones es diferente a la liberaría matemática, en este caso la comparación es:
abs(a - b) <= (atol + rtol * absolute(b))
Unos ejemplos de uso de estas funciones se pueden ver en las siguientes líneas
import numpy as np np.isclose([1, 1.001, 1.0001], [1, 1, 1]) # [ True, False, False] np.isclose([1, 1.001, 1.0001], [1, 1, 1], atol=0.0001) # [ True, False, True] np.isclose([1, 1.001, 1.0001], [1, 1, 1], atol=0.001) # [ True, True, True] np.allclose([1, 1.001, 1.0001], [1, 1, 1]) # False np.allclose([1, 1.001, 1.0001], [1, 1, 1], atol=0.0001) # False np.allclose([1, 1.001, 1.0001], [1, 1, 1], atol=0.001) # True
Conclusiones
Hoy se han visto tres funciones que tenemos disponibles en Python para comparar los valores con tolerancia en Python. Lo que nos permite evitar los problemas que conllevan los errores numéricos en las operaciones con reales.
Deja una respuesta