Desbordando AVG y SUM: Cuando SQL Server se queda sin dedos para sumar

Entre las múltiples funciones de agregado que nos ofrece SQL Server, nos encontramos con dos que, probablemente junto con COUNT(), son las más usadas: SUM() y AVG().

El resultado que producen ambas parece bastante obvio: SUM() devuelve la suma de valores de la columna que le indiquemos a la función, mientras que AVG() nos devolverá el valor promedio de los datos de la columna deseada.

Así pues, si tenemos una tabla de pedidos con la columna Importe, que indica el importe final de cada pedido sin decimales (tipo de datos int), si queremos saber la suma de los importes de todos los pedidos, bastará con realizar la siguiente consulta:

SELECT SUM(Importe)
FROM dbo.Pedidos;

Análogamente, si queremos conocer el valor promedio de los pedidos:

SELECT AVG(Importe)
FROM dbo.Pedidos;

El resultado devuelto por ambas será un entero (int) con la suma y el promedio respectivamente.

"Estos números son muy grandes, no sé contar tanto"


Estas funciones probablemente no nos fallarán nunca, hasta que de repente un día veamos un mensaje en rojo que nos diga:

Msg 8115, Level 16, State 2, Line 1
Arithmetic overflow error converting expression to data type int.

¡Oh, oh! ¿Qué ha ocurrido aquí? Muy sencillo: Si el resultado de la suma es más grande que el entero (int) más grande, tenemos un desbordamiento aritmético. El número es demasiado grande como para que SQL Server lo pueda devolver.

Es decir, es como si nos piden sumar 5 y 6 con los dedos de la mano: una vez pasemos de 10, nos hemos quedado sin dedos. Se nos han desbordado las manos.

No podemos contar más de 10 con los dedos de la mano
¿Cuántos son 6 + 5? ¡No tengo suficientes dedos!
Podemos hacer la prueba rápidamente con el siguiente script, en el que introducimos dos pedidos con importe de 1.000.000.000 y 2.000.000.000, y tratamos de obtener la suma de los importes:

CREATE TABLE dbo.Pedidos
(
 NumeroPedido int PRIMARY KEY,
 Importe int
);
INSERT INTO dbo.Pedidos (NumeroPedido, Importe)
VALUES (1, 1000000000), (2, 2000000000);
SELECT SUM(Importe)
FROM dbo.Pedidos;

Ejecutamos el script y se genera el error anteriormente mencionado. La explicación es sencilla: la suma de los importes es 3.000.000.000, pero el valor máximo que puede representar el tipo de datos int es algo más de 2.100.000.000, así que hemos desbordado la suma.

Si ejecutamos el promedio (AVG) ocurrirá exactamente lo mismo:

SELECT AVG(Importe)
FROM dbo.Pedidos;

¿Por qué? Porque primero hay que realizar la suma de todos los importes para después dividir entre el número de elementos. Como la suma desborda el tipo de datos, SQL Server no puede seguir adelante con la operación:

(1.000.000.000 + 2.000.000.000) / 2

Todo tiene solución


En este caso, como muchas otras veces, podemos solucionar este escenario simplemente consultando la ayuda online.

Vemos en la siguiente tabla que SUM devuelve un entero (int) si el tipo de datos de entrada es tinyint (1 byte), smallint (2 bytes) o int (4 bytes), por lo que si intentamos sumar columnas de estos tipos de datos tendremos el límite citado anteriormente (exactamente 2.147.483.647) 
Resultado de la expresión
Tipo de valor devuelto
tinyint
int
smallint
int
int
int
bigint
bigint
Pero si usamos un bigint como tipo de datos de la columna a sumar, el resultado será también un bigint, ampliándonos el límite hasta un valor de 2 elevado a 63 (9.223.372.036.854.775.807). Un número lo suficientemente grande como para que sea complicado de desbordar, aunque no imposible.

Así pues, sin necesidad de cambiar el tipo de datos de nuestras columnas, podemos usar un CAST para convertir los valores de la columna Importe a bigint y después realizar la operación deseada. Del siguiente modo:

SELECT SUM(CAST(Importe AS bigint))
FROM dbo.Pedidos;

SELECT AVG(CAST(Importe AS bigint))
FROM dbo.Pedidos;

¡Ahora SQL Server ya nos devuelve los valores esperados!

Comentarios