GuilleSQL :: Microsoft SQL Server, SSIS, y más !!

GROUP BY, CUBE, ROLLUP, GROUPING SETS y las funciones GROUPING y GROUPING_ID


Aunque en términos generales la utilización de las agrupaciones (GROUP BY) no sea una buena práctica de rendimiento (especialmente en entornos estrictamente transaccionales), también es cierto de que aportan una gran riqueza al lenguaje SQL, algo que en determinadas ocasiones nos puede resultar de gran ayuda. Este artículo presenta las opciones CUBE, ROLLUP, y GROUPING SETS, que permite ampliar la funcionalidad de las sentencias GROUP BY tradicionales, y facilitar la codificación de nuestras consultas SQL.

En muchas ocasiones necesitamos escribir consultas SQL que obtengan resultados agrupados utilizando la cláusula GROUP BY, algo que se complica cuando en una misma sentencia SQL necesitamos realizar diferentes agrupamientos, y que podemos solventar con las opciones CUBE, ROLLUP, y GROUPING SETS.

Pongamos por ejemplo, que necesitamos obtener la información agrupada por las columnas Pais y Color. Este sencillo ejemplo, lo resolveremos con una cláusula GROUP BY Pais, Color. Fácil y sencillo.

Bien. Imaginemos ahora que necesitamos obtener la información agrupada por las columnas Pais y Color, así como también un total general, y un sub-total por cada Color (indiferentemente del Pais). ¿Qué hacemos? Una opción es escribir varias consultas SQL con las correspondientes cláusulas GROUP BY, y unir todas estas consultas con UNION ALL. Cuando son consultas pequeñas, quizás no sea una gran molestia. Cuando estamos trabajando con grandes consultas SQL (decenas o centenas de líneas), esto empieza a complicarse, ya que no sólo se aumenta el tiempo de codificación inicial, sino que para su mantenimiento, cuando sea necesario meter mano ahí, también nos costará mucho más tiempo. Esto ya no es fácil y sencillo. Esto es un marrón.

Afortunadamente, tenemos a nuestra disposición las opciones CUBE, ROLLUP, y GROUPING SETS, así como las opciones GROUPING y GROUPING_ID, que nos ayudarán en este menester. Empezamos.

GROUP BY CUBE

GROUP BY CUBE genera todas las posibles combinaciones de agrupamiento. Por ejemplo, GROUP BY CUBE (Pais, Color) además de generar las diferentes filas para las agrupaciones por Pais, Color (como una sentencia GROUP BY tradicional), generará también:

  • Una fila con el Total General.
  • Las diferente filas para las agrupaciones por Pais.
  • Las diferentes filas para las agrupaciones por Color.

A continuación se muestra una sentencia SQL de ejemplo, para que podamos observar la sintaxis:

SELECT Pais, Color, SUM(Importe) AS Total
FROM dbo.Ventas
GROUP BY CUBE(Pais, Color)

Alternativamente, también podemos utilizar la sintaxis WITH CUBE. Sin embargo, dicha sintaxis no sigue el standard ISO y desaparecerá en futuras versiones de SQL Server, por lo que debemos evitar utilizarla. En cualquier caso, a continuación se muestra una sentencia SQL de ejemplo:

SELECT Pais, Color, SUM(Importe) AS Total
FROM dbo.Ventas
GROUP BY Pais, Color WITH CUBE

GROUP BY ROLLUP

GROUP BY ROLLUP genera las diferentes combinaciones de agrupamiento de forma jerárquica, por lo que en cierto modo, genera un subconjunto de las combinaciones que genera GROUP BY CUBE. Por ejemplo, GROUP BY ROLLUP (Pais, Color) además de generar las diferentes filas para las agrupaciones por Pais, Color (como una sentencia GROUP BY tradicional), generará también:

  • Una fila con el Total General.
  • Las diferente filas para las agrupaciones por Pais.

La diferencia con GROUP BY CUBE en este ejemplo particular, es que con ROLLUP no se generan las diferentes filas para las agrupaciones por Color.

A continuación se muestra una sentencia SQL de ejemplo, para que podamos observar la sintaxis:

SELECT Pais, Color, SUM(Importe) AS Total
FROM dbo.Ventas
GROUP BY ROLLUP (Pais, Color)

Alternativamente, también podemos utilizar la sintaxis WITH ROLLUP. Sin embargo, dicha sintaxis no sigue el standard ISO y desaparecerá en futuras versiones de SQL Server, por lo que debemos evitar utilizarla. En cualquier caso, a continuación se muestra una sentencia SQL de ejemplo:

SELECT Pais, Color, SUM(Importe) AS Total
FROM dbo.Ventas
GROUP BY Pais, Color WITH ROLLUP

GROUP BY GROUPING SETS

GROUP BY GROUPING SETS nos permite poder personalizar las diferentes combinaciones de agrupamiento que deseemos. Por ejemplo, GROUP BY GROUPING SETS ( (Pais, Color), (Color), () ) además de generar las diferentes filas para las agrupaciones por Pais, Color (como una sentencia GROUP BY tradicional, que es lo especificado en el primer agrupamiento), generará también:

  • Las diferente filas para las agrupaciones por Color (especificado en el segundo agrupamiento).
  • Una fila con el Total General (especificado en el tercer agrupamiento).

A continuación se muestra una sentencia SQL de ejemplo, para que podamos observar la sintaxis:

SELECT Pais, Color, SUM(Importe) AS Total
FROM dbo.Ventas
GROUP BY GROUPING SETS ( (Pais, Color), (Color), () )

Las funciones GROUPING y GROUPING_ID

Además de lo ya visto, también podemos utilizar las funciones GROUPING y/o GROUPING_ID, las cuales nos pueden ayudar a identificar las diferentes agrupaciones realizadas en el conjunto de filas resultado de nuestra consulta, en caso de estar utilizando cualquiera de las cláusulas que acabamos de ver: CUBE, ROLLUP, ó GROUPING SETS.

Por ejemplo, si ejecutamos una sentencia GROUP BY CUBE, podemos utilizar la función GROUPING para identificar qué fila es el Total General, así como identificar los diferentes Sub-Totales, y el resto de filas. A continuación se muestra una sentencia SQL de ejemplo, para que podamos observar la sintaxis:

SELECT Pais, Color, SUM(Amount) AS Total,
   CASE
      WHEN GROUPING(Pais)=0 AND GROUPING(Color)=1 THEN 'Total Pais'
      WHEN GROUPING(Pais)=1 AND GROUPING(Color)=0 THEN 'Total Color'
      WHEN GROUPING(Pais)=1 AND GROUPING(Color)=1 THEN 'Total General'
      ELSE 'Fila Normal'
   END AS TipoFila
FROM dbo.Ventas
GROUP BY CUBE(Pais, Color)

Lo mismo ocurre con la función GROUPING_ID, que utilizamos a modo de ejemplo en el siguiente código SQL.

SELECT Pais, Color, SUM(Amount) AS Total,
   CASE GROUPING_ID(Pais, Color)
      WHEN 1 THEN 'Total Pais'
      WHEN 2 THEN 'Total Color'
      WHEN 3 THEN 'Total General'
      ELSE 'Fila Normal'
   END AS TipoFila
FROM dbo.Ventas
GROUP BY CUBE(Pais, Color)

Consideraciones de Rendimiento

En términos generales, no es una buena práctica de rendimiento la utilización de agrupaciones y ordenaciones (GROUP BY / ORDER BY), especialmente en entornos puramente transaccionales, en los que deben ejecutarse simultaneamos gran cantidad de consultas SQL, y dónde debemos mimar mucho estos detalles para no tirar por tierra todo el rendimiento de nuestro motor SQL por problemas típicos de bloqueos (locks y blocks), esperas, efectos colaterales con la configuración del Paralelismo (MDOP), y otros mil problemas de rendimiento de SQL Server que nos podemos encontrar.

Al final, la mayoría de las veces las cosas no son blancas o negras, y en muchas ocasiones acabaremos utilizando sentencias con GROUP BY, sin que esto represente ningún problema. En este tipo de situaciones, podremos aprovechar las ventajas de las cláusulas CUBE, ROLLUP y/o GROUPING SETS.

Despedida y Cierre

Hasta aquí llega el presente artículo. Como hemos visto, las cláusulas CUBE, ROLLUP y GROUPING SETS, pueden sernos de gran ayuda, aunque por supuesto, debemos ser conscientes de que la utilización de las agrupaciones no es suele ser una buena práctica de rendimiento (ojo, hablando en términos generales, en el caso de sistemas puramente transaccionales). Evidentemente, en entornos de Reporting y Data Warehouse, aportan una gran riqueza al lenguaje SQL.

Por último, sólo recordar que WITH CUBE, WITH ROLLUP, y la función GROUPING están disponibles desde SQL Server 2000, mientras que GROUPING SETS y la función GROUPING_ID están disponibles desde SQL Server 2008.

Poco más por hoy. Como siempre, confío que la lectura resulte de interés.

 


Miembros de
Miembros de GITCA (Global IT Community Association)

Menu de Usuario
  Iniciar Sesión
  Registrarse
  Restablecer Contraseña
  Ventajas de Registrarse

Acerca de
  Contigo desde Oct 2007
  771 usuarios registrados
  86146 pageloads/mes
  Ranking Alexa 498160

Social Networks
Sigue a Portal GuilleSQL en Linkedin !!
Sigue a Portal GuilleSQL en Twitter !!



Archivo

Marzo de 2019 (1)
Octubre de 2018 (1)
Julio de 2018 (1)
Junio de 2018 (4)
Mayo de 2018 (5)
Abril de 2018 (3)
Marzo de 2018 (2)
Febrero de 2018 (7)
Enero de 2018 (1)
Diciembre de 2017 (15)
Noviembre de 2017 (7)
Junio de 2017 (3)
Mayo de 2017 (1)
Marzo de 2017 (3)
Enero de 2017 (4)
Junio de 2016 (1)
Mayo de 2016 (2)
Abril de 2016 (2)
Septiembre de 2015 (2)
Agosto de 2015 (2)
Junio de 2015 (10)
Mayo de 2015 (4)
Abril de 2015 (8)
Marzo de 2015 (11)
Octubre de 2014 (3)
Septiembre de 2014 (7)
Agosto de 2014 (5)
Julio de 2014 (2)
Mayo de 2014 (4)
Abril de 2014 (4)
Marzo de 2014 (4)
Febrero de 2014 (1)
Enero de 2014 (5)
Diciembre de 2013 (8)
Noviembre de 2013 (2)
Octubre de 2013 (7)
Septiembre de 2013 (6)
Agosto de 2013 (1)
Julio de 2013 (6)
Junio de 2013 (11)
Mayo de 2013 (7)
Abril de 2013 (6)
Febrero de 2013 (5)
Enero de 2013 (7)
Diciembre de 2012 (12)
Noviembre de 2012 (13)
Octubre de 2012 (5)
Septiembre de 2012 (3)
Agosto de 2012 (6)
Julio de 2012 (4)
Junio de 2012 (1)
Mayo de 2012 (2)
Abril de 2012 (7)
Marzo de 2012 (16)
Febrero de 2012 (9)
Enero de 2012 (5)
Diciembre de 2011 (10)
Noviembre de 2011 (10)
Octubre de 2011 (4)
Septiembre de 2011 (5)
Agosto de 2011 (2)
Julio de 2011 (2)
Junio de 2011 (4)
Mayo de 2011 (2)
Abril de 2011 (6)
Marzo de 2011 (4)
Febrero de 2011 (10)
Enero de 2011 (5)
Diciembre de 2010 (6)
Noviembre de 2010 (4)
Octubre de 2010 (8)
Septiembre de 2010 (4)
Agosto de 2010 (1)
Julio de 2010 (3)
Mayo de 2010 (5)
Abril de 2010 (6)
Marzo de 2010 (8)
Febrero de 2010 (3)
Enero de 2010 (1)
Diciembre de 2009 (9)
Noviembre de 2009 (14)
Octubre de 2009 (2)
Septiembre de 2009 (8)
Agosto de 2009 (2)
Julio de 2009 (10)
Junio de 2009 (9)
Mayo de 2009 (10)
Abril de 2009 (9)
Marzo de 2009 (3)
Febrero de 2009 (2)
Enero de 2009 (3)
Noviembre de 2008 (2)
Octubre de 2008 (2)
Septiembre de 2008 (2)
Agosto de 2008 (5)
Julio de 2008 (5)
Junio de 2008 (1)
Mayo de 2008 (3)
Abril de 2008 (2)
Marzo de 2008 (2)
Febrero de 2008 (2)
Enero de 2008 (5)
Noviembre de 2007 (2)
Octubre de 2007 (2)






Copyright © 2007 GuilleSQL, todos los derechos reservados.