AWS

Olá pessoal,

Passamos um pouco pela arquitetura do Redshift em artigos recentes, e vimos que o Leader Node (LN) faz a ponte com os Clients. Ele pode distribuir queries para que sejam executadas nos Compute Nodes (CN) ou executar em si próprio.

Ele envia os SQLs para os CN sempre que fazem referência a tabelas que criamos (user tables) ou tables/views de sistema (com prefixo STL ou STV) e executa exclusivamente no LN aquelas que referenciam apenas as tabelas do catálogo (com prefixo PG) ou não referenciam tabelas.

Por conta desta estranha distribuição, algumas funções SQL rodam apenas nos LN (CURRENT_SCHEMA, CURRENT_SCHEMAS, HAS_DATABASE_PRIVILEGE, HAS_SCHEMA_PRIVILEGE e HAS_TABLE_PRIVILEGE) e não nos CN. O mesmo acontece no contrário, há funções SQL que só rodam quando executadas no CN (LISTAGG, MEDIAN, PERCENTILE_CONT, PERCENTILE_DISC e APPROXIMATE PERCENTILE_DISC).
Vamos ver alguns exemplos.

Uma query que não faz referência a tabelas executa no LN, portanto pode utilizar CURRENT_SCHEMA;