[SSIS 2008] Transform & Persistent Cache

Una delle novità più interessanti relative agli Integration Services, ovvero alla piattaforma di ETL (Extract - Transform - Loading) di SQL Server, riguarda la disponibilià di un componente di cache transform.

Ovvero la possibilità di poter creare e condividere (reusability factor - concetto assente in SQL Server 2005), anche tra diversi packages, in memoria o su file, i nostri dati tramite una "persistent" cache.

image

Il concetto di caching non è nuovo di per se, però nella versione precedente due erano le grosse limitazioni:

  • all'interno di un ciclo la lettura del dataset veniva fatta ad ogni iterazione
  • non si poteva trasferire le informazioni tra data flow differenti

Per poter rendere disponibile tutto questo è stata anche aggiunta la possibilità di definire, all'interno del connection manager, una connessione di "cache" che sarà proprio la definizione di dove vogliamo fare storage dei nostri dati (se voglio utilizzare file vado semplicemente a definire il path ed il nome file che voglio utilizzare - attenzione ai permessi di scrittura).

image

Come utilizzo questo nuovo task di trasformation:

  1. Data flow per popolare la cache
  2. Data flow in cui utilizzarla

Alcune considerazioni sui file di caching:

  • sono ottimizzati per la lettura (vengono letti più rapidamente rispetto ad un accesso a tabelle / viste e, in caso di utilizzi simultanei e concorrenti, non stressano continuamente il nostro db)
  • i file "*.caw", questa l'estensione per i file di cache, non contengono dati in chiaro ma sono semplicemente un dump della memoria
Published giovedì 20 marzo 2008 7.00 by abenedetti

Comments

No Comments