Digital tools for energy efficiency and sustainability in data centers: the HPC4AI@UNITO case study between dynamic modelling and performance management

AUTHOR: Viviana Vaccaro

TUTOR: Prof.ssa Arch. Ing. Paola Ronca

MASTER: Master in “Sustainability and Energy Management in construction works”

TITOLO: Digital tools for energy efficiency and sustainability in data centers: the HPC4AI@UNITO case study between dynamic modelling and performance management

Nel contesto attuale di crescente digitalizzazione, i data center rappresentano sistemi nevralgici per l’elaborazione e l’archiviazione dei dati, sui quali convergono da un lato l’aumento esponenziale della domanda di potenza computazionale, dall’altro l’urgenza di contenere i consumi energetici e gli impatti ambientali associati. Negli ultimi anni, il tema della sostenibilità ha acquisito un ruolo determinante nel settore, spingendo verso soluzioni sempre più orientate non solo all’efficienza energetica, ma anche a una gestione più intelligente e adattiva delle risorse.

La tesi indaga l’evoluzione dei data center da semplici sale macchine a infrastrutture digitali complesse, analizzandone sviluppo storico, tipologie, contesto normativo, sfide energetiche e ambientali e principali iniziative di sostenibilità. Particolare attenzione viene dedicata alle metriche, alle strategie di ottimizzazione e alle best practice adottate per ridurre consumi, emissioni e impatto ambientale, nonché a casi studio internazionali che dimostrano l’efficacia di soluzioni innovative.

Tra i fattori determinanti, la ricerca evidenzia il ruolo centrale dei sistemi di raffreddamento nella definizione dell’efficienza energetica complessiva dei data center. Da questa consapevolezza nasce la decisione di concentrare il lavoro sulla modellazione energetica dinamica come strumento analitico in grado di simulare il comportamento termico del sistema, testare scenari alternativi di funzionamento e supportare una gestione più consapevole e reattiva dei flussi energetici.

La modellazione è stata quindi assunta come punto di partenza per lo sviluppo di un sistema digitale avanzato, in grado non solo di simulare il comportamento del data center in condizioni reali, ma anche di predisporlo a una futura gestione intelligente tramite Digital Twin, ossia una replica digitale dinamica e interattiva di un sistema fisico reale, che combina dati real-time provenienti da sensori con modelli virtuali, al fine di simulare, monitorare, prevedere e ottimizzare il comportamento del sistema stesso.

La ricerca trova applicazione nel data center HPC4AI dell’Università di Torino, un’infrastruttura ad alte prestazioni dedicata al calcolo scientifico e all’intelligenza artificiale, caratterizzata da un’efficienza energetica avanzata (PUE ≤ 1,1), ottenuta mediante l’impiego combinato di sistemi di free cooling, raffrescamento evaporativo e logiche di controllo adattive, finalizzate a minimizzare il ricorso alla refrigerazione meccanica. In questo contesto, l’implementazione di un modello energetico dinamico, sviluppato in IES VE e opportunamente calibrato, ha costituito il primo passo verso la costruzione di una replica digitale in grado di accompagnare il sistema fisico lungo il suo ciclo di vita operativo, abilitando il monitoraggio predittivo, il controllo adattivo e l’ottimizzazione delle risorse.

La fase iniziale ha riguardato la costruzione del modello, includendo la geometria dell’edificio, i carichi IT, le caratteristiche termo-fisiche degli ambienti e la configurazione del sistema di raffreddamento, con particolare attenzione alle logiche di controllo e alla regolazione dei flussi d’aria

Figura 1 – Panoramica delle zone termiche (IES VE)

A questo è seguita una fase di calibrazione guidata dai dati reali attraverso la piattaforma iSCAN, in grado di aggregare e visualizzare dati provenienti da sensori ambientali e infrastrutturali installati nel sito. Cio’ ha consentito di effettuare confronti mirati tra dati simulati e dati misurati, con particolare attenzione a variabili critiche come la temperatura dell’aria in ingresso, l’umidità relativa e il punto di rugiada, fondamentali per il mantenimento delle condizioni operative sicure in ambienti ad alta densità computazionale.

Attraverso iterazioni successive, il modello è stato progressivamente affinato fino a ridurre significativamente le discrepanze rispetto al comportamento reale del sistema. Le correzioni hanno interessato, in particolare, le soglie di attivazione dei sistemi di raffreddamento, le curve di modulazione delle portate d’aria e l’interazione termica tra ambienti adiacenti come il plenum di mandata e la sala server o i racks e il corrdoio caldo. A supporto delle ipotesi progettuali, è stata inoltre effettuata una simulazione fluidodinamica computazionale (CFD) con il modulo MicroFlo, utile a validare la distribuzione termica interna, confermare la separazione dei flussi e identificare potenziali punti critici (hotspot).

Figura 2 – Simulazione CFD: distribuzione della temperatura nel sistema di contenimento del corridoio caldo (IES VE)

Sebbene la connessione in tempo reale non sia stata ancora implementata, la struttura del lavoro è stata concepita per agevolare tale evoluzione in fasi successive tramite l’architettura API di iSCAN. Questo consente di immaginare uno scenario futuro in cui il modello possa ricevere aggiornamenti continui dai sensori, reagire in tempo reale a variazioni operative e supportare strategie predittive di controllo e manutenzione.

I risultati ottenuti dimostrano come, anche in una struttura già ottimizzata, la combinazione di modellazione dinamica, monitoraggio ambientale e simulazione CFD possa generare valore aggiunto, migliorando la comprensione del sistema, riducendo le incertezze di progetto e predisponendo l’infrastruttura a un livello più avanzato di automazione. Il modello calibrato ha permesso di ottenere una rappresentazione realistica del comportamento termico della sala server, evidenziando margini di ottimizzazione nella gestione dei flussi d’aria e nell’attivazione sequenziale dei sistemi di raffreddamento. Tali risultati non solo aumentano l’affidabilità della simulazione, ma forniscono uno strumento operativo per supportare strategie di ottimizzazione energetica, manutenzione predittiva ed efficienza operativa.

In conclusione, la tesi propone un percorso metodologico concreto e replicabile anche in altri contesti critici, che mostra come sia possibile trasformare un modello energetico dinamico in uno strumento digitale evolutivo, capace di guidare scelte operative più consapevoli. L’esperienza maturata nel caso HPC4AI conferma che l’adozione del Digital Twin nei data center non rappresenta solo un passo tecnologico, ma una reale opportunità per coniugare sostenibilità, efficienza e intelligenza operativa in infrastrutture sempre più complesse, sostenendo decisioni sempre più data-driven.

FOR INTERNATIONAL STUDENT: 

In today’s digital age, data centers serve as critical infrastructures for data processing and storage, facing the dual challenge of meeting exponentially growing computational demands while minimizing energy consumption and environmental impact. In recent years, sustainability has become a key driver in this sector, pushing the development of solutions that go beyond energy efficiency to embrace smarter, more adaptive resource management.

This thesis explores the evolution of data centers from basic server rooms to complex digital infrastructures. It examines their historical development, typologies, regulatory context, environmental and energy-related challenges, and major sustainability initiatives. Particular attention is given to the metrics, optimization strategies, and best practices aimed at reducing energy use, emissions, and environmental footprint. A selection of international case studies, chosen to represent a broad range of geographical and dimensional contexts, showcases the effectiveness of innovative technologies and management approaches in the pursuit of energy efficiency and sustainability.

Among the most relevant findings, the study highlights the central role of cooling strategies in determining the energy efficiency of data centers. This awareness led to a focused exploration of dynamic energy modelling as a powerful analytical tool capable of simulating thermal behaviour, testing alternative operating scenarios, and supporting more responsive and data-informed energy management.

Dynamic modelling was therefore adopted as a starting point for the development of a more advanced digital system, a foundation for a future intelligent management framework built around the concept of a Digital Twin. A Digital Twin is a dynamic and interactive virtual replica of a physical system, fed by real-time sensor data and simulation models, designed to simulate, monitor, predict, and optimize system performance throughout its lifecycle.

The research was applied to the HPC4AI data center at the University of Turin, a high-performance infrastructure dedicated to scientific computing and artificial intelligence. It is characterized by advanced energy efficiency (PUE ≤ 1.1), achieved through the combined use of free cooling, indirect evaporative cooling, and adaptive control strategies designed to minimize reliance on mechanical refrigeration. Within this context, the implementation of a dynamic energy model, developed in IES VE and carefully calibrated, represented the first step toward building a digital replica capable of supporting the physical system throughout its operational lifecycle, enabling predictive monitoring, adaptive control, and resource optimization.

The first phase involved the construction of the model, including the building geometry, IT loads, thermo-physical properties of the spaces, and the configuration of the cooling system,  with particular attention to control logics and airflow regulation.

Figure 1 – Overview of thermal zones (IES VE)

This was followed by a calibration phase, driven by real-world data through the iSCAN platform, which aggregates and visualizes environmental and infrastructure measurements from on-site sensors. By combining these datasets, it was possible to conduct targeted comparisons between simulated and measured values, with particular focus on critical variables such as inlet air temperature, relative humidity and dew point, all essential to maintaining safe operating conditions in high-density computing environments.

Through iterative refinements and careful thermal zone mapping, the model was progressively optimized to reduce discrepancies with observed behaviour. Corrections addressed cooling activation thresholds, fan modulation curves, and the thermal interaction between adjacent areas such as the supply air plenum and the server room, or between racks and the hot aisle. To support the design assumptions, a Computational Fluid Dynamics (CFD) simulation using the MicroFlo module was also conducted, validating airflow separation and identifying potential hotspots within the thermal distribution.

Figure 2 – CFD simulation: temperature distribution in the hot aisle containment system (IES VE)

Although live data streaming has not yet been implemented, the entire system was designed to accommodate future integration of real-time inputs via iSCAN’s API architecture. This creates a foundation for a scenario in which the model can continuously receive sensor updates, react to real-time changes, and support intelligent, scenario-based decision-making.

The results obtained demonstrate that, even in an already optimized infrastructure, the combination of dynamic modelling, environmental monitoring, and CFD simulation can generate added value by enhancing system understanding, reducing design uncertainties, and preparing the infrastructure for a more advanced level of automation. The calibrated model enabled a realistic representation of the thermal behaviour of the server room, highlighting potential improvements in airflow management and the sequential activation of cooling systems. These results not only increase the reliability of the simulation but also provide an operational tool to support energy optimization strategies, predictive maintenance, and overall efficiency.

In conclusion, this thesis presents a concrete and replicable methodological approach that shows how a dynamic energy model can be transformed into an evolving digital tool capable of guiding more informed operational decisions. The experience gained through the HPC4AI case study confirms that the adoption of a Digital Twin in data centers is not merely a technological step forward, but a real opportunity to integrate sustainability, efficiency, and operational intelligence within increasingly complex infrastructures, enabling more data-driven decision-making.