Windows Server 2022 - Déduplication de données

Installer et configurer la déduplication sous Windows Server 2022

I. Présentation

Dans ce tutoriel, nous allons apprendre à installer et configurer la déduplication sous Windows Server 2022, même si cette procédure s’applique aussi aux versions précédentes : Windows Server 2019 et Windows Server 2016. Avant d’étudier la déduplication dans la pratique, il me semble important de vous proposer une introduction théorique au principe de la déduplication.

II. Le principe de la déduplication

La déduplication de données, ou Dedup pour les intimes, est une fonctionnalité très pratique sur les espaces de stockage dont l’objectif principal est d’optimiser l’espace disque. Grâce à ce mécanisme qui vise à rechercher les parties dupliquées entre les fichiers, l’espace disque utilisé par les données est réduit considérablement. En fonction des usages, le gain en espace disque peut aller de 30% à 95% !

 » alt= »Déduplication – Gain espace disque » width= »800″ height= »185″ data-lazy-srcset= »https://tuto.cm/wp-content/uploads/2024/09/Installer-et-configurer-la-deduplication-sous-Windows-Server-2022.png 800w, https://www.it-connect.fr/wp-content-itc/uploads/2023/02/Deduplication-Gain-espace-disque-550×127.png 550w, https://www.it-connect.fr/wp-content-itc/uploads/2023/02/Deduplication-Gain-espace-disque-150×35.png 150w, https://www.it-connect.fr/wp-content-itc/uploads/2023/02/Deduplication-Gain-espace-disque-768×178.png 768w, https://www.it-connect.fr/wp-content-itc/uploads/2023/02/Deduplication-Gain-espace-disque-50×12.png 50w, https://www.it-connect.fr/wp-content-itc/uploads/2023/02/Deduplication-Gain-espace-disque.png 873w » data-lazy-sizes= »(max-width: 800px) 100vw, 800px » data-lazy-src= »https://tuto.cm/wp-content/uploads/2024/09/Installer-et-configurer-la-deduplication-sous-Windows-Server-2022.png » />
Source : Microsoft Learn

Si l’on regarde les propriétés d’un dossier présent sur un volume où il n’y a pas de déduplication de données, on peut voir que la « Taille » et la « Taille sur le disque » sont identiques, car il n’y a pas d’optimisation. Après avoir mis en place la déduplication de données, le résultat sera totalement différent comme nous le verrons par la suite.

Taille sur le disque sans déduplication

Pour optimiser l’espace de stockage, le service de déduplication va découper chaque fichier en blocs, associer un identifiant unique à chaque bloc et stocker ces informations dans un index, dans le but d‘identifier les blocs communs entre l’ensemble des fichiers. Ainsi, le serveur va stocker qu’une seule copie de chaque bloc et utiliser un système de pointeurs pour que chaque fichier puisse être reconstitué normalement. En utilisant cette méthode, on économise de l’espace disque !

Principe de la déduplication de données

Depuis plusieurs années, le principe de la déduplication de données est utilisé par les logiciels de sauvegarde, notamment Veeam et Altaro, car il permet d’économiser énormément d’espace disque sur l’espace de stockage dédié aux sauvegardes.

En environnement Microsoft, il y a plusieurs cas d’usage où il est intéressant d’utiliser la déduplication de données pour avoir un gain de place important. Ci-dessous, la liste des scénarios prit en charge par Windows Server, avec une configuration adaptée :

  • Serveurs de fichiers où les utilisateurs stockent leurs données, mais également où il y a de la redirection de dossiers
  • Environnement VDI (virtualisation de postes de travail)
  • Applications de sauvegarde virtualisées

III. Installer la déduplication sur Windows Server 2022

Pour installer la fonctionnalité « Déduplication des données » de Windows Server, il est possible d’utiliser le Gestionnaire de serveur, Windows Admin Center ou PowerShell. Voici la commande PowerShell à utiliser :

Install-WindowsFeature -Name FS-Data-Deduplication

À partir du Gestionnaire de serveur, voici le rôle à sélectionner sous « Services de fichiers et de stockage » :

Déduplication de données - Installation du rôle Windows Server

L’installation est relativement rapide…

Déduplication de données - Installation du rôle Windows Server - Fin

IV. Configurer la déduplication sur Windows Server

Ce rôle n’a pas sa propre console MMC pour la configuration puisque c’est directement intégré au Gestionnaire de serveur dans la section « Services de fichiers et de stockage« . Ici, il faut cliquer sur « Disques » à gauche (2), sélectionner le disque qui contient le volume sur lequel on souhaite activer la déduplication (2), puis sélectionner le volume en question (3) et faire un clic droit dessus afin d’activer à l’option « Configurer la déduplication des données« .

Remarque : sur Windows Server, la déduplication s’active de façon indépendante pour chaque volume, sur chacun des disques du serveur. Dans cet exemple, c’est sur un disque dédié aux données, associé à la lettre « P » que la déduplication va être activée.

Configurer la déduplication de données - Windows Server

La première étape consiste à sélectionner un scénario d’usage. Ici, il s’agit d’un partage de fichiers classique donc je sélectionne « Serveur de fichiers à usage général« . Il y a également la possibilité de configurer d’autres options :

  • Dédupliquer les fichiers de plus de (en jours) : 3 jours par défaut pour ce scénario, ce qui représente le délai entre l’écriture de la donnée et l’optimisation
  • Extensions de fichier personnalisées à exclure : exclure certaines extensions de fichiers, en plus des extensions « edb » et « jrs« 
  • Exclure certains dossiers (et leur contenu) du processus de déduplication en cliquant sur le bouton « Ajouter« 

Sous Windows Server, il faut garder à l’esprit que l’optimisation n’est pas effectuée en temps réel : les données sont écrites sur le disque (sans optimisation), puis il y a un traitement qui effectue l’optimisation des données.

Configurer la déduplication de données - Windows Server - Etape 1

En cliquant sur le bouton « Définir la planification de la déduplication« , on peut accéder à d’autres options. L’option « Activer l’optimisation en arrière-plan » est cochée par défaut : par la suite, si vous constatez que la déduplication consomme trop de ressources (CPU) sur le système, vous pouvez essayer de désactiver cette option.

Il y a également la possibilité de planifier l’optimisation du stockage, selon certains jours de la semaine, en configurant les options « Activer l’optimisation du débit » et « Créer une deuxième planification d’optimisation du débit« . Ce n’est pas nécessaire si l’optimisation en arrière-plan est activée.

Configurer la déduplication de données - Windows Server - Etape 2

Validez par deux fois afin de confirmer la configuration et l’activation de la déduplication sur ce volume. Le statut de la déduplication s’affiche dans le Gestionnaire de serveur via les colonnes « Taux de déduplication » et « Gain de déduplication« .

Au-delà du processus d’optimisation, le service de déduplication est lié à trois tâches planifiées que l’on peut lister avec la commande PowerShell suivante :

Get-DedupSchedule

Et que l’on peut également visualiser via le « Planificateur de tâches » de la machine, à l’endroit suivant : Microsoft > Windows > Deduplication.

Déduplication - Tâches planifiées - Windows Server

Maintenant, il ne reste plus qu’à patienter que Windows Server effectue son travail…. Mais si vous souhaitez déclencher l’optimisation maintenant, ce qui peut être intéressant pour faire de simples tests, vous pouvez exécuter la tâche « BackgroundOptimisation« . Tout en sachant que cette tâche s’exécute toutes les heures !

À partir de PowerShell, on peut également lancer la tâche d’optimisation (ou une autre tâche). Voici un exemple pour lancer la tâche sur le volume « P: » :

Start-DedupJob -Type Optimization -Volume P:

Windows Server - Start-DedupJob

Ensuite, vous pouvez suivre l’avancement de la tâche avec cette commande :

Get-DedupJob

Suite à l’exécution de cette tâche, mon espace de stockage est optimisé ! On peut voir que le taux de déduplication est passé de 0% à 71% !

Windows Server - Gain de déduplication

Avec la commande PowerShell ci-dessous, on peut obtenir des informations sur les résultats de l’optimisation (comme ci-dessous) :

Get-DedupStatus

Get-DedupStatus - Déduplication PowerShell

Dans les propriétés du dossier, qui contient plusieurs fois le même package MSI, il y a également du changement puisque la taille sur le disque est passée à « 0 octet« . Ce résultat est tout de même un peu étonnant, car le serveur doit tout de même stocker une copie de mon fichier !

Taille sur le disque avec déduplication

V. Conclusion

Grâce à ce tutoriel, vous êtes en mesure d’installer et de configurer la déduplication de données sur un serveur Windows Server ! En complément de cet article, vous pouvez prendre connaissance de la documentation officielle à ce sujet :

Hébergez votre site à partir de 2$ sur 👉👉👉

À propos Santana

Analyste en cybersécurité avec 5 ans d'expérience dans la protection des systèmes d'information contre les menaces et les attaques. Expertise dans la surveillance des réseaux, l'analyse des vulnérabilités, et la gestion des incidents de sécurité. Passionnée par l'innovation technologique et la mise en œuvre de solutions de sécurité robustes pour protéger les données sensibles et assurer la conformité réglementaire.

Vérifiez également

FSRM - Personnaliser accès refusé avec demande assistance

Windows Server 2022 et FSRM – Message d’erreur personnalisé sur un accès refusé

Table de Matieres1 I. Présentation2 II. FSRM et l’assistance en cas d’accès refusé3 III. Tester …

Clichés instantanés Windows Server 2022

Les clichés instantanés sous Windows Server : un plus pour protéger les données

Table de Matieres1 I. Présentation2 II. Ajouter un volume dédié pour les clichés instantanés3 III. …

Windows Server FSRM - Classification des données

Windows Server 2022 et FSRM – Découverte de la classification de fichiers

Table de Matieres1 I. Présentation2 II. Créer une propriété personnalisée pour les fichiers3 III. Créer …

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.