Aller au contenu

Remplacer les disques d'un Synology sans Raid et sans Spare


Sethenès

Messages recommandés

  • Réponses 543
  • Créé
  • Dernière réponse

Top contributeurs dans ce sujet

Top contributeurs dans ce sujet

Posted Images

Petite question : Dans mon DS1515+ j'ai 5 disques Seagate IronWolf 8To.
Je ne suis pas encore allé cherché le DS1621+ au relais.
J'ai un des 5 disques qui a 8 secteurs défectueux, et j'aimerai commander un autre disque afin de l'avoir en réserve en cas de panne, afin de pouvoir le changer le plus vite possible.
J'aimerai aussi commander un seconds disque afin de pouvoir remplir la 6ème baie du DS1621+ à venir (je ne sais pas si je vais y aller demain, je vais voir).
Dois-je forcément reprendre des Seagate IronWolf, ou je peux prendre des Western Digital par exemple ? Tant que le cache, la vitesse de rotation et la capacité de stockage sont identiques, est-ce que c'est bon ?

Je pose la question parce que quand j'essaye de reprendre des IronWolf sur Amazon France, on me dis que je ne peut pas être livré à une adresse française (le vendeur doit être étranger j'imagine).
Ils sont à 220€ pièce sur Amazon, alors qu'il sont à 270€ chez LDLC... Ca fait une grosse différence.

Modifié par LolYangccool
Lien vers le commentaire
Partager sur d’autres sites

Question difficile. D'abord quel est le "vrai" risque ? En fait, c'est qu'il y ait une trop grande différence (typiquement au démarrage, au réveil, ...) entre les temps de disponibilités des différents disques.

Dans ce cas, le système peut suspecter un problème et lancer d'autorité un check de parité (consistency check). Ce test implique la lecture de tous les secteurs de données, le calcul de la parité et la comparaison avec la parité inscrite sur le secteur de parité. Autrement dit, le processus passe tous les disques en revue du premier au dernier bit.

Cela entraine un peu d'usure supplémentaire des disques ainsi qu'un ralentissement pendant toute la durée du processus. Evidemment, si cela se produit de manière récurrente (ce ne sera pas plusieurs fois par jour, mais peut-être quelques fois par trimestre ou par mois), la probabilité d'un "vrai" couac est augmentée.

Ici le problème, c'est que même si tu prends des Ironwolf, après 6 ans (ton NAS date de 2015, c'est ça ?), ce risque d'avoir une différence sensible dans la durée de démarrage me parait exister. 

Enfin, la translation des disques d'un NAS à l'autre est toujours un peu tricky ... donc vérifie bien que tes backups sont à jour. Et j'imagine que ...

Lien vers le commentaire
Partager sur d’autres sites

Les disques sont de 2017. Ils ont 4 ans.
Mon backup est à jour. J'ai déjà migré les disques d'un NAS à l'autre lors du passage du DS212+ au DS1515+.
Je n'avais eu aucun soucis. Je n'ai pas peur de la migration, je ne me souviens pas qu'il y ait des choses à faire en particulier.
Les données ne sont pas modifié, c'est la partition système qui est recrée, et uniquement elle.

Que me conseilles-tu pour les disques ? Je ne me vois pas remettre entre 1300 et 1600€ de disques là tout de suite (220 ou 270€/disques, Amazon ou LDLC).

Modifié par LolYangccool
Lien vers le commentaire
Partager sur d’autres sites

Honnêtement, je ne sais pas que te conseiller. De base, je resterais sur des Ironwolf mais juste parce que c'est la même marque que celle que tu as actuellement et que j'imagine que le temps de réveil sera le plus proche de tes disques actuels. Et effectivement, je partais de l'idée de remplacer le disque suspect et pas toute la grappe.

J'ajoute que j'ai déjà du aussi mélanger des disques légèrement différents. J'ai remplacé un WD RED de 3TB par un 5 et un autre par un 6 TB, même si c'est avec ces disques là que j'ai eu le plus de prob (le 5 a lâché).

J'ai aussi remplacé des disques 3 TB Red par des 3TB acheté 3 ans plus tard. Et quand on sait comment WD a agit ... là aussi, j'ai du remplacé un plus récent (qui avait un max de LOAD_CYCLE_COUNT) par un autre.

Mais bon, quand on voit comment WD a "joué" avec ses gammes ... je suis sûr que c'est la source de mes 2 problèmes de disque avec eux sur un total de 18 disques RED. Et ça, j'ai quand même du mal à l'accepter même si je fermé les yeux et croisé les doigts quand j'ai acheté les derniers RED Plus (je n'ai pas de disques 7200 rpm).

Lien vers le commentaire
Partager sur d’autres sites

D'accord, merci Sethenès.
Je commanderai deux Ironwolf 8To, les mêmes.
J'en ai vu à 225€ mais livrable en France, en stock le 10/12 chez Amazon.

Edit : Les disques Ironwolf sur Amazon n'ont pas le même numéro de modèle exactement.
Dans mon NAS j'ai des ST8000VN0022 alors que sur Amazon ce sont des ST8000VN004.
Alors je ne sais pas.

Modifié par LolYangccool
Lien vers le commentaire
Partager sur d’autres sites

Il est parfois conseillé de mélanger des disques de marques différentes pour éviter justement de tomber sur une série entière de disques à problème au cas où, donc je ne pense pas que ça puisse poser problème.

Bien sûr il faut rester cohérent dans le mélange et ne pas mettre un Velociraptor à 15000t/mn au milieu de disques NAS à 5400t/mn, là DSM risquerait peut-être de prendre les disques lents pour des disques anomaliques. A noter que DSM interdit de mélanger HDD et SSD au sein d'une même grappe.

Modifié par pehache
Lien vers le commentaire
Partager sur d’autres sites

Il y a 16 heures, pehache a dit :

Il est parfois conseillé de mélanger des disques de marques différentes pour éviter justement de tomber sur une série entière de disques à problème au cas où, donc je ne pense pas que ça puisse poser problème.

Je suis ennuyé, mais pour moi, c'est clairement une très mauvaise idée.  Effectivement le wiki français suggère de mélanger des disques de même modèles et de bains différents mais je préfère l'argumentation du wiki anglais qui n'évoque pas du tout l'idée d'un lot défectueux mais plutôt celle d'une durée de vie et aussi d'une vie similaire. Par exemple, un jour la clim de notre petit centre est tombée et la t° est montée à un tel point qu'on ne pouvait pas entre dans la pièce. Littéralement. On a ouvert les deux portes pour faire courant d'air, on a stoppé tout ce qu'on pouvait mais il est évident que tout à pris un "coup" (UPS, CPU, Disques, ...).

En raison de ces deux faits cumulés (même durée de vie et même "vie"), les statistiques réelles montrent que la probabilité que 2 disques lâchent dans la même heure est 4x plus importante que le modèle théorique (loi exponentielle) ne le prédirait. C'est 4x plus mais ... 4 fois pas grand chose, ça reste pas grand chose. Source : Lien . Précisons encore qu'aucun des deux wikis n'évoque l'idée de disque de modèle (a fortiori de constructeur) différent.

Ensuite, on peut raisonner comme en math en extrapolant aux limites le raisonnement. Au taf, on avait un NAS en RAID 4 (avec 2 disques de parités par array RAID), ce qui fait que si 3 disques lâchent, c'est la cata. Donc au maximum on aurait pu avoir 2 disques de chaque type. Sur un NAS de 42 disques, il est évident que de trouver 21 paires de disques "comparables "mais de fournisseurs différents c'est impossible.

Par contre, ce qui est vrai, c'est que si les disques font initialement partie de la même commande, ici on a ajouter l'armure d'extension (pour passer de 28 à 42) après quelques années, donc les disques sortaient en principe d'un autre bain. Malgré tout, encore une fois disposer de disques de 21 bains différents est tout simplement impossible à réaliser dans la pratique. Nous n'avions "évidemment" pas un seul RAID sur les 42 disques (on devait en avoir 4 ou 5 arrays contenant entre 5 disques et 14)

Plus fondamentalement, c'est (selon moi) promouvoir l'idée que le RAID est une solution qui augmente le "data integrity" (qui augmente l'intégrité des données) alors qu'au niveau professionnel, le RAID est surtout un outil de "data availibility" (qui augmente la disponibilité des données).

Car il y a ici aussi une confusion. Le RAID, c'est du RAID 0, du RAID 1, 4, 5, 6, 10 et combien d'autres combinaisons plus complexes. Ici, ce que est toujours implicitement sous-entendus, c'est qu'on parle du RAID 5. Je me place bien dans cette utilisation particulière du RAID.

Quand je parle de disponibilité, je peux prendre l'exemple des machines Unix que j'administrais il y a 20 ans sans RAID et sans hotswap. Sur une telle machine, un crash d'un disque aurait occasionné des indisponibilités partielles ou totales de 48 h (livraison du disque en J+1, arrêt et restore de la machine dans la nuit de J+1 à J+2). Alors qu'avec un RAID, il n'y a aucune interruption. Sur le fameux NAS à 42 disques, j'ai eu 2 défaillances qui se sont produites de nuit. Mais le système a automatiquement détecté le problème, pris l'un des disques spares (de réserve) et à commencer le reconstruction. Le lendemain, un technicien est venu avec le nouveau "disque" et à simplement remplacé (sans interruption, grâce au hotswap) le "disque" défectueux par un nouveau qui a simplement rejoint la liste des spares.

Evidemment, l'OS de nombreuses machines est installé sur un RAID 1 (mirroring). Ceci dit, en plus de 20 ans, je n'ai jamais mais jamais eu le cas où il a été possible / nécessaire de faire usage de cette sécurité. A titre indicatif, si je ne dis pas de bêtise, c'est ce qu'il se passe dans les Syno. Il y a un volume caché au début de chaque disque qui est "utilisé" par le Syno et ce petit volume contient tout le système et tous les paramètres qui sont donc présents autant de fois que vous avez de disques. Même sur un disque "RAID 5" il y a ce petit volume caché en RAID 1 en début de disque.

Lien vers le commentaire
Partager sur d’autres sites

il y a 16 minutes, Sethenès a dit :

En raison de ces deux faits cumulés (même durée de vie et même "vie"), les statistiques réelles montrent que la probabilité que 2 disques lâchent dans la même heure est 4x plus importante que le modèle théorique (loi exponentielle) ne le prédirait. C'est 4x plus mais ... 4 fois pas grand chose, ça reste pas grand chose. Source : Lien . 

Ca on en avait déjà parlé, ça tient au fait que quand un disque lâche, les autres disques sont ultra-sollicités pendant plusieurs heures en continu pour la reconstruction, donc pour peu qu'ils soient déjà un peu "fatigués"  ça peut leur être fatal.

il y a 18 minutes, Sethenès a dit :

Nous n'avions "évidemment" pas un seul RAID sur les 42 disques (on devait en avoir 4 ou 5 arrays contenant entre 5 disques et 14)

Il est évident que la "recommandation" de varier les modèles s'applique au sein d'une grappe, pas aux 42 disques du NAS !

 

Lien vers le commentaire
Partager sur d’autres sites

il y a 43 minutes, pehache a dit :

Ca on en avait déjà parlé, ça tient au fait que quand un disque lâche, les autres disques sont ultra-sollicités pendant plusieurs heures en continu pour la reconstruction, donc pour peu qu'ils soient déjà un peu "fatigués"  ça peut leur être fatal.

Il est évident que la "recommandation" de varier les modèles s'applique au sein d'une grappe, pas aux 42 disques du NAS !

 

Pour le premier point, effectivement le RAID est en plus dégradé pendant le phase de reconstruction.

Le deuxième point est techniquement impossible parce que ce que tu fais, c'est de "sizer" les arrays RAID en fonction des besoins initiaux. Et puis au cours du temps, tu rajoutes progressivement des disques aux RAIDs qui sont presque full. C'est d'ailleurs l'énorme avantage du RAID 4 puisque les deux disques de parités sont fixes (ce sont les deux premiers) et que lors d'un ajout d'un nouveau disque au RAID, celui est préparé et ne contient que des 0 ... ce qui laisse la parité inchangée. C'est vrai aussi sur un RAID 5, mais là, comme les parités sont distribuées, il faut malgré tout les redistribuer et donc déplacer au moins 1/N blocs de parité (ou N = nombre de disques du RAID). Sans compter que justement, les disques spares sont attribués au RAID qui a un disque défectueux et qu'eux sont ben ... là où ils sont.

Dans le cas du NetApp, la taille maximum du RAID est de 14 disques (qui d'ailleurs n'a rien à voir avec la taille des armoires qui font aussi 14 disques) puisque tu peux panacher et ajouter des disques supplémentaires provenant soit de l'unité de base (14 disques) soit d'une extension.

Lien vers le commentaire
Partager sur d’autres sites

Il y a 2 heures, Sethenès a dit :

Le deuxième point est techniquement impossible parce que ce que tu fais, c'est de "sizer" les arrays RAID en fonction des besoins initiaux. Et puis au cours du temps, tu rajoutes progressivement des disques aux RAIDs qui sont presque full.

Du coup si c'est fait au cours temps, assez naturellement les disques ne viennent pas des mêmes séries.

Lien vers le commentaire
Partager sur d’autres sites

Il y a 4 heures, pehache a dit :

Du coup si c'est fait au cours temps, assez naturellement les disques ne viennent pas des mêmes séries.

Les achats ont été phasés. D'abord le NAS et une extension avec 28 disques et ensuite dans un second temps, un extension supplémentaire avec 14 disques. C'était des investissements budgétés.

Lien vers le commentaire
Partager sur d’autres sites

Je pense que je vais ajouter un disque en spare, je n'ai pas besoin d'avoir un RAID de 48To, 40To me suffisent pour le moment... (30To en RAID 5/SHR, en enlevant le disque de parité du total disponible)
Je pense que je vais jouer la sécurité en mettant le 6 ème disque en spare, comme ça il sera automatiquement utilisé en cas de défaillance d'un des 5 autres disques. :)

Lien vers le commentaire
Partager sur d’autres sites

il y a 18 minutes, LolYangccool a dit :

Je pense que je vais ajouter un disque en spare, je n'ai pas besoin d'avoir un RAID de 48To, 40To me suffisent pour le moment... (30To en RAID 5/SHR, en enlevant le disque de parité du total disponible)
Je pense que je vais jouer la sécurité en mettant le 6 ème disque en spare, comme ça il sera automatiquement utilisé en cas de défaillance d'un des 5 autres disques. :)

Excellente idée. D'autant plus que tu peux toujours revenir sur cette décision si le besoin s'en faisait sentir.

De plus, depuis DSM 7, le switch est effectivement automatique en cas de détection d'un pépin par l'OS, ce qui minimise le temps de dégradation du RAID que Pehache évoquait.

J'ai été surpris de constater que jusqu'à la version 6, cette procédure restait à charge de l'utilisateur quand bien même y a-t-il un disque spare. 

P.S. ; je suis toujours en 6.2 ...

Lien vers le commentaire
Partager sur d’autres sites

il y a 2 minutes, LolYangccool a dit :

Je peux intégrer le disque en spare au RAID existant sans tout péter du coup je suppose ? :)

Je ne l'ai jamais fait sur aucun RAID 5 et donc a fortiori pas sur le Syno non plus, à vérifier.

Maintenant, en principe, si DSM te laisse faire la manip ... mais "re"vérifier.

Modifié par Sethenès
Lien vers le commentaire
Partager sur d’autres sites

  • 5 weeks later...
  • 2 weeks later...

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

Chargement



×
×
  • Créer...