اگر یک مرکز داده نتواند زمان آماده به کار خود را حفظ کند مفید نیست، برای رقابت در بازار امروز حفظ زمان آپ تایم و به حداکثر رساندن آن در صورت نیاز مزیت رقابتی بزرگی است.
در حالی که قطع برنامه ریزی نشده تقریباً بر روی هر مرکز داده تأثیر مخرب زیادی می گذارد، به حداقل رساندن تعداد و مدت زمان قطعی باید در اولویت مدیران مراکزداده باشد.
دلایل اصلی قطعی در مراکزداده چیست؟
این باوری اشتباه اما رایج است که اعتقاد داریم اکثر وقفه های برنامه ریزی نشده مرکز داده توسط عوامل غیرقابل کنترل مانند مشکلات مربوط به آب و هوا اتفاق می افتد. در حالی آب و هوا و عواملی چون طوفان، گرما زیاد و بارش های سنگین می تواند تاثیر گذار باشد اما عوامل دیگری نیز وجود دارند که اغلب باعث قطعی در مراکز داده می شوند و اینها اغلب عواملی هستند که می توانند با مدیریت بهتر زیرساخت های مرکز داده برطرف شوند.
اگر به دنبال یافتن دلایل قطعی مراکزداده خود نباشید، نمی توانید از وقفه و از کار افتادگی جلوگیری کنید.
نکته قابل توجه متفاوت بودن هر مرکز داده از نظر تاسیسات و تجهیزات است بنابراین برای بررسی آنچه که باعث خاموشی و یا از کار افتادگی شده است باید توان تجهیزات، نوع برق رسانی، تمهیدات امنیتی و همچنین مکانی که پیش بینی می کنید آسیب پذیری از آن باشد را بشناسید تا حتی در صورت نیاز به حفاری آن را با اطمینان انجام دهید.
یک از مهم ترین عوامل در قطعی، خطای انسانی است
بسیاری از مطالعات نشان داده اند که به طور معمول ، قطع شدن مرکز داده ها کاملاً قابل پیشگیری است. با توجه به اینکه قطع شدن مرکز داده می تواند باعث خسارت مالی قابل توجه و همچنین امنیت داده را به خطر بیندازد ، این یک مشکل اساسی است که می تواند و باید رفع شود. بسیاری از این خطاهای انسانی به ظاهر کوچک هستند اما می توانند عواقب قابل توجهی به همراه داشته باشند. چیزی به اندازه برچسب زدن و محافظت صحیح از دکمه های خاموش شدن اضطراری یا عدم اجازه غذا و نوشیدنی در نزدیکی وسایل الکترونیکی می تواند تفاوتی باشد که از قطع مرکز داده جلوگیری می کند.
باور کنید یا نکنید ، یکی از رایج ترین دلایل قطع مرکز اطلاعات اطلاعات خطای انسانی است! خطای انسانی می تواند نتیجه سهل انگاری یا صرفاً یک اشتباه باشد. روش های مختلفی برای جلوگیری از بروز خطای انسانی وجود دارد که هم مقرون به صرفه و هم کارآمد هستند و اجرای آنها را آسان می کند. بسیار مهم است که شما به درستی کارمندان خود را آموزش دهید و همیشه وقتی انحراف از فرایندهای ایجاد شده وجود دارد ، یک کارمند را اصلاح کنید. موسسه Uptime به طور روزمره اطلاعات مربوط به زمان خرابی را از مراکز داده جمع آوری می کند و تحقیقات آنها نشان می دهد خطای انسانی نیز یک مشکل مهم قابل پیشگیری است – اما این یکی از مواردی است که مدیریت باید با اصلاح سیستم ها و رویه های مناسب برای اصلاح پرسنل ، “برخی از کارشناسان صنعت تعداد بالغ بر 75٪ ، اما موسسه Uptime به طور کلی حدود 70٪ را بر اساس اطلاعات فراوانی که ما به طور مداوم جمع آوری می کنیم گزارش می دهد … یک بررسی سریع از مسائل نشان می دهد که عدم موفقیت مدیریت – نه خطای انسانی – دلیل اصلی تداوم وقفه ها است. مدیریت با کمبود سرمایه گذاری در آموزش ، عدم اجرای سیاست ها ، اجازه دادن به روال منسوخ شدن رویه ها و دست کم گرفتن اهمیت کارکنان واجد شرایط ، زمینه را برای ایجاد شرایطی فراهم می کند که منجر به خرابی می شود. “
قطعی UPS یکی دیگر از دلایل عمده از کار افتادگی مراکزداده
سیستم UPS شما و هر سیستم برق پشتیبان دیگری که در محل خود دارید، صرفا وجودشان کافی نیست بلکه دایما باید آن ها را تست و پایش کنید تا از سلامت کارکرد آن ها مطمئن شوید.
این تجهیزات گاها خود علل قطعی مراکزداده می باشند خصوصاً در مواردی که به طور معمول نگهداری و آزمایش نمی شوند.
حتی همچنان وجود دارند مدیرانی که منبع برق اضطراری (UPS) را برای مراکزداده خود ضروری نمی بینند و کارایی آن را به اندازه 1 ساعت پوشش تجهیزات کافی می دانند، در حالی که امروزه با وجود توسعه توان برقی در سطح جهان مصرف برق و انرژی هم به طور فزاینده افزایش یافته و در سراسر جهان همچنان بحران انرژی دیده می شود.
در هر صورت اگر از UPS با بار کافی استفاده نمی کنید و یا آن را به طور منظم تست و پایش نمی کنید ممکن است حتی بدون اینکه متوجه شوید از ظرفیت UPS خود برای پشتیبانی فراتر بروید.
به همین دلیل بسیار مهم است که اطمینان حاصل کنید UPS های شما می توانند تقاضای برق فعلی شما را کنترل کنند و حتی در صورت افزایش بار تجهیزات فاوا بتوانید با مقیاس بندی برای مدت مکفی برق تجهیزات را فراهم و از کار افتادگی جلوگیری کنید.
مشکلات امنیتی مرکز داده همچنین می تواند منجر به قطع برق شود
با پیشرفتهای مداوم ، منحصر به فرد و تشخیص تهدیدها ، امنیت سایبری بیش از هر زمان دیگری مهم است. مراکز داده یک هدف آشکار برای حملات سایبری هستند ، بنابراین جای تعجب نیست که آنها می توانند دلیل اصلی وقفه های غیر برنامه ریزی شده باشند. DDoS (انکار سرویس توزیع شده) معمولاً از روشهایی برای حمله به سیستمهای مرکز داده استفاده می شود ، به همین دلیل وجود راه حلهای امنیتی DDoS می تواند به دفاع در برابر پیچیده ترین حملات کمک کند. دانش مرکز داده پیچیدگی حملات سایبری علیه سیستم های قدرت را توضیح می دهد و می گوید که اگر محافظت مناسب ، و همچنین سیستم ها و روش ها قبل از حمله وجود نداشته باشد ، چگونه فاجعه بار می توانند بر یک مرکز داده تأثیر بگذارند ، “” اکثر تجهیزات قدرت در مرکز داده می تواند از راه دور کنترل و پیکربندی شود ، ‘باب پرویت ، مدیر راه حل های امنیتی در SHI International in در یک مصاحبه به دانش مرکز داده گفت. “بنابراین ، یک بازیگر بد مخرب می تواند کنترل این دستگاه ها را در دست بگیرد و برق را به یک مرکز داده یا یک دستگاه خاص در شبکه شما قطع کند”… برخی از این سیستم های کنترل می توانند در گروه اینترنت اشیا قرار بگیرند… حملات علیه دستگاه های اینترنت اشیا بر اساس گزارشی از فروشنده امنیت سایبری Darktrace مستقر در سانفرانسیسکو در سال گذشته 100 درصد افزایش یافته است … در بیشتر انواع حملات ، تیم های امنیت سایبری می توانند ترافیک یا حتی کل سیستم های به خطر افتاده را منزوی کنند. اما کنترل های صنعتی یک مورد خاص است … اگر دستگاه ها و رایانه هایی که منبع تغذیه یک مرکز داده را کنترل می کنند ، قطع کردن آنها می تواند باعث خاموش شدن برق در کل تأسیسات شود. دلیل دیگری نیز وجود دارد که باید به خصوص در محافظت از دسترسی به سیستم های قدرت مراقب باشید مهاجمانی که کنترل منبع تغذیه یک مرکز داده را در اختیار دارند می توانند مرکز داده را خاموش کنند – اما همچنین می توانند باعث افزایش برق شوند که تجهیزات را از بین می برد. “
دلایل زیادی وجود دارد که یک مرکز داده می تواند قطعی برق را تجربه کند و عوامل ذکر شده مطمئناً تنها مواردی نیستند که مراکز داده را با خطر مواجه می کنند. به همین دلیل ، ضروری است که مدیران مراکز داده استراتژی های قوی DCIM را اجرا کنند که همه کارکنان سازگار و پایبند باشند. با انجام این کار ، شما به شدت خطر برق را قطع می کنید که مرکز داده شما با قطع برق مواجه می شود و در نتیجه باعث به حداکثر رساندن زمان کار ، محافظت از اطلاعات حساس و صرفه جویی در هزینه های طولانی مدت می شود.