Disaster Recovery

راهکارهای Disaster Recovery

راهکارهای Disaster Recovery برای سازمان های حوزه فناوری اطلاعات

با توجه به افزایش روزافزون تهدیدات امنیتی، حملات سایبری و به ‌وقوع پیوستن روزانه میلیون‌ها حمله‌  نفوذگران به سایت‌ها و مراکز داده و کسب و کارهای اینترنتی و… لازم است تدابیری در نظر گرفته شود که مشمول زیرساخت و پرسنل و فرآیند باشد؛ تا پس از وقوع یک رویداد ناگوار بتوان دستیابی به سرویس را فراهم و کسب وکار را مانند زمان قبل از وقوع حادثه ، دوباره فعال کرد. لازمه این کار تهیه یک طرح از پیش مشخص است. (DR) Disaster Recovery Plan به معنی خروج و نجات از فاجعه است. تعریف یک نقطه بازگشت برای مواقع اضطراری که تداوم کسب و کار را برای ما حفظ کند، ضروری است.
DR  در حقیقت نوعی بیمه برای منابع IT سازمان شما در زمان وقوع فاجعه به حساب می‌آید. بنابراین یکDR  مناسب می‌بایست همانند یک بیمه خوب، بهترین کارایی را برای سازمان فراهم آورد، حفاظتی با داشتن معیارها، برای به حداقل رساندن مشکلات، با کمترین هزینه و .Down Time
برای طرح‌ریزی سناریوی DR لازم است میزان ریسک، برآورد شده و ارزیابی‌های انجام شده شامل موارد زیر باشد:

  • انجام آنالیز ریسک قبل از DR
  •  بررسی و تعیین کردن  اهداف اصلی سازمان بصورت کامل
  •  مشخص کردن سرویس‌های سازمان و تعیین اولویت هر یک از آنها برای راه‌اندازی مجدد
  • تعیین لیستی ضروری از نرم‌افزار‌ها، لایسنس‌ها، و سیستم‌هایی که زمان DR بکار گرفته خواهند شد.
  • میزان تداوم سرویس سازمان (شناسایی و مشخص کردن حداکثر تهدیدات و زمان قطعی)
  • مشخص و تعیین کردن  پرسنل و اعضای بازیابی و راه‌های ارتباط با این افراد.
  • لازم است شرحی کامل از موارد ضروری و کارهایی که باید برای پاسخ به بحران انجام پذیرد، قید گردد.
  • نمودار یا تصویری از کل شبکه ارائه شود تا مسیر بازیابی مشخص شده برای پرسنل در دسترس باشد و در سریعترین زمان ممکن فرآیند بازیابی انجام گیرد.
  • تعیین فرآیندهایی برای ارتباط سرورها، حوزه پوشش امن‌افزارها و سایر برنامه‌های کاربردی
  • تست و بررسی طرح واکنشی تعریف شده
  • تعریف برنامه‌ی ماژولار برای به ‌روز کردن طرح  DR

تهدیداتی که دنیای فناوری اطلاعات با آن مواجه است:

تهدیدات امنیتی می‌تواند به سه دسته تهدیدات فناوری، انسانی و تجهیزاتی تقسیم شود.

باج افزارها، نمونه‌ی یک تهدید نرم‌افزاری هستند. درحالی‌که تهدیدات انسانی شامل شورش‌ها و خرابکاری‌های عمدی می‌شوند. همچنین خرابی‌های سخت‌افزاری مانند قطعی برق، آتش سوزی، زلزله و… یک تهدید تجهیزاتی است. وقوع چنین رویدادهایی می‌تواند منجر به اختلال در روند کسب و کار، از دست رفتن اطلاعات مهم و حتی ایجاد خطر برای موجودیت کسب و کار شود.

ضرورت بازیابی از فاجعه:

با طراحی درست و در نظر گرفتن نیازهای کسب و کار، می‌توان این قابلیت را به نحوی ایجاد کرد تا پس از بروز رخدادهای غیرطبیعی و فاجعه، سرویس‌های حیاتی و اطلاعات کسب و کار و مشتریان حفظ شود و در سایت DR ایجاد شده UP شود. طبق آمار Gartner، چهل درصد کسب و کارهایی که دچار فاجعه می‌شوند، اگر در عرض 24 ساعت نتوانند به اطلاعاتشان دسترسی پیدا کنند، در معرض ورشکستگی قرار می‌گیرند. از آنجا که احتمال زیادی وجود دارد مشاغل پس از فاجعه میزان قابل توجهی داده از دست دهند، بازیابی اطلاعات و سرویس‌ها در کوتاه‌ترین زمان ممکن اهمیت زیادی دارد.

دو معیار اندازه گیری Downtime که در DR و زمان خرابی استفاده می شوند شامل:

:Recovery Time Objective (RTO)  حداکثر مدت زمانی است که یک سرویس یا اپلیکیشن می‌تواند از دسترس خارج شود و آسیب جدی به کسب و کار وارد نشود.
:(RPO) Recovery Point Objective حداکثر داده‌ای که سازمان ، پذیرش از دست دادنش را دارد. به عبارتی در صورت رخداد فاجعه، داده‌های چند مدت پیش را می‌توان برگرداند.
بنابراین،RTO  و RPO جهت کمک به سازمان در انتخاب روش‌های بهینه، استراتژی‌ها و فناوری‌های بازیابی فاجعه ، نقش اساسی دارند.

تشکیل تیم بازیابی از فاجعه

با توجه به طراحی انجام شده، عملیات Failover می‌تواند با استفاده از پیکربندی‌ها و اسکریپت‌ها انجام شود به صورت اتوماتیک یا به صورت Manual باشد. یعنی فردی متخصص، مسئول در مدار قرار دادن سرویس‌های قرار گرفته شده در سایت DR باشد. لازم است طرح تدوین شده، به صورت کامل به تیم فنی هر کسب ‌و‌ کار و مدیران مجموعه شرح داده شود تا در صورت بروز فاجعه، هر شخص به سرعت مسئولیت خود را انجام دهد. در صورتی که اطلاعات مربوط به افراد یا شرکت‌هایی که در بازگشت بحران مشارکت دارند تغییر کرده است. حتما به بروزرسانی مربوط انجام شود. البته لازم است پس از تدوین و تایید طرح ارائه شده، Test Plan  نیز در نظر گرفته شود. این Test Plan باید در ساعات مشخص شده و با هماهنگی‌های لازم اجرا شود تا انسجام و درستی طرح دیده شود. در صورت عدم وجود برنامه‌ای برای تست و عدم اطمینان از جواب‌دهی طرح ارائه شده، ممکن است در زمان بروز رخداد ،عملیات Failover انجام نشود و به کسب‌ و‌ کار شرکت آسیب‌های جدی وارد شود.

پس از وقوع بحران یا حادثه

پس از بحران لازم است به درستی اقدامات بازگشت صورت پذیرد.

 راه‌اندازی‌های مجدد سرویس‎های سازمان که در ارجحیت بوده و فعال‌سازی دوباره‌ آنها، مهمترین اولویت پس از وقوع بحران است. همچنین پاسخ به بحران رخ داده می‌تواند شامل تشخیص محل درگیر ‌شده توسط بحران باشد. یعنی تشخیص این‌که چه تجهیزاتی به وسیله واقعه‌ی بحران تحت تاثیر گرفته‌اند. این عملیات می‌تواند با داشتن سیستم‌های مانیتورینگ انجام شود. همچنین، بازیابی سیستم‌ها و شناسایی سیستم‌های اکتیو و سیستم‌هایی که می‌تواند بهبود یابد، صورت می‌گیرد.

راهکارهای پیاده سازی DR

  • استفاده از فضای ابری :استفاده از فضای ابر در طرح بازیابی از فاجعه یا DR می‌تواند مزایایی از جمله هزینه کمتر، توسعه راحت‌تر و قابلیت تست طرح‌ها به طور منظم را داشته باشد، باید توجه داشت که این کار باعث افزایش پهنای باند مورد نیاز می‌شود و در نتیجه ممکن است کارایی شبکه را هنگام استفاده از سیستم‌های پیچیده‌تر، کاهش دهد.
  • راه اندازی و استفاده از سایت دوم:(Disaster Recovery Site) سایت بازیابی بحران‌، که از آن بعنوان سایت دوم و سایت پشتیبان نیز یاد می‌شود، مکانی است که سازمان می‌تواند به طور موقت به خاطر ایراد امنیتی یا بلایای طبیعی به آن منتقل و از سرویس‌ها و اطلاعات استفاده کند. این سایت به نوعی برنامه‌ریزی و تدوین شده است که سازمان برای ادامه عملیات کسب ‌و‌ کار پس از یک اتفاق غیرمنتظره که در آن داده‌ها، نرم افزارها و سیستم‌های سخت افزاری آسیب رسیده یا از بین رفته باشد، بتوان فعالیت خود را ادامه دهد.Disaster recovery site (DR)  امکاناتی است که سازمان می‌تواند برای بازیابی زیرساخت‌های فناوری و عملیات خود در صورت عدم دسترسی به مراکز داده اولیه، از آن استفاده کند. لازمه تصمیم‌گیری درباره اینکه سازمان به چه نوع سایت DR محتاج است، نیازمند برنامه‌ریزی دقیق و توازن هزینه‌ها در برابر خطرات است.

فاصله مهم‌ترین نکته برای سایت DR است. سایت نزدیکتر امکان هماهنگی دقیق‌تر و مدیریت آسان‌تر کارکنان را فراهم می‌کند.
اما باید در یک شبکه برقی متفاوت از مرکز داده اولیه سازمان و به اندازه کافی دور باشد تا یک فاجعه بزرگ هر دو مکان را تحت تاثیر قرار ندهد. هر چند سایت‌های خیلی دور می‌توانند هزینه بر باشند، پرسنل مختلفی احتیاج داشته و در نهایتا هزینه‌های زیادی دارند. یک سازمان باید براساس اهمیت داده‌ها، نوع مخاطرات احتمالی و هزینه‌ها تصمیم‌گیری شود

  • استفاده از کانتینترها: مرکز دادۀ سیار CDC (Containerized Data Center) مجموعه‌ای از زیرساخت‌ها و تجهیزات است که جزو مرکز دادۀ سیار MDC (Mobile Data Center) محسوب می‌شود و گاهی به همین نام نیز خوانده می‌شود. این نوع مرکز داده به نگهداری داده‌های یک سازمان در درون یک کانتینر می‌پردازد و می‌تواند برای پاسخ به نیازهایی مانند کمبود فضای فیزیکی، محدودیت‌ها و هزینه‌های بالای ساخت مرکز دادۀ ثابت، سرعت عمل در راه‌اندازی، مسائل امنیتی، امکان جابه‌جایی در کمترین زمان ممکن و بسیاری نیازهای دیگر، مورد استفاده قرار گیرد.