راهکارهای Disaster Recovery برای سازمان های حوزه فناوری اطلاعات
با توجه به افزایش روزافزون تهدیدات امنیتی، حملات سایبری و به وقوع پیوستن روزانه میلیونها حمله نفوذگران به سایتها و مراکز داده و کسب و کارهای اینترنتی و… لازم است تدابیری در نظر گرفته شود که مشمول زیرساخت و پرسنل و فرآیند باشد؛ تا پس از وقوع یک رویداد ناگوار بتوان دستیابی به سرویس را فراهم و کسب وکار را مانند زمان قبل از وقوع حادثه ، دوباره فعال کرد. لازمه این کار تهیه یک طرح از پیش مشخص است. (DR) Disaster Recovery Plan به معنی خروج و نجات از فاجعه است. تعریف یک نقطه بازگشت برای مواقع اضطراری که تداوم کسب و کار را برای ما حفظ کند، ضروری است.
DR در حقیقت نوعی بیمه برای منابع IT سازمان شما در زمان وقوع فاجعه به حساب میآید. بنابراین یکDR مناسب میبایست همانند یک بیمه خوب، بهترین کارایی را برای سازمان فراهم آورد، حفاظتی با داشتن معیارها، برای به حداقل رساندن مشکلات، با کمترین هزینه و .Down Time
برای طرحریزی سناریوی DR لازم است میزان ریسک، برآورد شده و ارزیابیهای انجام شده شامل موارد زیر باشد:
- انجام آنالیز ریسک قبل از DR
- بررسی و تعیین کردن اهداف اصلی سازمان بصورت کامل
- مشخص کردن سرویسهای سازمان و تعیین اولویت هر یک از آنها برای راهاندازی مجدد
- تعیین لیستی ضروری از نرمافزارها، لایسنسها، و سیستمهایی که زمان DR بکار گرفته خواهند شد.
- میزان تداوم سرویس سازمان (شناسایی و مشخص کردن حداکثر تهدیدات و زمان قطعی)
- مشخص و تعیین کردن پرسنل و اعضای بازیابی و راههای ارتباط با این افراد.
- لازم است شرحی کامل از موارد ضروری و کارهایی که باید برای پاسخ به بحران انجام پذیرد، قید گردد.
- نمودار یا تصویری از کل شبکه ارائه شود تا مسیر بازیابی مشخص شده برای پرسنل در دسترس باشد و در سریعترین زمان ممکن فرآیند بازیابی انجام گیرد.
- تعیین فرآیندهایی برای ارتباط سرورها، حوزه پوشش امنافزارها و سایر برنامههای کاربردی
- تست و بررسی طرح واکنشی تعریف شده
- تعریف برنامهی ماژولار برای به روز کردن طرح DR
تهدیداتی که دنیای فناوری اطلاعات با آن مواجه است:
تهدیدات امنیتی میتواند به سه دسته تهدیدات فناوری، انسانی و تجهیزاتی تقسیم شود.
باج افزارها، نمونهی یک تهدید نرمافزاری هستند. درحالیکه تهدیدات انسانی شامل شورشها و خرابکاریهای عمدی میشوند. همچنین خرابیهای سختافزاری مانند قطعی برق، آتش سوزی، زلزله و… یک تهدید تجهیزاتی است. وقوع چنین رویدادهایی میتواند منجر به اختلال در روند کسب و کار، از دست رفتن اطلاعات مهم و حتی ایجاد خطر برای موجودیت کسب و کار شود.
ضرورت بازیابی از فاجعه:
با طراحی درست و در نظر گرفتن نیازهای کسب و کار، میتوان این قابلیت را به نحوی ایجاد کرد تا پس از بروز رخدادهای غیرطبیعی و فاجعه، سرویسهای حیاتی و اطلاعات کسب و کار و مشتریان حفظ شود و در سایت DR ایجاد شده UP شود. طبق آمار Gartner، چهل درصد کسب و کارهایی که دچار فاجعه میشوند، اگر در عرض 24 ساعت نتوانند به اطلاعاتشان دسترسی پیدا کنند، در معرض ورشکستگی قرار میگیرند. از آنجا که احتمال زیادی وجود دارد مشاغل پس از فاجعه میزان قابل توجهی داده از دست دهند، بازیابی اطلاعات و سرویسها در کوتاهترین زمان ممکن اهمیت زیادی دارد.
دو معیار اندازه گیری Downtime که در DR و زمان خرابی استفاده می شوند شامل:
:Recovery Time Objective (RTO) حداکثر مدت زمانی است که یک سرویس یا اپلیکیشن میتواند از دسترس خارج شود و آسیب جدی به کسب و کار وارد نشود.
:(RPO) Recovery Point Objective حداکثر دادهای که سازمان ، پذیرش از دست دادنش را دارد. به عبارتی در صورت رخداد فاجعه، دادههای چند مدت پیش را میتوان برگرداند.
بنابراین،RTO و RPO جهت کمک به سازمان در انتخاب روشهای بهینه، استراتژیها و فناوریهای بازیابی فاجعه ، نقش اساسی دارند.
تشکیل تیم بازیابی از فاجعه
با توجه به طراحی انجام شده، عملیات Failover میتواند با استفاده از پیکربندیها و اسکریپتها انجام شود به صورت اتوماتیک یا به صورت Manual باشد. یعنی فردی متخصص، مسئول در مدار قرار دادن سرویسهای قرار گرفته شده در سایت DR باشد. لازم است طرح تدوین شده، به صورت کامل به تیم فنی هر کسب و کار و مدیران مجموعه شرح داده شود تا در صورت بروز فاجعه، هر شخص به سرعت مسئولیت خود را انجام دهد. در صورتی که اطلاعات مربوط به افراد یا شرکتهایی که در بازگشت بحران مشارکت دارند تغییر کرده است. حتما به بروزرسانی مربوط انجام شود. البته لازم است پس از تدوین و تایید طرح ارائه شده، Test Plan نیز در نظر گرفته شود. این Test Plan باید در ساعات مشخص شده و با هماهنگیهای لازم اجرا شود تا انسجام و درستی طرح دیده شود. در صورت عدم وجود برنامهای برای تست و عدم اطمینان از جوابدهی طرح ارائه شده، ممکن است در زمان بروز رخداد ،عملیات Failover انجام نشود و به کسب و کار شرکت آسیبهای جدی وارد شود.
پس از وقوع بحران یا حادثه
پس از بحران لازم است به درستی اقدامات بازگشت صورت پذیرد.
راهاندازیهای مجدد سرویسهای سازمان که در ارجحیت بوده و فعالسازی دوباره آنها، مهمترین اولویت پس از وقوع بحران است. همچنین پاسخ به بحران رخ داده میتواند شامل تشخیص محل درگیر شده توسط بحران باشد. یعنی تشخیص اینکه چه تجهیزاتی به وسیله واقعهی بحران تحت تاثیر گرفتهاند. این عملیات میتواند با داشتن سیستمهای مانیتورینگ انجام شود. همچنین، بازیابی سیستمها و شناسایی سیستمهای اکتیو و سیستمهایی که میتواند بهبود یابد، صورت میگیرد.
راهکارهای پیاده سازی DR
- استفاده از فضای ابری :استفاده از فضای ابر در طرح بازیابی از فاجعه یا DR میتواند مزایایی از جمله هزینه کمتر، توسعه راحتتر و قابلیت تست طرحها به طور منظم را داشته باشد، باید توجه داشت که این کار باعث افزایش پهنای باند مورد نیاز میشود و در نتیجه ممکن است کارایی شبکه را هنگام استفاده از سیستمهای پیچیدهتر، کاهش دهد.
- راه اندازی و استفاده از سایت دوم:(Disaster Recovery Site) سایت بازیابی بحران، که از آن بعنوان سایت دوم و سایت پشتیبان نیز یاد میشود، مکانی است که سازمان میتواند به طور موقت به خاطر ایراد امنیتی یا بلایای طبیعی به آن منتقل و از سرویسها و اطلاعات استفاده کند. این سایت به نوعی برنامهریزی و تدوین شده است که سازمان برای ادامه عملیات کسب و کار پس از یک اتفاق غیرمنتظره که در آن دادهها، نرم افزارها و سیستمهای سخت افزاری آسیب رسیده یا از بین رفته باشد، بتوان فعالیت خود را ادامه دهد.Disaster recovery site (DR) امکاناتی است که سازمان میتواند برای بازیابی زیرساختهای فناوری و عملیات خود در صورت عدم دسترسی به مراکز داده اولیه، از آن استفاده کند. لازمه تصمیمگیری درباره اینکه سازمان به چه نوع سایت DR محتاج است، نیازمند برنامهریزی دقیق و توازن هزینهها در برابر خطرات است.
فاصله مهمترین نکته برای سایت DR است. سایت نزدیکتر امکان هماهنگی دقیقتر و مدیریت آسانتر کارکنان را فراهم میکند.
اما باید در یک شبکه برقی متفاوت از مرکز داده اولیه سازمان و به اندازه کافی دور باشد تا یک فاجعه بزرگ هر دو مکان را تحت تاثیر قرار ندهد. هر چند سایتهای خیلی دور میتوانند هزینه بر باشند، پرسنل مختلفی احتیاج داشته و در نهایتا هزینههای زیادی دارند. یک سازمان باید براساس اهمیت دادهها، نوع مخاطرات احتمالی و هزینهها تصمیمگیری شود
- استفاده از کانتینترها: مرکز دادۀ سیار CDC (Containerized Data Center) مجموعهای از زیرساختها و تجهیزات است که جزو مرکز دادۀ سیار MDC (Mobile Data Center) محسوب میشود و گاهی به همین نام نیز خوانده میشود. این نوع مرکز داده به نگهداری دادههای یک سازمان در درون یک کانتینر میپردازد و میتواند برای پاسخ به نیازهایی مانند کمبود فضای فیزیکی، محدودیتها و هزینههای بالای ساخت مرکز دادۀ ثابت، سرعت عمل در راهاندازی، مسائل امنیتی، امکان جابهجایی در کمترین زمان ممکن و بسیاری نیازهای دیگر، مورد استفاده قرار گیرد.