Replication چیست

نویسنده:

دسته:

تاریخ انتشار:


روش‌های مختلفی برای ذخیره و بک‌آپ‌گیری داده‌ها وجود دارد. یکی از این روش‌ها Data replication نام دارد. Data replication فرایند کپی‌کردن داده‌ها از یک مکان به مکان دیگر است. این گونه می‌توانید چندین کپی به روز از داده‌های خود داشته باشید و از بروز فاجعه جلوگیری کنید. معمولاً فرایند تکثیر داده بین دو مکان انجام می‌شود تا امنیت کار بالا برود. در این مقاله می‌خواهیم به بررسی انواع تکثیر داده بپردازیم و کاربردها، مزایا و روش‌های انجام این کار را توضیح دهیم. با ادامه این مطلب ما را همراهی کنید. 

منظور از تکثیر داده‌ها چیست؟

در فرایند Data Replication یا تکثیر داده، از داده‌ها در یک یا چند مکان به جز مکان ذخیره‌سازی اصلی کپی ساخته می‌شود. برای اجرای Data Replication نیازی نیست دستگاه‌های ذخیره‌سازی به هم متصل باشند یا حتی نزدیک به هم باشند. امکان اجرای این روش از طریق سرویس‌های ابری و با فاصله جغرافیایی هم وجود دارد. Data Replication را می‌توان از طریق سه نوع شبکه انجام داد:

  • شبکه ذخیره‌سازی (SAN)
  • شبکه محلی (LAN)
  • شبکه گسترده (WAN)

معمولاً شرکت‌ها و سازمان‌های مختلف می‌توانند از تکنیک‌های تکثیر داده‌ها در موارد زیر استفاده کنند:

  • سیستم‌های پردازش تراکنش اضافی
  • پروژه‌های توسعه برنامه
  • تجزیه و تحلیل کلان‌داده
  • همگام‌سازی داده‌ها در پروژه‌های مدیریت داده، بازارهای داده تحلیلی، محیط‌های پردازنده مرکزی و...

تکثیر داده چگونه انجام می‌شود؟

با کمک چندین روش مختلف می‌توان Replication را پیاده‌سازی کرد. در اینجا به برخی از محبوب‌ترین این روش‌ها اشاره می‌کنیم:

  • تکثیر مبتنی بر میزبان یا هاست: در این روش، از سرورهای اپلیکیشن همراه با نرم‌افزار برای ایجاد کپی داده، از یک سایت به سایت دیگر استفاده می‌شود. این تکثیر عمدتاً مبتنی بر فایل و غیرهم‌زمان است. مزیت این تکثیر این است که مستقل از فضای ذخیره‌سازی انجام می‌شود.
  • تکثیر مبتنی بر هایپروایزر: این نوع تکثیر داده‌ها به طور خاص برای کپی/تکثیر کل ماشین‌های مجازی (VM) از یک سرور میزبان یا کلاستر میزبان به سرور دیگر طراحی شده است. مزیت تکثیر مبتنی بر هایپروایزر این است که می‌توان آن را روی سرورهایی اجرا کرد که به طور عادی از Replicates Data پشتیبانی نمی‌کنند. نقطه ضعفی که دارد این است که در حین تکثیر به شدت از CPU استفاده می‌کند. همین امر موجب می‌شود تا در طول Replicates Data عملکرد سرور تحت تأثیر قرار بگیرد.
  • تکثیر مبتنی بر آرایه: در این روش از نرم‌افزارهای داخلی برای تکثیر خودکار داده‌ها در میان آرایه‌های ذخیره‌سازی سازگار با یکدیگر استفاده می‌شود. محیط‌های ذخیره‌سازی در این روش باید همگن باشند. زیرا آرایه‌های منبع و هدف باید مشابه باشند. نقطه قوت این روش این است که قوی‌تر عمل می‌کند و به هماهنگی کمتری نیاز دارد. 
  • تکثیر مبتنی بر شبکه: در این روش تکثیر داده در شبکه انجام می‌شود. این روش از هر نوع هاست با هر آرایه‌ای پشتیبانی می‌کند. معمولاً از تکثیر داده مبتنی بر شبکه در محیط‌های ذخیره‌سازی ناهمگن استفاده می‌شود. 

نحوه عملکرد data replication

برای اطلاعات بیشتر بخوانید: hyper v چیست؟

انواع روش‌های تکثیر داده 

Data Replication یا تکثیر داده‌ها را می‌توان بر اساس روش، هدف و ویژگی‌های فرایند تکثیر به انواع مختلفی طبقه‌بندی کرد:

  • بر اساس زمان کپی‌کردن داده‌ها: هم‌زمان، غیرهم‌زمان، نسبتاً هم‌زمان
  • بر اساس تکنیک کپی‌کردن داده‌ها: تکثیر کامل، تکثیر افزایشی، تکثیر مبتنی بر گزارش، کپی اسنپ‌شات، تکثیر تراکنشی، تکثیر همتابه‌همتا، تکثیر ادغامی

در ادامه انواع تکثیر داده توضیح می‌دهیم.

انواع Data Replication بر اساس زمان کپی‌کردن داده‌ها

پیش‌تر اشاره کردیم که تکثیر داده‌ها را بر اساس زمان می‌توان به 3 دسته تقسیم کرد. در این بخش این 3 مورد را توضیح می‌دهیم. 

تکثیر داده هم‌زمان

در Synchronous replication، کپی از داده‌ها در زمان واقعی انجام می‌شود. یعنی وقتی داده جدیدی ایجاد می‌شود، به طور هم‌زمان کپی آن نیز ساخته می‌شود. این نوع تکثیر برای محیط‌هایی مناسب است که به Recovery Time Objectives کمتری نیاز دارند. منظور از Recovery Time Objectives مدت زمان لازم برای ریکاوری سیستم پس از بروز فاجعه است. 

از آنجایی که تکثیر به صورت هم‌زمان انجام می‌شود، فرایند راه‌اندازی بسیار گران است. با این حال، اگر فاجعه‌ای رخ دهد، این روش بسیار قابل‌اعتمادتر است. نکته مهم دیگری که در مورد تکثیر داده هم‌زمان وجود دارد این است که برای اجرای این روش به سیستمی قوی نیاز است. زیرا هم‌زمانی تکثیر با دیگر عملیات موجب تأخیر و کند شدن عملکرد سیستم می‌شود. 

تکثیر داده غیرهم‌زمان 

برخلاف روش پیشین، Asynchronous Replication از داده‌ها با توجه به برنامه از قبل تعریف شده کپی تهیه می‌کند. یعنی ممکن است ساخت کپی از داده‌ها هر چند ساعت یک بار، چند روز یک بار و... انجام شود. این روش برای اجرا در فواصل دور طراحی شده است و در مقایسه با همتای خود از پهنای باند کمتری استفاده می‌کند. تکثیر ناهم‌زمان برای کسب‌وکارهایی مناسب است که به RTO سریع نیاز ندارند.

تکثیر داده نسبتاً هم‌زمان

در این روش مزایای دو روش پیشین با هم ترکیب می‌شوند. این گونه انتقال داده‌ها با حداقل تأخیر انجام می‌شود. همچنین بین ثبات و عملکرد تعادل برقرار می‌گردد. همین ویژگی این شیوه را به انتخابی مناسب برای بسیاری از سازمان‌ها تبدیل می‌کند.

انواع Data Replication بر اساس تکنیک کپی‌کردن داده‌ها

تکثیر داده‌ها را بر اساس تکنیک و شیوه کپی‌کردن هم می‌توان دسته‌بندی کرد. در این بخش انواع Data Replication بر اساس تکنیک کپی‌کردن داده‌ها را توضیح می‌دهیم. 

تکثیر کامل

در این روش، از تمامی داده‌ها در چندین مکان کپی ساخته می‌شود. این شیوه برای سازمان‌ها و گروه‌هایی کاربردی است که داده‌های بسیار مهم و حیاتی دارند و بازیابی اطلاعات در مواقع بحرانی برای آنها ضروری است. از مزایای این روش می‌توان به موارد زیر اشاره کرد:

  • تکثیر تمامی داده‌ها و تضمین این که همه سیستم‌ها داده‌های یکسانی دارند
  • بالا رفتن امنیت داده‌ها به دلیل کپی‌گرفتن از آنها در چندین سیستم و وجود چندین منبع برای بازیابی آنها

معایب تکثیر کامل عبارت است از:

  • نیاز به فضای ذخیره‌سازی بسیار زیاد و پهنای باند شبکه قابل توجه
  • پیچیدگی مدیریت این روش به ویژه در بخش‌هایی که داده‌های بسیار زیادی دارند

تکثیر داده افزایشی

در این روش تنها داده‌هایی کپی می‌شوند که از آخرین مرحله کپی، تغییر پیدا کرده‌اند یا آپدیت شده‌اند. در واقع، با استفاده از این روش کپی‌کردن داده‌ها با سرعت بیشتری انجام می‌گردد؛ زیرا تنها داده‌های تغییریافته منتقل می‌شوند. این گونه بار کاری روی سیستم‌ها و شبکه‌ها کاهش می‌یابد. از مزایای این روش می‌توان به موارد زیر اشاره کرد:

  • صرفه‌جویی در فضای ذخیره‌سازی و پهنای باند
  • سرعت بخشیدن به فرایند تکثیر

معایب این روش عبارت‌اند از:

  • نیاز به نظارت بسیار دقیق
  • امکان بروز ناهماهنگی در صورت عدم بررسی دقیق داده‌های تغییر یافته

تکثیر مبتنی بر گزارش (لاگ)

این روش در پایگاه‌های داده‌ای استفاده می‌شود که تغییرات ایجاد شده به صورت فایل لاگ ثبت می‌شوند و سپس در سیستم‌های دیگر کپی می‌شوند. این تکنیک تضمین می‌کند که شما تمام تراکنش‌ها را به ترتیب وقوع تکثیر می‌کنید. مزایای تکثیر مبتنی بر گزارش (لاگ) عبارت است از:

  • دقت بالا و ثبت تمام تغییرات
  • کمترین میزان تأثیر بر عملکرد سیستم

معایب این روش عبارت‌اند از:

  • پیاده‌سازی پیچیده و نیاز به تخصص بالا
  • بروز تأخیرات جزئی در تکثیر

تکثیر اسنپ‌شات

تکثیر اسنپ‌شات به معنی ایجاد یک کپی از داده‌ها در یک زمان خاص است. پس از تکثیر می‌توان از آن اسنپ‌شات در مکان‌های دیگر استفاده کرد. در واقع، می‌توان از این روش برای ثبت دوره‌ای داده‌ها استفاده کرد و در سازمان‌هایی که سیستم‌های گزارش‌دهی این چنینی دارند، کاربرد دارد. مزایای این روش عبارت است از:

  • سادگی فرایند اجرا
  • ثبت دوره‌ای داده‌ها

معایب این روش عبارت است از:

  • اسنپ‌شات باید به طور مکرر گرفته شود. در غیر این صورت داده‌ها قدیمی می‌شوند.
  • ثبت محدود تغییرات بلادرنگ و کاربردی نبودن برای محیط‌های پویا

در همین باره، مقاله لاگ چیست و اسنپ شات چیست، را به شما پیشنهاد می‌دهیم.

تکثیر تراکنشی

تکثیر تراکنشی در محیط‌هایی مانند خدمات مالی یا پلتفرم‌های تجارت الکترونیک استفاده می‌شود که هر تراکنش باید به محض وقوع کپی شود. این روش تضمین می‌کند که همه تغییرات بلافاصله در سیستم‌های لازم کپی می‌شوند. از مزایای تکثیر تراکنشی می‌توان به موارد زیر اشاره کرد:

  • به‌روزرسانی‌های بلادرنگ
  • دقت بالا و ثبت به ترتیب داده‌ها

معایب این روش عبارت است از:

  • مصرف بالای منابع
  • پیکربندی و تنظیمات پیچیده
  • نیاز به مدیریت مداوم

تکثیر همتابه‌همتا

Peer-to-Peer Replication در سیستم‌هایی استفاده می‌شود که در آنها هر گره به عنوان منبع و هدف تکثیر عمل می‌کند. این تکنیک مناسب محیط‌هایی است که نیاز به تعادل و افزونگی دارند. به عنوان مثال، سازمان‌هایی که دارای استقرار ابری در مقیاس بزرگ هستند، می‌توانند از این روش استفاده کنند. از مزایای این روش می‌توان به موارد زیر اشاره کرد:

  • کاهش بار کاری هر سیستم با توزیع تکثیر در چندین گره
  • تکثیر داده‌ها در چندین مکان و ارتقای امنیت

معایب این روش عبارت‌اند از:

  • پیچیدگی مدیریت
  • نیاز به مکانیسم‌های قوی برای حل تعارضات  ایجاد تغییرات هم‌زمان در گره‌های مختلف

تکثیر داده به روش ادغامی 

در روش Merge Replication داده‌های دو یا چند پایگاه داده در یک پایگاه داده واحد ترکیب می‌شوند. این شیوه پیچیده‌ترین نوع تکثیر است. علت این امر هم آن است که هر دو طرف (سرور اصلی و سرورهای ثانویه) می‌توانند به طور مستقل در پایگاه داده تغییراتی ایجاد کنند. معمولاً از این روش در محیط‌های server-to-client استفاده می‌گردد. از مزایای این روش می‌توان به موارد زیر اشاره کرد:

  • امکان ایجاد تغییرات مستقل در منبع و کپی
  • امکان ایجاد تغییرات آفلاین و همگام‌سازی در زمانی دیگر

معایب این روش عبارت‌اند از:

  • پیچیدگی اجرا
  • نیاز به منابع زیاد

مزایای تکثیر داده

Data Replication چه مزیتی دارد؟

به طور کلی، Data Replication مزایایی را به همراه دارد. در این بخش به مهم‌ترین مزایای تکثیر داده اشاره می‌کنیم.

  • امکان ادامه دادن به فعالیت در صورت بروز فاجعه: از آنجایی که داده‌ها در مکانی دیگر ذخیره می‌شوند، شما می‌توانید در صورت بروز فاجعه و خرابی سرور یا مرکز داده به فعالیت خود ادامه دهید. 
  • بهبود عملکرد: تکثیر داده‌ها نه تنها دسترسی‌پذیری را افزایش می‌دهد، بلکه به بهبود عملکرد نیز کمک می‌کند. با توزیع داده‌ها در چندین مکان، کسب‌وکارها می‌توانند بار سیستم اصلی را کاهش دهند و این گونه از هر گونه تأخیر بکاهند.
  • تسهیل تعادل بار: Data replication با توزیع کارآمد درخواست‌های داده در چندین سرور backend به تعادل بار کمک می‌کند. انجام این کار تضمین می‌کند که از یک سرور واحد بیش از حد استفاده نشود و زمان پاسخگویی سریع در طول اوج استفاده حفظ شود.
  • امکان توزیع جغرافیایی داده‌ها: بسیاری از سازمان‌ها مشتریانی در سراسر جهان دارند. Data replication به سازمان‌ها اجازه می‌دهد تا داده‌ها را در مکان‌های مختلف در سراسر جهان ذخیره کنند، زمان بازیابی داده‌ها را کاهش دهند، عملکرد را افزایش دهند و یک تجربه کاربری مثبت را صرف‌نظر از محل زندگی مشتریان ایجاد کنند.
  • کمک به بازیابی پس از فاجعه: می‌توان گفت مهم‌ترین نقش Data replication بازیابی اطلاعات پس از بروز فاجعه است. اگر حملات سایبری رخ دهد یا حتی بلایای طبیعی به سیستم‌های ذخیره‌سازی آسیب برسانند، با کمک Data replication می‌توان زمان ازکارافتادگی را به حداقل رساند و ازسرگیری عملیات را در اسرع وقت اجرا کرد. این گونه هم اعتبار برند حفظ می‌شود و هم در خدمت‌رسانی به مشتریان اختلالی وارد نمی‌شود.
  • تسهیل فرایند تست: با داشتن داده‌ها در محیطی دیگر، می‌توان به راحتی کارهای تستی را اجرا کرد. این گونه، توسعه‌دهندگان می‌توانند بدون آسیب‌رساندن به داده‌های واقعی و در سیستم‌های لایو، تست‌های خود را اجرا کنند.

معایب تکثیر داده

معرفی معایب Data Replication

در کنار مزایا، محدودیت‌ها و نقاط ضعفی هم وجود دارد. در این بخش به محدودیت‌ها و ریسک‌های تکثیر داده اشاره می‌کنیم.

  • داده‌های متناقض: هر گونه تأخیر در تکثیر، مشکلات شبکه یا تداخل در به‌روزرسانی‌های هم‌زمان می‌تواند باعث ناهنجاری‌های مختلف در فرایند تکثیر داده شود. 
  • از دست دادن داده‌ها: در حالی که data replication اغلب برای پشتیبان‌گیری از داده‌ها و بازیابی فاجعه استفاده می‌شود، همه استراتژی‌های تکثیر، محافظت از داده‌ها را در زمان واقعی ارائه نمی‌دهند. در این حالت ممکن است در بازه زمانی ایجاد تغییرات در داده‌ها و تکثیر آنها فاجعه‌ای رخ بدهد و این تغییرات کپی نشوند. در این نتیجه، اطلاعات این بازه زمانی از دست برود.
  • کند شدن عملکرد شبکه: تکثیر داده از طریق شبکه به پهنای باند زیادی نیاز دارد. اگر پهنای باند محدود باشد، در عملکرد سیستم تأخیر ایجاد می‌شود و به‌روزرسانی‌ها به موقع انجام نخواهند شد.
  • مسائل مربوط به امنیت داده‌ها: سازمان‌ها باید بتوانند امنیت چند سیستم ذخیره‌سازی در مکان‌های مختلف را فراهم کنند. در غیر این صورت، امکان دزدی اطلاعات یا از دست رفتن آنها وجود دارد.

کاربردهای تکثیر داده‌ها در سیستم‌های مختلف

در این بخش کاربردهای Data Replication را در سیستم‌های مختلف بررسی می‌کنیم.

رپلیکیشن دیتاسنتر

تکثیر داده‌ها در مراکز داده یک استراتژی اساسی برای اطمینان از در دسترس بودن داده‌ها و تسهیل بازیابی پس از فاجعه است. با تکثیر داده‌ها در مراکز داده مختلف، شرکت‌ها می‌توانند از داده‌های خود در برابر قطعی‌های محلی، خرابی‌های سخت‌افزاری یا بلایای طبیعی محافظت کنند. در صورت بروز چنین حوادثی، عملیات می‌تواند به یک مرکز داده دیگر منتقل شود، سرویس‌دهی ادامه پیدا کند و از دست دادن داده‌ها به حداقل برسد.

تکثیر داده‌ها در رایانش ابری

تکثیر داده در رایانش ابری، یک تکنیک حیاتی برای افزایش دسترسی به داده‌ها و عملکرد سیستم است. وقتی از داده‌ها در چندین سرور یا منطقه ابری کپی گرفته می‌شود، دسترسی‌پذیری و دوام بالا تضمین می‌گردد. اگر یک سرور یا منطقه دچار خرابی شود، برنامه‌ها می‌توانند با دسترسی به داده‌ها از سرور یا منطقه دیگر به عملکرد خود ادامه دهند. همچنین از بروز تأخیر جلوگیری می‌شود، عملکرد سیستم بهبود می‌یابد و یک تجربه کاربری یکپارچه فراهم می‌شود.

بیشتر بخوانید: disaster recovery چیست؟

تکثیر داده‌ها در محاسبات موبایلی

Data Replication نقشی حیاتی در Mobile Computing ایفا می‌کند. دستگاه‌های تلفن همراه اغلب از اتصال متناوب شبکه رنج می‌برند. با ذخیره محلی داده‌های تکثیر شده در دستگاه، کاربران می‌توانند حتی در حالت آفلاین نیز به داده‌های حیاتی دسترسی داشته باشند. وقتی اتصال برقرار گردد، تغییرات ایجاد شده در دستگاه با سرور مرکزی همگام‌سازی می‌شود.

تکثیر SQL

تکثیر SQL روشی است که در آن داده‌ها از یک پایگاه داده SQL به پایگاه داده SQL دیگر کپی می‌شوند. از این روش در محیط‌های SQL Server برای اطمینان از در دسترس بودن همیشگی داده‌ها و عملکرد خوب سیستم‌ها استفاده می‌شود. حتی اگر سرور SQL اصلی از کار بیفتد، سیستم می‌تواند با استفاده از داده‌های سرور دیگر به کار خود ادامه دهد.

Replication در محصولات Dell EMC Data Domain

یکی از قابلیت‌های کلیدی در محصولات ذخیره‌سازی Dell EMC Data Domain، امکان Replication یا همان تکرار داده‌هاست. این ویژگی به سازمان‌ها اجازه می‌دهد تا داده‌های پشتیبان‌گیری‌شده را به‌صورت خودکار و ایمن بین چند سایت مختلف کپی کنند. Replication در این دستگاه‌ها به‌صورت deduplicated انجام می‌شود؛ یعنی فقط داده‌های جدید یا تغییریافته منتقل می‌شوند، که باعث کاهش قابل توجه پهنای باند مصرفی می‌شود.

مزایای استفاده از Replication در Dell EMC Data Domain عبارت‌اند از:

  • افزایش امنیت داده‌ها در برابر خرابی یا حوادث طبیعی

  • امکان بازیابی سریع‌تر در محل‌های مختلف

  • استفاده بهینه از منابع شبکه و فضای ذخیره‌سازی

  • سادگی در مدیریت و برنامه‌ریزی Replication

اگر به دنبال یک راهکار حرفه‌ای برای پشتیبان‌گیری امن و سریع با قابلیت Replication پیشرفته هستید، محصولات Dell EMC Data Domain می‌توانند انتخاب مناسبی باشند.

در مورد قابلیت data domain، بیشتر بخوانید.

سخن نهایی

در این مقاله به معرفی انواع روش‌های تکثیر داده یا Data Replication پرداختیم. استفاده از این روش‌ها را به تمامی سازمان‌ها و گروه‌هایی که داده‌های مهمی دارند، توصیه می‌کنیم. با Data Replication داده‌های خود را در چندین مکان تکثیر می‌کنید و در صورت بروز مشکل می‌توانید از کپی‌ها استفاده کنید و نگران پاک شدن یا از بین رفتن اطلاعات نباشید. تکثیر داده از هزینه‌های مالی، زمانی و... زیادی پیشگیری می‌کند. با استفاده از این راهکار، مشتریان و مخاطبین شما حتی در صورت بروز فاجعه هم می‌توانند خدمات دریافت کنند و چهره و نام برند حفظ شود.

سوالات متداول

Replication یا تکثیر داده فرایندی است که طی آن از اطلاعات در یک یا چند مکان دیگر، نسخه‌ کپی تهیه می‌شود تا دسترس‌پذیری و امنیت داده افزایش یابد.

Replication نسخه‌ای به‌روز و هم‌زمان از داده‌ها تهیه می‌کند، در حالی که Backup معمولاً در بازه‌های زمانی مشخص انجام می‌شود و برای نگهداری بلندمدت است.

شامل تکثیر هم‌زمان (synchronous)، غیرهم‌زمان (asynchronous) و نسبتاً هم‌زمان (near-synchronous) می‌شود.

داده‌ها در چند منطقه ابری کپی می‌شوند تا در صورت خرابی یک سرور، از سرور دیگر استفاده شود و خدمات قطع نشوند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


مقالات مرتبط

دیتا دامین چیست

دیتا دامین (Data domain) چیست؟ + معرفی قابلیت‌ها

در دنیای معاصر، کسب و کارها و سازمان‌ها بسیار بر داده ساختاریافته، دقیق و قابل‌کنترل متکی هستند. یکی از بنیادی‌ترین...

data deduplication چیست

آشنایی با تکنولوژی + Data Deduplication کاربردها

ذخیره‌سازی درست داده‌ها از مهم‌ترین دغدغه‌های کسب و کارها، سازمان‌ها و به طور کلی گروه‌هایی است که با حجم زیادی...

آموزش نصب و راه‌اندازی vSAN

آموزش نصب و راه‌اندازی vSAN

vSAN یک سیستم ذخیره‌سازی نرم‌افزارمحور است که به عنوان بخشی از پلتفرم مجازی‌سازی Vmware یا vSphere ارائه شده و امکان...