حذف Tapeها از ساختار Backupها
همزمان، سود و زیان شرکت ها، بیش از هر زمان دیگری مستقیما به در دسترس بودن همیشگی اطلاعات وابسته شده است. در نتیجه، غلبه بر چالشهای همیشگی فرآیندهای Backup و بازیابی آنها تشدید شده و نیاز به ثبات قابل اطمینانی در آن احساس میشود.
از زمانی که TAPE ها به دلیل کم هزینه بودنشان به نسبت DISK ها حاکم همیشگی دنیای محافظت از دادهها بوده اند، زمان زیادی میگذرد.اما تکنیک هوشمند Deduplication در Disk، گوی رقابت را از این رسانههای خسته کننده و غیرقابل اطمینان ربود. با بحث هزینه کمتر و سرویس سریعتر مسلما مشتریان به بررسی گزینههایی بهتر از TAPEها خواهند پرداخت.
متاسفانه این تفکر که Diskهای بیشتر باعث بالا بردن سطح عملکرد این عملیات است، سازمانهایی که درصدد کاهش هزینههای خود بودند را به روش قدیمی وفادار نگهداشت تا از خرید Diskهای بیشتر به دلیل هزینه بالا جلوگیری نمایند. در صورتی که پیادهسازی اشتباه تکنیک Deduplication توسط برخی برندها در راهکارهایشان، عامل اصلی این موضوع بود.
شرکت Dell EMC این تکنیک را در دستگاههای خود بر محوریت پردازشگرهایش ارائه داد تا حذف دادههای تکراری به هیچ وجه وابسته به Disk ها نباشد و سرعت بسیار بالاتری در این روند ایجاد شود.
در ادامه مقالات معرفی تجهیزات Data Domainها، اینبار به بررسی دقیقتر تکنولوژی هوشمند سیستم عامل آنها در انتخاب و ذخیرهسازی دادههای ارسالی خواهیم پرداخت.
الگو Stream Informed Segment Layout در این راهکار تعبیه شده تا با استفاده از ویژگیهای پیشرو پردازشگرهای تجهیزات Data Domain سبب کاهش پهنای باند مصرفی در ذخیره سازی اطلاعات و بالا بردن سرعت انتقال Backup شود. SISL تا ۹۹% دادههای تکراری را زمانی که در RAM وارد میشوند، قبل از ذخیره شدن در Disk ها تشخیص میدهد.
هسته اصلی Deduplication بر پایه این قالب بنا شده است. به عبارتی، Data Domain به درخواست ذخیره سازی دادهها بلافاصله پاسخ نمیدهد بلکه از قبل با ذخیره سازی موقت دادههای دریافتی، آنها را دسته بندی مینماید. درنتیجه قبل از ذخیره سازی دائم بر دیسکهای گران قیمت، خواندن و نوشتن بر روی گروه دادههای مشابه را انجام میدهد تا سرعت عملیات را بالا ببرد.
چه اتفاقی در این فرآیند برای دادهها میافتد؟
۱- داده وارد RAM دستگاههای Data Domain میشود.
۲- توسط این تکنیک به چندین قسمت ( ۴ تا ۱۲ کیلوبایت ) تقسیم میشود.
۳- برای هر تکه، فضایی موقت در RAM اختصاص میدهد.
۴- فراخوانی برای دیسکها ارسال میکند تا هویت جدید و یا قدیمی بودن اطلاعات را برایش مشخص نماید تا از یکپارچه سازی دادهها بر روی Disk ها که یکی از عوامل کند شدن سرعت Backup در روشهای قدیمی است، دور بماند.
۵- جدیدترینها را بعد از فشرده سازی در گروههایی به Disk ها برای ذخیره سازی تحویل میدهد.
این روش در سیستم عامل Data Domain ها با حذف تکیه به قدرت دیسکها برای پردازش اطلاعات Deduplication، برای همیشه این گلوگاه دردسرساز را حذف کرد تا پردازشگرها با سرعت بسیار بالاتر این ماموریت را انجام دهند.
در طول ۲۰ سال گذشته، عملکرد پردازشگرها مافوق تصورعموم جهش یافته در حالی که دیسکها تا ۱۰ برابر یا کمی بیشتر تغییر داشتهاند. اینکه هر کدام از پردازشگرهای دو هستهای Data Domainها سرعت این فرآیند را با امنیت کامل تا ۵۰ درصد بالا بردهاند، بسیار لذت بخش است، زیرا نوید روزی است که از صندوق های انباشته از Tape هایتان رها خواهید شد.