دریافت ، ذخیره سازی و تحلیل کلان داده ها

پایگاه داده آپاچی کاساندرا انتخاب درستی است اگر شما نیاز دارید به مقیاس پذیری و در دسترس بودن بالا بدون افت کارایی. در این راه کار مقیاس پذیری خطی و تحمل خطا بر روی سخت افزار و زیرساخت هایی با پلت فرم کاملا معمولی بدست می آید. پشتیبانی داده در کاساندرا با تکرار داده در سراسر مراکز داده های متعدد با بهترین کلاس جهانی صورت می گیرد. ارائه زمان تاخیر پایینی برای کاربران و عدم نگرانی از قطع منطقه ای از دیگر مشخصات این راه کار است. هر گره در خوشه های کاسندرا یکسان است.

آپاچی اسپارک  یک موتور سریع و عمومی برای پردازش داده های بزرگ است. اسپارک با ماژولهای از قبل ساخته شده برای پردازش جریان، SQL، یادگیری ماشین و گراف مهیا است.

این دو مولفه با هم طوری پیکره بندی می شود که هر “کارگر اسپارک” به گره کاساندرا خود اتصال داده شود. بنابراین همه جستجوهای داده بصورت “خوشه آگاه” و به طور کاملا توزیع شده انجام می گردد، بدون هر گونه انتقال داده ها اضافی بین گره ها

bigdata-1