جدول المحتويات

ما هي بحيرة البيانات يستخدم هذا المصطلح بشكل شائع من قبل الأشخاص الذين يدرسون علوم البيانات والتحليلات وهذا المصطلح مهم جدًا للأشخاص الذين يعملون في إدارة البيانات. الصفحه الشعاعيه سنقدم لك كل ما يتعلق بمصطلح بحيرة البيانات والاختلاف في مستودعات البيانات ، بالإضافة إلى مكونات ومزايا بحيرات البيانات.

ما هي بحيرة البيانات

بحيرة البيانات هي مستودع تخزين مركزي يحتوي على كميات هائلة من البيانات من العديد من المصادر بتنسيق خام وحبيبي. يقوم بتخزين البيانات المهيكلة (البيانات المهيكلة) والبيانات شبه المنظمة (غير المهيكلة). تقوم Data Data Lake بربطها بالمعرفات وعلامات البيانات الوصفية لاسترجاع أسرع.

تم صياغة مصطلح “بحيرة البيانات” بواسطة مدير التجارة التقني في Pentaho James Dixon حيث يشير المصطلح إلى الطبيعة المخصصة للبيانات في تلك البحيرة. على عكس البيانات النظيفة والمعالجة المخزنة في أنظمة مستودعات البيانات التقليدية ، يتم تكوين بحيرات البيانات على نطاق من أجهزة سلعة منخفضة التكلفة وقابلة للتطوير من أجل قابلية التوسع ، يسمح هذا التكوين بإلقاء البيانات في البحيرة في حالة الحاجة إليها لاحقًا دون القلق بشأن سعة التخزين ، يمكن أن تكون المجموعات محلية أو موجودة في السحابة.[1]

انظر ايضا: من هو مؤسس المخيم

ما هو مستودع البيانات

مستودع البيانات عبارة عن مجموعة كبيرة من بيانات الأعمال المستخدمة لمساعدة المؤسسة في اتخاذ القرارات. كان مفهوم مستودع البيانات موجودًا منذ الثمانينيات من القرن الماضي ، لأنه يهدف إلى نقل البيانات من العمليات التشغيلية إلى أنظمة دعم القرار التي تكشف عن ذكاء الأعمال: تأتي الكمية الكبيرة من البيانات من البيانات الموجودة في مستودعات البيانات من كيانات مختلفة مثل من بين تطبيقات داخلية أخرى في التسويق والمبيعات والتمويل والتطبيقات التي تواجه العملاء وأنظمة الشركاء الخارجيين.

على المستوى التقني ، يقوم مخزن البيانات باسترداد البيانات بانتظام من هذه التطبيقات والأنظمة. ثم تمر البيانات عبر عمليات التنسيق والاستيراد لمطابقة البيانات الموجودة بالفعل في المستودع. يقوم مستودع البيانات بعد ذلك بتخزين البيانات المعالجة ليتمكن صانعو القرار من الوصول إليها. يختلف تكرار استرجاع البيانات أو كيفية تنسيق البيانات بناءً على احتياجات المنظمة.[2]

الفرق بين بحيرة البيانات ومستودع البيانات

تتطلب المنظمة النموذجية الاستفادة من كل من مستودع البيانات وبحيرة البيانات لتلبية الاحتياجات المختلفة وحالات الاستخدام ، ويختلف كل مصطلح من هذه المصطلحات على النحو التالي:[3]

وجه الاختلاف بحيرة البيانات مستودع البيانات
بيانات البيانات التي تحتوي عليها أكثر ثراءً لأنها غير علائقية وعلائقية في نفس الوقت ، أي علائقية من أجهزة إنترنت الأشياء ومواقع الويب وتطبيقات الهاتف المحمول والوسائط الاجتماعية وتطبيقات المؤسسات تكون البيانات علائقية فقط عندما تأتي من أنظمة المعاملات وقواعد البيانات التشغيلية وتطبيقات الأعمال
رسم بياني الرسم البياني مكتوب في وقت التحليل (مخطط على القراءة). تم تصميم المخطط قبل تنفيذ DW (رسم تخطيطي للكتابة)
قيمة المال نتائج الاستعلام يزداد استهلاك التخزين منخفض التكلفة بشكل أسرع يمكنك الحصول على نتائج استعلام أسرع باستخدام تكاليف تخزين أعلى
جودة واحدة بيانات البيانات أولية وقد يتم تنسيقها أو لا البيانات منظمة للغاية وتعمل كنسخة مركزية للحقيقة
المستعمل مستخدمو Data Lake هم علماء البيانات والمطورون ومحللو الأعمال (الذين يستخدمون بيانات غنية). محللو الأعمال فقط الذين يستخدمون مستودع البيانات
التحليلات تشمل التحليلات التعلم الآلي والتحليلات التنبؤية واكتشاف البيانات والتنميط يأتي التحليل في شكل تقارير مجمعة وذكاء الأعمال والتصورات

مكونات بحيرة البيانات

إن مفتاح قدرة الشركات هو الاستفادة الكاملة من بحيرة البيانات واعتمادها على مدى جودة معالجتها وتفسيرها للكم الهائل من المعلومات ، لا سيما سرعة نقل البيانات إلى بحيرات البيانات واستخراج الأفكار منها. للقيام بذلك ، يجب تنفيذ بنية بحيرة البيانات المقابلة ، لأنها تتكون من خمسة مكونات رئيسية. هذه هي:[4]

  • تسجيل البيانات: هذا الإجراء مطلوب من خلال تطبيق نظام قائم على الإدراك والوعي للحصول على فهم قابل للتوسع بدرجة عالية يستخرج البيانات من مصادر مختلفة ، وعادة ما يتم استخلاصها من مواقع الويب والتطبيقات المثبتة على أجهزة محمولة أخرى ، بالإضافة إلى وسائل التواصل الاجتماعي والأساليب الأخرى التي يجب أن تدعم الجميع أنواع البيانات مع مصادر البيانات الحديثة.
  • تخزين: يجب أن يتضمن ذلك نظام تخزين متقدمًا يتميز بقدرة عالية على تخزين ومعالجة البيانات الخام ، وفك تشفيرها ونسخها احتياطيًا ، مع القدرة على ضغط البيانات دون المساس بالأمان وتخزينها بشكل مناسب.
  • أمن البيانات: الشرط الأساسي هو أن يتم تأمين بحيرة البيانات بشكل فعال من خلال المصادقة متعددة العوامل وإجراءات التفويض والوصول الآمن وحماية البيانات.
  • تحليل البيانات: بعد تسجيل البيانات ، يجب أن تخضع لعملية تحليل عالية الكفاءة ، والتي ، بالإضافة إلى نقل البيانات التي تم فحصها مسبقًا إلى مستودع البيانات ، تستخدم أدوات التحليل والتعلم الآلي لاكتساب رؤى قيمة.
  • إدارة البيانات: ويشمل ذلك تبسيط عملية استيعاب البيانات وإعدادها وفهرستها ودمجها ، بالإضافة إلى تسريع الاختبار لإنتاج بيانات عالية الجودة على المستوى الفردي والتنظيمي ، كما يجب إجراء التغييرات على عناصرها وتتبعها والتحضير للاختبار.

انظر ايضا: ما هي خطة التعافي من الكوارث؟

فوائد بحيرة البيانات

كقاعدة عامة ، يتعين على الشركات اتخاذ قرارات بناءً على البيانات المتاحة باستمرار. نحن بحاجة ماسة إلى بيانات المجموعة بأكملها للخروج بشكل شامل لاتخاذ القرارات الصحيحة في العمل. يعتمد اتخاذ القرار هذا على معرفتنا السابقة بأهمية بحيرة البيانات وفوائدها ، والتي نخبرك بها على النحو التالي:[5]

  • سعة التخزين: لأنه يتميز بقدرته على تخزين كميات ضخمة دون إتلافها أو إتلافها.
  • سهولة الاستخدام: إذا كانت لديك بيانات في البحر ، فيمكنك استخدامها بشكل أسرع من خلال إبقائها في حالتها الأولية.
  • اكتساب رؤى: من خلال التحليل على نطاق واسع واستخدام أحدث الأساليب ، يمكنك اكتساب رؤى جديدة وغير متوقعة.
  • امكانية التوسع: اين هو إنه أكثر قابلية للتطوير وأقل تكلفة من مستودع البيانات عندما نفكر فيه.

بهذا القدر من المعلومات وصلنا إلى نهاية مقالنا الذي كان بعنوان ما هي بحيرة البيانات أثناء التعرف أيضًا على مستودع البيانات والاختلافات بينهما ، لم نذكر فقط بالتفصيل مكوناته ومزاياها لتسلية أذهان قرائنا الكرام بكل ما يتعلق بهذا الموضوع.

المراجع

  1. talent.com ، ما هي بحيرة البيانات؟ ، 08/21/2021
  2. talent.com ، ما هو مستودع البيانات ولماذا هو مهم لعملك؟ ، 08/21/2021
  3. dataversity.net ، ما هي بحيرة البيانات؟ ، 08/21/2021
  4. qlik.com ، بحيرات البيانات: ما هي وكيفية استخدامها ، 08/21/2021
  5. qlik.com ، بحيرة البيانات مقابل مخزن البيانات ما هي المزايا والاختلافات الرئيسية؟ ، 08/21/2021