أرشيف MongoDB أطلس على الإنترنت هي ميزة جديدة لـ منصة البيانات السحابية MongoDB . يسمح لك بتعيين قاعدة لأرشفة البيانات تلقائيًا من مجموعة أطلس الخاصة بك إلى تخزين كائن سحابي مُدار بالكامل. في منشور المدونة هذا ، سأوضح كيف يمكنك استخدام الأرشيف عبر الإنترنت لترتيب بياناتك من أجل إستراتيجية إدارة بيانات فعالة من حيث التكلفة.
برنامج استرداد بريد aol
توفر منصة بيانات MongoDB Cloud أيضًا خدمة بدون خادم وقابلة للتطوير بحيرة بيانات أطلس الذي يسمح لك بالاستعلام عن بياناتك محليًا عبر تخزين الكائنات السحابية ومجموعات MongoDB Atlas في مكانها.
في منشور المدونة هذا ، سأستخدم أحد ملفات برنامج MongoDB Open Data COVID-19 مجموعات السلاسل الزمنية لتوضيح كيف يمكنك الجمع بين الأرشيف عبر الإنترنت وبحيرة بيانات أطلس لتوفير تكاليف التخزين مع الاحتفاظ بالوصول السهل للاستعلام عن جميع بياناتك.
المتطلبات الأساسية
في هذا البرنامج التعليمي ، سوف تحتاج إلى:
- إلى MongoDB أطلس مجموعة M10 أو أعلى حيث لا يتوفر الأرشيف عبر الإنترنت حاليًا للطبقات المشتركة ،
- بوصلة MongoDB أو مونجو شل للوصول إلى مجموعتك.
هيا نحصل على بعض البيانات
بادئ ذي بدء ، دعنا نسترجع مجموعة السلاسل الزمنية. في هذا البرنامج التعليمي ، سأستخدم إحدى مجموعات السلاسل الزمنية التي أنشأتها لـ مشروع MongoDB Open Data COVID19 .
ال covid19.global_and_us
التجميع هو أكثر سلاسل مرات COVID-19 اكتمالا في مجموعة البيانات المفتوحة الخاصة بنا لأنه يجمع جميع البيانات التي JHU يبقى في فصل ملفات CSV .
بما أنني أرغب في استرداد المجموعة بأكملها وفهارسها ، سأستخدم mongodump
.
mongodump --uri='mongodb+srv://readonly:[email protected]/covid19' --collection='global_and_us'
رمز النسخ
سيؤدي هذا إلى إنشاء dump
مجلد في دليلك الحالي. دعنا الآن نستورد هذه المجموعة في مجموعتنا.
mongorestore --uri='mongodb+srv://:رمز النسخ
الآن بعد أن أصبحت مجموعة السلاسل الزمنية لدينا هنا ، دعنا نرى كيف يبدو المستند:
مصفوفة جافا سكريبت لسلسلة بدون فاصلة
{ '_id': { '$oid': '5f077868c3bda701aca1a3a7' }, 'uid': 175, 'country_iso2': 'YT', 'country_iso3': 'MYT', 'country_code': 175, 'state': 'Mayotte', 'country': 'France', 'combined_name': 'Mayotte, France', 'population': 272813, 'loc': { 'type': 'Point', 'coordinates': [ 45.1662, -12.8275 ] }, 'date': { '$date': '2020-06-03T00:00:00.000Z' }, 'confirmed': 1993, 'deaths': 24, 'recovered': 1523 }
رمز النسخ
لاحظ هنا أن ملف تاريخ المجال هو IsoDate بتدوين JSON المخفف الممتد .
مجموعة السلاسل الزمنية هذه بسيطة إلى حد ما. لكل يوم وكل مكان ، لدينا قياس لعدد confirmed
، deaths
و recovered
إذا كانت متوفرة. مزيد من التفاصيل في وثائقنا .
رسم بياني شريطي صريح
ما هي المشكلة؟
المشكلة هي أنها سلسلة زمنية! لذلك نضيف كل يوم إدخالًا جديدًا لكل مكان في العالم وستصبح مجموعتنا أكبر وأكبر كل يوم. ولكن مع مرور الوقت ، من المحتمل أن تكون البيانات القديمة أقل أهمية ويتم الوصول إليها بشكل متكرر حتى نتمكن من الاستفادة من أرشفتها خارج مجموعة أطلس الخاصة بنا.
اليوم ، 10 يوليو 2020 ، تحتوي هذه المجموعة على 599760 مستندًا تتوافق مع 3528 مكانًا ، والوقت 170 يومًا ويبلغ حجمها 181.5 ميغابايت فقط بفضل خوارزمية ضغط WiredTiger .
على الرغم من أن هذا لن يمثل مشكلة في هذا المثال التافه ، إلا أنه سيجبرك بالتأكيد على ترقية مجموعة MongoDB Atlas إلى مستوى أعلى إذا كان هناك غيغابايت إضافية من البيانات تنتقل إلى مجموعتك كل يوم.
قد تكلف الترقية إلى مستوى أعلى المزيد من المال وربما لا تحتاج إلى الاحتفاظ بكل هذه البيانات الباردة في مجموعتك.
أرشيف على الإنترنت لإنقاذ!
يعد أرشفة مجموعة فرعية من مجموعة البيانات هذه يدويًا أمرًا شاقًا. أنا في الواقع كتب منشور مدونة حول هذا الموضوع .
إنه يعمل ، لكنك ستحتاج إلى استخراج المستندات وإزالتها من مجموعة MongoDB Atlas بنفسك ثم استخدام الإصدار الجديد عامل خارج دولار أو ال وظيفة s3.PutObject MongoDB Realm لكتابة مستنداتك إلى S3.
مكان تخزين icx
من حسن حظك ، أن موقع MongoDB Atlas Online Archive يقوم بذلك تلقائيًا نيابةً عنك!
دعنا نتوجه إلى MongoDB Atlas وننقر على مجموعتنا للوصول إلى تفاصيل المجموعة الخاصة بنا. حاليًا ، لم يتم إعداد الأرشيف عبر الإنترنت في هذه المجموعة.
# مونغودب
developer.mongodb.com
تعرف على كيفية استخدام MongoDB Atlas Data Lake والأرشيف عبر الإنترنت.
رتب بياناتك تلقائيًا عبر مجموعات أطلس وتخزين كائنات السحابة مع الاحتفاظ بحق الوصول للاستعلام عن كل ذلك باستخدام Atlas Data Lake.
أنظر أيضا: