النطاق
٨٠,٠٠٠ صورة، وأكثر من ٥٠٠,٠٠٠ جسم (مضلعات)، وتعليقات توضيحية لصور القمر الصناعي Sentinel 2.
التحدي
تأتي السحب في مجموعة كبيرة ومتنوعة من الأشكال، ويعد التقاط هذه الأشكال وعكسها في ظروف الطقس والإضاءة المختلفة أمرًا صعبًا للغاية، بالإضافة إلى تحديد السحب الرقيقة والتمييز بين السحب والأجسام الساطعة الأخرى.
المشروع
تحسين طرق تحديد السحب لفتح إمكانات نطاق غير محدود من حالات استخدام صور الأقمار الصناعية، مما يتيح إجراء بحث يعتمد على الصور بشكل أسرع وأكثر كفاءة ودقة.
الحل
تم تطبيق مستويين لفحص الجودة لضمان الاتساق عبر مجموعة البيانات الكبيرة التي تمت معالجتها بواسطة العديد من المفسرين. أدى استخدام تطبيق "تقدّم" للهاتف المحمول على جهاز لوحي باستخدام قلم إلى تبسيط عملية الرسم والسماح بالتعليق التوضيحي بشكل أسرع.

تم استخدام مجموعة البيانات المصنفة في مسابقة أجرتها مايكروسوفت الذكاء الاصطناعي للأرض ورادينت إيرث للحصول على أفضل حالة استخدام.

نظرة عامة على المشكلة

تعد صور الأقمار الصناعية أمرًا بالغ الأهمية لمجموعة واسعة من التطبيقات بدءًا من إدارة الكوارث والتعافي منها إلى الزراعة وحتى الاستخبارات العسكرية. وتتمثل العقبة الرئيسية أمام جميع حالات الاستخدام هذه في وجود السحب التي تغطي أكثر من ٦٦% من سطح الأرض (Xie et al, 2020). تسبب السحب تشويشًا وعدم دقة في النماذج المبنية على الصور، وعادةً ما يتعين تحديدها وإزالتها. يمكن أن يؤدي تحسين طرق تحديد السحب إلى إطلاق العنان لإمكانات نطاق غير محدود من حالات استخدام صور الأقمار الصناعية، مما يتيح إجراء أبحاث أسرع وأكثر كفاءة ودقة تعتمد على الصور.

استخدم مشروع التصنيف بيانات من مهمة Sentinal-2، التي تلتقط صورًا واسعة النطاق وعالية الدقة ومتعددة الأطياف تستخدم لمراقبة ظروف سطح الأرض وطريقة تغيرها. بالنسبة لكل مربع، يتم فصل البيانات إلى نطاقات مختلفة من الضوء عبر الطيف المرئي الكامل، والأشعة تحت الحمراء القريبة، والأشعة تحت الحمراء. تم استخدام صور Sentinel-2 مؤخرًا في التطبيقات الهامة مثل:
• تتبع بركان ثائر في جزيرة لا بالما الإسبانية، حيث أظهرت صور الأقمار الصناعية مسار الحمم البركانية المتدفقة عبر الأرض وساعدت في إخلاء البلدات المعرضة للخطر.
• رسم خرائط إزالة الغابات في غابات الأمازون الاستوائية وتحديد التدخلات الفعالة.
• مراقبة حرائق الغابات في كاليفورنيا للتعرف على مصادرها وتتبع ملوثات الهواء.

تتمثل أكبر التحديات في الكشف عن السحب هي تحديد السحب الرقيقة والتمييز بين السحب الساطعة والأجسام الساطعة الأخرى (Kristollari & Karathanassi, 2020). الأساليب الثلاثة الأكثر شيوعًا المستخدمة هي أساليب العتبة والنماذج المصنوعة يدويًا والتعلم العميق

المشروع

لقد كان توفر البيانات المصنفة عائقًا كبيرًا أمام جهود الكشف عن السحابة. غالبًا ما يتم استخدام النماذج الحالية كبديل للحقيقة الأساسية، مما يحد بشكل كبير من الأداء (Zupanc, 2017).

تم إنشاء التسميات الخاصة بمجموعة البيانات هذه باستخدام التعليق التوضيحي البشري للنطاقات الضوئية لصور Sentinel-2. كخطوة أولى، في عام 2021، أجرت مؤسسة رادينت إيرث مسابقة تسمية بيانات التعهيد الجماعي التي تحدد السحب في صور الأقمار الصناعية، برعاية مؤسسة كوكب، مايكوسوفت الذكاء الاصطناعي للأرض وأزافيا. والنتيجة هي مجموعة متنوعة من مشاهد Sentinel-2 المُصنفة على أنها وحدات بكسل غائمة. ولتبسيط مهمة التعهيد الجماعي، تم تنفيذ تصنيف عام "للسحابة"/"بدون سحابة" بدلاً من تصنيف السحب حسب النوع.

وعلى الرغم من أن مجموعة البيانات الناتجة عن التعهيد الجماعي واسعة النطاق، إلا أنها كانت تتمتع بدرجات متفاوتة من جودة التصنيف. كخطوة ثانية، وبدعم من مايكروسوفت الذكاء الاصطناعي للأرض، عملت مؤسسة رادينت إيرث مع معلقين خبراء في هايفو بواسطة بوت للتحقق من صحة هذه التسميات ومراجعتها، حسب الحاجة، على تطبيق الهاتف المحمول "تقدّم"، المصمم لحالات استخدام التعليقات التوضيحية الجغرافية المكانية.

الحصيلة

مجموعة البيانات النهائية عبارة عن مجموعة عالية الجودة من الملصقات السحابية التي تم التحقق منها بواسطة الإنسان والتي تغطي الصور وظروف السحابة عبر ثلاث قارات (إفريقيا وأمريكا الجنوبية وأستراليا). تحتوي مجموعة البيانات على ترخيص مفتوح (CC BY 4.0) وستكون متاحة للجمهور بعد انتهاء المسابقة. تم استخدام مجموعة البيانات المصنفة في مسابقة أجرتها مايكوسوفت الذكاء الاصطناعي للأرض ورادينت إيرث للحصول على أفضل حالة استخدام.

https://www.drivendata.org/competitions/83/cloud-cover/page/398