أطلقت مكتبة التعلم الآلي للرسم البياني مفتوحة المصدر StellarGraph اليوم سلسلة من الخوارزميات الجديدة لتحليل الرسم البياني للشبكة للمساعدة في اكتشاف الأنماط في البيانات ، والعمل مع مجموعات بيانات أكبر وتسريع الأداء مع تقليل استخدام الذاكرة.
StellarGraph هو جزء من وكالة العلوم الوطنية الأسترالية ، CSIRO ، من خلال ذراع علم البيانات ، Data61.
مشاكل مثل الاحتيال والجرائم السيبرانية معقدة للغاية وتتضمن بيانات متصلة بكثافة من مصادر عديدة.
أحد التحديات التي يواجهها العلماء عند التعامل مع البيانات المتصلة هو كيفية فهم العلاقات بين الكيانات ، لتوفير فهم أعمق للمشكلة.
قال Tim Pitman ، رئيس فريق StellarGraph Library ، إن حل التحديات الكبيرة يتطلب سياقا أوسع مما تسمح به غالبا الخوارزميات البسيطة.
“إن التقاط البيانات كرسم بياني للشبكة يمكن المؤسسات من فهم السياق الكامل للمشكلات التي تحاول حلها – سواء كان ذلك من خلال تطبيق القانون أو فهم الأمراض الوراثية أو اكتشاف الاحتيال.”
تقدم مكتبة StellarGraph خوارزميات متطورة وتزود علماء البيانات والمهندسين بأدوات لبناء واختبار وتجربة نماذج التعلم الآلي القوية على بيانات الشبكة الخاصة بهم ، مما يتيح لهم رؤية الأنماط والمساعدة في تطبيق بحثهم لحل مشاكل العالم الحقيقي عبر الصناعات.
“لقد طورنا مكتبة تعلم آلية قوية وبديهية لعلماء البيانات — مكتبة تجعل من الممكن الوصول إلى أحدث الأبحاث لحل المشكلات التي تستند إلى البيانات عبر العديد من قطاعات الصناعة.”
يوفر الإصدار 1.0 من الفريق في Data61 الخاص بـ CSIRO ثلاث خوارزميات جديدة في المكتبة ، مما يدعم تصنيف الرسوم البيانية والبيانات المكانية والزمانية ، بالإضافة إلى هيكل بيانات الرسم البياني الجديد الذي ينتج عنه استخدام أقل للذاكرة بشكل ملحوظ وأداء أفضل.
يعد اكتشاف الأنماط والمعرفة من البيانات المكانية والزمانية أهمية متزايدة وله آثار بعيدة المدى على العديد من الظواهر الواقعية مثل التنبؤ بالمرور ، ونوعية الهواء ، وربما حتى حركة وتتبع الأمراض المعدية – وهي مشكلات مناسبة لأطر التعلم العميقة التي يمكن أن يتعلم من البيانات التي تم جمعها عبر المكان والزمان.
يضمن اختبار خوارزميات تصنيف الرسوم البيانية الجديدة تجربة تدريب الشبكات العصبية على الرسم البياني للتنبؤ بالخصائص الكيميائية للجزيئات ، والتقدم الذي يمكن أن يبشر بالخير في تمكين علماء البيانات والباحثين من تحديد الجزيئات المضادة للفيروسات لمكافحة العدوى ، مثل COVID-19.
إن القدرة الواسعة والأداء المعزز للمكتبة هي تتويجا لثلاث سنوات من العمل لتقديم خوارزميات رائدة يمكن الوصول إليها.
قال السيد Pitman ، “إن الخوارزميات الجديدة في هذا الإصدار تفتح المكتبة لفئات جديدة من المشاكل لحلها “.
“;لقد جعلنا أيضًا المكتبة أسهل في الاستخدام وعملنا على تحسين الأداء للسماح لمستخدمينا بالعمل مع بيانات أكبر.”
تم استخدام StellarGraph للتنبؤ بنجاح بجينات مرض الزهايمر ، وتقديم تحليلات متقدمة للموارد البشرية ، واكتشاف برنامج Bitcoin Ransomware ، وكجزء من دراسة Data61 ، يتم استخدام التكنولوجيا حاليا للتنبؤ بصفات تجمعات القمح استنادا إلى علامات الجينوم التي يمكن أن تؤدي إلى تحسين الجينوم استراتيجيات الاختيار لزيادة محصول الحبوب.
يمكن تطبيق هذه التكنولوجيا على مجموعات بيانات الشبكة الموجودة في المجالات الصناعية والحكومية والبحثية ، وقد بدأ الاستكشاف في تطبيق StellarGraph على الاحتيال المعقد والصور الطبية ومجموعات بيانات النقل.
قال أليكس كولينز ، رئيس التحليلات الاستقصائية للمجموعة ، Data61 من CSIRO ، “إن التحدي الذي يواجه المؤسسات هو الحصول على أقصى قيمة من بياناتها. يمكن أن يؤدي استخدام تحليلات الرسم البياني للشبكة إلى فتح طرق جديدة لإبلاغ القرارات عالية المخاطر وعالية التأثير.”
StellarGraph هي مكتبة Python بنيت في TensorFlow2 و Keras ، وهي متاحة مجانا لمجتمع المصادر المفتوحة على GitHub في Stellargraph.