لفترة طويلة ، استوحى العلماء والمهندسون من القدرات المذهلة للحيوانات وسعوا إلى الهندسة العكسية أو إعادة إنتاجها في الروبوتات وعوامل الذكاء الاصطناعي (AI). أحد هذه السلوكيات هو تتبع أعمدة الرائحة ، وهو قدرة بعض الحيوانات ، وخاصة الحشرات ، على العودة إلى مصدر روائح معينة (مثل الطعام أو الأصدقاء) ، غالبًا عبر مسافات طويلة.
نموذج تعلم معزز عميق يسمح لوكلاء الذكاء الاصطناعي بتتبع أعمدة الروائح
دراسة جديدة أجراها باحثون في جامعة واشنطن وجامعة نيفادا ، اتخذت رينو نهجًا مبتكرًا باستخدام الشبكات العصبية الاصطناعية (ANNs) في فهم هذه القدرة الرائعة للحشرات الطائرة. عملهم ، الذي نُشر مؤخرًا في Nature Machine Intelligence ، يجسد كيف يقود الذكاء الاصطناعي رؤى علمية جديدة ورائدة.
سينغ ، المؤلف الرئيسي للدراسة ، لـ Tech Xplore ، "لقد كان الدافع لدينا لدراسة سلوك بيولوجي معقد ، تتبع أعمدة الرائحة ، الذي تستخدمه الحشرات الطائرة (والحيوانات الأخرى) للعثور على الطعام أو رفاقها". "لقد درس علماء الأحياء بشكل تجريبي العديد من جوانب تتبع أعمدة الحشرات بتفصيل كبير ، حيث إنه سلوك حاسم لبقاء الحشرات وتكاثرها."
في حين أن تتبع العمود هو قدرة بيولوجية مهمة ، فهو أيضًا مثال رائع للذكاء البيولوجي ، لأنه يستلزم تكامل الذكريات حول الروائح الحالية والتي تم اختبارها سابقًا ، بالإضافة إلى معالجة الإشارات الشمية المتقطعة أو غير الموثوقة وإشارات الرياح الحسية للسماح الحشرات لتكييف مسارات رحلاتها بسرعة.
وأضاف سينغ: "إنهم يفعلون ذلك دون أن يكون لديهم خريطة عالمية للبيئة التي يحلقون فيها".
إذا تم استنساخه بشكل موثوق به في الروبوتات أو العوامل الاصطناعية ، فقد يسمح تتبع أعمدة الروائح للباحثين بصنع روبوتات أفضل يمكنها اكتشاف وتتبع تسرب الغازات الضارة وحرائق الغابات والتهديدات البيئية الأخرى.
أوضح سينغ: "بدلاً من إجراء تجربة مختبر تقليدي لنفق الرياح ، استخدمنا نهجًا تكميليًا" داخل السيليكون "باستخدام الشبكات العصبية الاصطناعية". "لقد ساعدنا هذا في تطوير فهم تكاملي لتتبع العمود عبر مستويات متعددة ، بما في ذلك السلوك الناشئ ، والتمثيل العصبي والديناميات العصبية."
بدأ العديد من علماء الأعصاب في استخدام الشبكات العصبية الاصطناعية (ANNs) المدربة على البيانات المصنفة لدراسة العمليات البيولوجية وتكرارها بشكل مصطنع. في دراستهم ، استخدم سينغ وزملاؤه بدلاً من ذلك التعلم المعزز العميق (DRL) ، وهي مجموعة أدوات خوارزمية بدأت للتو في اكتساب قوة دفع في علم الأعصاب ، والتي تستخدم المحاكاة بدلاً من البيانات المصنفة لتدريب الشبكات العصبية الاصطناعية.
قال سينغ : "تتضمن بعض التطبيقات الحديثة الناجحة للغاية لـ DRL خارج علم الأعصاب Go play AI الشهير لـ DeepMind ، أو بعض نماذج لغة GPT الحديثة لـ OpenAI ". "كما هو الحال في تدريب الحيوانات ، تستخدم DRL" المكافآت "و" العقوبات "المحاكاة لتدريب وكلاء ANN الذين يمكنهم إكمال المهام بشكل مستقل."
لتدريب عوامل تتبع الأعمدة الخاصة بهم باستخدام DRL ، قام الباحثون أولاً بمحاكاة رائحة تنبعث من مصدر يقع داخل ساحة عاصفة تبلغ مساحتها الإجمالية حوالي 120 مترًا مربعًا . عندما حدد وكلاؤهم مكان مصدر الرائحة ، حصلوا على مكافأة. في المقابل ، إذا فقدوا أثر عمود الرائحة وغادروا الساحة ، "يُعاقبون".
قال سينغ: "بعد التدريب ، استفدنا من مرونة جهاز المحاكاة الخاص بنا لتوليد أعمدة مع مجموعة متنوعة من تركيزات الرائحة وأنماط الرياح ، لنرى كيف يتصرف العامل بدقة في ظل ظروف مختلفة". "إن إعادة إنتاج مثل هذا التحكم الدقيق في تكوينات العمود في نفق رياح حقيقي سيكون جهدًا شاقًا إلى حد ما."
كان سينغ وزملاؤه قادرين أيضًا على مراقبة نشاط الوحدات الفردية لشبكتهم العصبية الاصطناعية (أي الخلايا العصبية الاصطناعية) أثناء تتبع أعمدة الروائح. لم يتم بعد جمع مثل هذه التسجيلات العصبية الفردية أثناء التتبع في الحشرات أثناء الطيران الحر ، حيث يتعذر الوصول إليها باستخدام التقنيات الحالية.
قال سينغ: "إن السلوك الذي يظهر في عناصرنا الاصطناعية المدربة يحمل تشابهًا مذهلاً مع وحدات السلوك التي لاحظها علماء الأحياء سابقًا في الحشرات الطائرة التي تقوم بتتبع الأعمدة".
تشير التسجيلات التي جمعها الباحثون إلى أن نموذجهم قد يكرر العمليات البيولوجية التي تدعم تتبع أعمدة الروائح في الحيوانات. بعد ذلك ، قام سينج وزملاؤه بمحاكاة تكوينات العمود التي يمكن إعادة إنشائها في تجارب العالم الحقيقي لنفق الرياح في المستقبل.
سمحت لهم هذه المحاكاة بتكوين فرضيات مختلفة عن كيفية تصرف العوامل الاصطناعية عند تتبع الأعمدة في ظروف الرياح المتغيرة. لقد نظروا على وجه التحديد في الحالات التي يتغير فيها اتجاه الريح بشكل متكرر.
أوضح سينغ: "باستخدام الملاحظات السلوكية والعصبية المتزامنة من وكلاء ANN لدينا ، طورنا حدسًا ورؤية ثاقبة للخوارزميات والحسابات العصبية التي تدعم تتبع العمود". "على سبيل المثال ، نرى أن النشاط العصبي يشفر متغيرات مثل الوقت منذ آخر مواجهة للرائحة ، والتي كان يُفترض سابقًا أنها مهمة لتتبع عمود الدوران. تشير أوجه التشابه بين النتائج التجريبية والحسابية السابقة إلى الأهمية الأساسية من هذه الكميات من أجل التتبع الناجح للعمود ".
بالإضافة إلى تمكين التطورات التكنولوجية الرئيسية ، يمكن إجراء هندسة عكسية لوكلاء ANN لفهم كيفية عملهم بشكل أفضل ، مما قد يُفيد أبحاث علم الأعصاب. وبالتالي ، من المحتمل أيضًا أن يستخدم علماء الأعصاب النموذج الذي ابتكره سينغ وزملاؤه لدراسة العمليات البيولوجية وراء تتبع أعمدة الروائح.
في المستقبل ، يأمل الباحثون أن يلهم نموذجهم في إنشاء عوامل آلية يمكنها تتبع الروائح أثناء مهام البحث والإنقاذ وجهود المراقبة البيئية والتطبيقات الأخرى. في دراساتهم التالية ، يخططون لتطوير نموذجهم بشكل أكبر ، من خلال تحسين الدقة الفيزيائية والبيولوجية لمحاكاة وعواملهم بحيث يمثلون بشكل أفضل أعمدة الروائح في العالم الحقيقي. بالإضافة إلى ذلك ، يأملون في إعادة إنتاج الخصائص الفسيولوجية الأخرى وقدرات الحشرات الطائرة بشكل مصطنع.
وأضاف سينغ: "ستكون هناك حاجة أيضًا إلى مزيد من العمل النظري لفهم شبكاتنا العصبية الاصطناعية ، لفهم العمليات الحسابية التي تنتج السلوك الناشئ". "أخيرًا ، يؤدي وكلاؤنا مهمة واحدة ، وهي تتبع الريشة ، بينما تمتلك الحشرات الطائرة ذخيرة سلوكية أكثر ثراءً. تطوير نماذج المحاكاة وتدريب العملاء التي يمكن أن تعيد إنتاج مثل هذا التعقيد البيولوجي الغني يعد تحديًا هندسيًا هائلاً يجب أن يلهم العمل في المستقبل."
.jpg)