قد يرغب العلماء المراوغون الذين يحاولون نشر أبحاث رديئة الجودة في التفكير مرتين. يستخدم الناشرون الأكاديميون برمجيات الذكاء الاصطناعي بشكل متزايد لاكتشاف علامات التلاعب بالبيانات تلقائيًا.
يعد تكرار الصور التي يتم فيها نسخ الصورة نفسها لمجموعة من الخلايا أو قلبها أو تدويرها أو إزاحتها أو اقتصاصها أمرًا شائعًا للغاية للأسف. إذا لم يكن الخطأ عرضيًا ، يتم إنشاء صورة مزورة لجعلها تبدو كما لو كان لدى الباحث بيانات أكثر وأجرى تجارب أكثر مما فعلوه بالفعل.
قال دانييل إيفانكو ، مدير عمليات وأنظمة المجلات في الشركة ، إن تكرار الصور هو السبب الأول لسحب مقالات من قبل الجمعية الأمريكية لأبحاث السرطان (AACR) من 2016 إلى 2020. إن الاضطرار إلى سحب ورقة بحثية يضر بسمعة المؤلف والناشر. يشير هذا إلى أن جودة عمل الباحث كانت ضعيفة وأن عملية مراجعة الأقران للمحرر تغاضت عن الأخطاء.
لتجنب إحراج كلا الطرفين ، لجأ الناشرون الأكاديميون مثل AACR إلى برنامج الذكاء الاصطناعي للكشف عن تكرار الصور قبل نشر المقالات في المجلات. بدأت AACR تجربة Proofig ، وهو برنامج لفحص الصور طورته شركة ناشئة مقرها إسرائيل تحمل نفس اسم المنتج. في المؤتمر الدولي حول مراجعة الأقران ومؤتمر المنشورات العلمية في شيكاغو الأسبوع الماضي ، قدم إيفانكو نتائج دراسة تجريبية توضح كيف أثر Proofig على عمليات AACR.
تنشر AACR 10 مجلات بحثية وتراجع أكثر من 13000 مشاركة كل عام. من يناير 2021 إلى مايو 2022 ، استخدمت الوكالة Proofig لفحص 1،367 مخطوطة تمت الموافقة عليها مؤقتًا للنشر ، 208 بعد التحقق من تكرار الصور التي تم وضع علامة عليها بواسطة البرنامج. اتصلت بمؤلف التكرارات هي في الغالب أخطاء قذرة يسهل إصلاحها. ربما يكون العلماء قد خلطوا النتائج عن طريق الخطأ ، وغالبًا ما تؤدي إعادة تقديم بيانات جديدة إلى حل المشكلة.
ومع ذلك ، في حالات نادرة ، يمكن أن تكون الصور الخطيرة التي يبرزها البرنامج علامة على نشاط احتيالي. من بين 208 أوراق ، تم سحب 4 ورفض واحدة لاحقًا. الاحتيال الأكاديمي نادر الحدوث وغالبًا ما يرتبط بمصانع الورق أو المؤسسات ذات السمعة السيئة. ومع ذلك ، لا تزال حالات الغش موجودة في أفضل المختبرات في الجامعات المرموقة. وجدت دراسة حديثة كشفت عنها مجلة Science أن عقودًا من أبحاث مرض الزهايمر أدت إلى عمليات بحث غير مثمرة عن علاجات جديدة وتجارب إكلينيكية فاشلة ، لكن الاستشهادات كانت تعاني من صور مكررة ، وقد ورد أنها تستند إلى عدد من الأوراق البحثية.
كانت النتيجة المعنية عبارة عن سلسلة من الخطوط الباهتة التي تم إنشاؤها باستخدام تقنية تُعرف باسم النشاف الغربي ، ويُزعم نسخها وتحريرها ولصقها في بيانات الماوس. من الصعب جدًا اكتشاف التأثيرات المكررة بالعين غير المدربة. إن البحث عن تغييرات طفيفة مثل هذه مهمة شاقة لمعظم البشر ، لكنها رائعة لأجهزة الكمبيوتر ، كما يقول Dror Kolodkin-Gal ، المؤسس المشارك لـ Proofig. تسجيل.
تتمثل مهمة Proofig في العثور أولاً على جميع الصور ذات الصلة بالتحليل في المقالة التي تم تحميلها. يتجاهل البرنامج صور المخططات الشريطية أو المخططات الخطية. يحتاج Proofig إلى التحقق مما إذا كانت صورة معينة تتطابق مع جميع الصور الفرعية الأخرى في الورقة. يمكن إزاحة الصور الفرعية أو قلبها أو تدويرها. يمكن قص الأجزاء ونسخها وتكرارها. “هناك الكثير من الاحتمالات ،” قال Kolodkin-Gal.
يستخدم Proofig مزيجًا من رؤية الكمبيوتر وخوارزميات الذكاء الاصطناعي لاستخراج الصور وتصنيفها. قال Kolodkin-Gal إن البرنامج معقد حسابيًا ولم يكن ليكون ممكنًا بدون التطورات الحديثة في التعلم الآلي. وأضاف: “قبل الذكاء الاصطناعي ، كان استخراج الصور الفرعية من الورقة يتطلب استثمارًا عشرة أضعاف في البحث والتطوير. الله يعرف فقط كيفية الحساب. الخوارزميات والقدرة على تشغيل وحدات معالجة الرسومات في السحابة ، ما تغير هو التحسن في التكنولوجيا في كليهما” ، أضاف. .
الإنسان في الحلقة المطلوبة
لا تستطيع برامج الذكاء الاصطناعي مثل Proofig التقاط المحتالين بمفردها. قالت إليزابيث بيك ، خبيرة التصوير الجنائي والمستشارة العلمية المستقلة: “يتطلب الأمر أشخاصًا لديهم قدر معين من المعرفة والخبرة لتفسير النتائج”. تسجيل. “لا يمكنك ترك البرنامج يعمل تلقائيًا فقط. يمكنه تحديد الكثير من الأشياء الجيدة تمامًا.” في بعض الحالات ، تكون العين البشرية أفضل من الكمبيوتر.
يستخدم بيك برنامجًا آخر قائمًا على الذكاء الاصطناعي يسمى ImageTwin لعمله. أجد صعوبة في بعض الأحيان مع تحليل لطخة ويسترن. “اللطخات الغربية هي في الأساس مجرد خطوط سوداء على خلفية صلبة. هناك تفاصيل دقيقة في الشكل الذي أراه كإنسان ، لكن البرامج بطريقة ما لا تستطيع رؤيتها. أعتقد أن الأمر يتعلق بكيفية تعقيد الدماغ للغاية. لا يرى البرنامج سوى المسافات النسبية ، لذلك تبدو الخطوط السوداء دائمًا مثل الخطوط السوداء ، فأنا لست جيدًا في العثور على أشكال الكتلة.
وافق Kolodkin-Gal على أنه من الصعب بشكل خاص فحص اللطخات الغربية بالآلة. قال: “لقد تطلب الأمر الكثير من الاستثمار لإيجاد خوارزمية جيدة أخيرًا للعثور على النطاقات الغربية. كان من الصعب جدًا على الذكاء الاصطناعي لأنها صغيرة جدًا”. حقل الأرز.
يستخدم الناشرون الأكاديميون أدوات فحص الصور مثل Proofig في مراحل مختلفة من عملية النشر. تقوم AACR بمسح المخطوطات التي تمت الموافقة عليها مؤقتًا ، وتستخدمها مؤسسات أخرى مثل Taylor & Francis فقط للتحقق من الأوراق التي أثار المحررون والمراجعون مخاوف بشأنها. “إذا اكتشف البرنامج تكرارًا محتملاً للصور أو التلاعب بها وكان مدعومًا من قبل فريق الخبراء لدينا ، فإن إجراءاتنا المعمول بها وتلك التي حددتها لجنة أخلاقيات النشر لمثل هذه الحالات ، فإننا نبدأ تحقيقًا وفقًا للإرشادات التي وضعتها الشركة ،” قال متحدث باسم الشركة. قال لنا.
متى وأين تستخدم هذه الأدوات في خط أنابيب النشر الخاص بك هو مسألة تكلفة. تعتبر معالجة الصور عملية حسابية مكثفة ، وتتطلب من الناشرين تحمل تكاليف الحوسبة السحابية للشركات الناشئة مثل Proofig. تعتبر مراجعة جميع الأوراق في مرحلة التقديم مكلفة للغاية. على سبيل المثال ، تحليل 120 صورة فرعية باستخدام Proofig يكلف الفرد 99 دولارًا. ليست رخيصة ، بالنظر إلى عدد جميع المجموعات الممكنة التي يجب على Proofig التعامل معها في ورقة واحدة. تتفاوض منظمات مثل AACR و Taylor & Francis على حزم محددة بأسعار منخفضة مصممة خصيصًا لعملياتها الفردية.
قالت هيلين كينج ، رئيس قسم التحول وابتكار المنتجات في SAGE Publishing: ، أخبرنا. “حتى الآن ، أشارت حوالي ثلث الأوراق البحثية التي نجريها من خلال البرنامج إلى المشكلات ، وهناك حاجة إلى مزيد من الخبرة في الموضوع لفهم النتائج وتفسيرها.”
لا يمكن للذكاء الاصطناعي حتى الآن اكتشاف الصور المسروقة عبر أوراق مختلفة
اعتمدت الجمعية الأمريكية للبحوث السريرية أيضًا Proofig ، وقام ناشرون آخرون مثل Frontiers ببناء أدواتهم الخاصة. يستخدم Wiley أيضًا نوعًا من البرامج ، كما أن PLOS و Elsevier و Nature إما منفتحون على البرنامج أو يختبرونه بنشاط ، حسبما ذكرت مجلة Nature أولاً.
تتحسن برامج الذكاء الاصطناعي في اكتشاف البيانات المشبوهة ، لكنها لا تعرف كل الطرق المختلفة التي يغش بها العلماء. يمكن لـ Proofig معرفة ما إذا كانت الصورة تبدو مكررة داخل نفس الورقة ، ولكن لا يمكنها حتى الآن العثور على نسخ عبر أوراق مختلفة. لم نكتشف حتى الآن الحالات التي قد تكون فيها الصور مسروقة عبر أوراق مختلفة. تحتاج الشركة إلى بناء قاعدة بيانات من مخابئ الصور المقطوعة من الأوراق المنشورة للمقارنة.
قال كورودكينجال: “التحدي الرئيسي الذي يواجه المجتمع اليوم هو البيانات الضخمة”. “إذا لم يبدأ الناشرون العمل معًا لإنشاء قواعد بيانات للصور التي بها مشكلات ، [image plagiarism] لا تزال المشكلة. يتطلب تطوير الذكاء الاصطناعي بيانات ضخمة. “
ومع ذلك ، فإن برامج مثل Proofig هي نقطة انطلاق جيدة للقضاء على الاحتيال وتحسين النزاهة العلمية. يقول بيك: “أعتقد أن البدء في استخدام البرامج يعد تطورًا جيدًا للناشرين لأنه يوفر القليل من مراقبة الجودة لعملية النشر”. “إنها تعمل كرادع. أخبر المؤلفين أنك تنوي فحص ورقتك بحثًا عن هذه الأنواع من التكرار. لا أعتقد أنها ستمنع الغش ، لكنها تجعل الغش أصعب قليلاً.” ®