Een zoekrobot die onderzoeksgegevens uit de medische vakliteratuur catalogiseert, blijkt tevens een nuttig wapen tegen fraude. Het eerste slachtoffer hangt al aan de schandpaal, meldt de nieuwsredactie van Nature.

Betrokkene heet Alfredo Fusco, een veelgeciteerd onderzoeker op het gebied van kankergenetica aan de universiteit van Napels. Zowel de universiteit als de politie hebben hem op de korrel. Een publicatie van zijn hand in Cell Death and Disease wordt deze week teruggetrokken omdat foto’s van ‘gelletjes’ blijken te zijn gemanipuleerd. Een tweede paper in het Journal of Clinical Investigation is vorige maand al ingetrokken door de redactie, en volgens bronnen die bekend zijn met het politie-onderzoek zijn er nog zo’n 60 van zijn publicaties verdacht.

De robot is het werk van een mede-Italiaan genaamd Enrico Bucci. Via zijn bio-informaticabedrijfje BioDigitalValley biedt hij een datamining-tool genaamd ProteinQuest aan. Hiermee kun je naar vermeldingen van specifieke eiwitten zoeken in miljoenen biomedische publicaties, die sinds 2000 online zijn gezet. Tot de informatiebronnen, die daarbij worden doorzocht, behoren de talloze foto’s van gelelektroforese-experimenten waarmee eiwitten op massa worden gescheiden.

Bucci en collega’s bedachten dat ze de kwaliteit van hun database konden verbeteren door publicaties, die niet helemaal koosjer leken, er zo veel mogelijk uit te knikkeren. Het idee was om eerst alles te schrappen wat ooit officieel was teruggetrokken, en een lijst op te stellen van de auteurs van die door de mand gevallen artikelen. Vervolgens wilden ze alle wetenschappers natrekken die meer dan driemaal co-auteurs van de mensen op die lijst waren geweest.

Omdat dat meer dan een miljoen namen opleverde, beperkten ze zich vooralsnog tot hun eigen landgenoten.

De volgende stap ging ook nog automatisch. Bucci c.s. knutselden beeldherkenningssoftware in elkaar die een simpele checks deed op de gelletjes die de na te trekken wetenschappers in hun publicaties hadpaar den opgenomen. Er werd bijvoorbeeld gekeken of details zó sterk met elkaar overeenkwamen dat de suggestie van copy-and-paste werd gewekt.

Omdat de alarmbellen opnieuw érg vaak bleken te rinkelen, besloten de onderzoekers zich in eerste instantie te beperken tot prominente namen met meer dan één verdachte gel op hun naam. Fusco kwam bovenaan dat lijstje terecht, met acht publicaties waar mogelijk iets mee mis was.

Dat was reden voor nader onderzoek van alle 300 publicaties waarvan Fusco eerste of laatste auteur was. Dit keer niet geautomatiseerd maar met het blote oog, op zoek naar sporen van illegaal Photoshopgebruik. In 53 artikelen werden foto’s van gelletjes aangetroffen waarmee wel eens iets mis kon zijn.

Vervolgens kwam Bucci er achter dat er in heel Italië geen enkele academische organisatie is die zich actief bezighoudt met de bestrijding van wetenschapsfraude. In arren moede stapte hij toen begin 2012 maar naar de politie, die inderdaad een onderzoek tegen Fusco startte: gelletjes vervalsen is misschien niet strafbaar, maar vervolgsubsidie opstrijken op grond van vervalste publicaties is dat wél.

Pas in oktober dit jaar kwam de universiteit er achter, en startte prompt ook een intern onderzoek.

Bucci verklapt dat hij nog tientallen andere landgenoten op de korrel heeft die door de zoekrobot zijn aangewezen als verdacht. Hij schat dat van de gelletjes, die hij op deze manier onder ogen krijgt, ongeveer tien procent overduidelijk is gemanipuleerd.

“Het voordeel van mijn methode is dat hij snel aangeeft in welke auteurs je de meeste tijd moet steken”, legt hij uit.

bron: news@nature

Onderwerpen