Tag dingen met Depictor
Ik hou me veel bezig met de Wikimedia-projecten, zoals Wikipedia, Wikidata en Wikimedia Commons. Commons is de mediabank van de Wikimedia-projecten: op het moment van schrijven staan daar meer dan 76 miljoen foto’s, video’s en andere mediabestanden op. Al die bestanden kun je gratis en voor niks gebruiken omdat ze onder een vrije licentie vallen. Je hoeft je dus niet druk te maken over, zomaar een hypothetisch scenario, een groot persbureau dat dreigbrieven stuurt met boetes van €450 vanwege een onbedoelde auteursrechtenschending.
Het was wel lastig om op Commons goede metadata toe te voegen aan de bestanden. Tot vrij recent ging dat nogal rudimentair: met veel tekst en eindeloos veel categorieën. Je hebt bijvoorbeeld categorieën als “emmers met levende krabben” en “badkuipen gebruikt als voederbakken voor dieren”. Het zou veel handiger zijn als je zelf zo’n selectie kan samenstellen: “geef me alle afbeeldingen met levende krabben in een emmer”. En dat je dan makkelijk “krabben” kunt vervangen met “schildpadden”. Of “emmer” met “terrarium”. Maar je kunt moeilijk voor elke mogelijke diersoort een categorie “emmers met levende <x>” maken.
Gestructureerde metadata
De oplossing is gestructureerde metadata, en die kun je sinds een paar jaar toevoegen op Commons dankzij Structured Data on Commons (filmpje). Je kan nu plaatjes koppelen aan items op Wikidata. Deze items beschrijven van alles: van diersoorten tot schilderijen en van personen tot sterrenstelsels. En eigenschappen van die items, zoals de Latijnse naam van een diersoort of de geboorteplaats van een architect.
Op Wikidata staan al bijna honderd miljoen van dit soort items. Je kunt het dus gebruiken als een soort gigantische thesaurus. En omdat items op Wikidata weer veel metadata hebben kun je ook hele specifieke afbeeldingen opsporen, bijvoorbeeld ‘alle afbeeldingen van mensen die zijn geboren in Tilburg, architect zijn én getrouwd zijn met iemand van adel maar zelf niet van adel zijn’. Waarom je dat soort bizar specifieke dingen zou willen opzoeken zou ik niet zo snel weten. Maar ik ben zo iemand die van alleen al het idee dat het mogelijk is enthousiast wordt.
Er is één probleem: die 76 miljoen mediabestanden op Commons moeten nog wel de juiste metadata krijgen. Op het meest basale niveau is dat ‘dit plaatje toont dat’. Een zogenaamd depicts–statement. De afbeeldingen staan vaak in een categorie, en die zijn wél vaak gekoppeld aan Wikidata-items.
Je zou dus kunnen zeggen: er is een categorie ‘Vincent van Gogh’, die is gekoppeld aan het Wikidata-item over de persoon Van Gogh, dus alle plaatjes in die categorie tonen Vincent van Gogh.
Alleen is dat te kort door de bocht. Afbeeldingen in zo’n categorie kunnen van alles zijn. “De aardappeleters” is bijvoorbeeld wel een schilderij van Van Gogh maar toont niet de persoon Van Gogh. Een zelfportret is van Van Gogh, maar toont hem ook. Een grafsteen of een handtekening toont Van Gogh dan weer niet. De enige manier om er zeker van te zijn dat zo’n depicts–statement klopt is dus toch door al die afbeeldingen handmatig door te nemen. 76 miljoen keer.
Tooltje
Dat kan een stuk sneller, dankzij een handig nieuw tooltje dat ik heb gebouwd met de weinig tot de verbeelding sprekende naam Depictor. Je kunt het tooltje alleen gebruiken als je een account hebt op één van de Wikimedia-sites (dus bijvoorbeeld op Wikipedia). Je logt in, drukt op ‘start’ en je krijgt een persoon toegewezen uit een willekeurig geboortejaar. Vervolgens krijg je de simpele vraag: zie je die persoon op de weergegeven foto? Elke keer als je op ‘Ja’ klikt voeg je op de achtergrond een depicts-statement toe aan Wikimedia Commons.
Iets meer dan twee weken geleden heb ik het tooltje online gezet. Tot nu toe hebben zo’n 150 mensen meer dan 40.000 statements toegevoegd. Ik hou een scorebord bij, en iemand uit Polen heeft al meer dan 6.000 keer een foto beoordeeld. Zelf heb ik er slechts een paar honderd. Het verbaast me altijd weer hoe ontzettend fanatiek mensen kunnen zijn als je ze de juiste tools geeft.
Overigens kan Depictor ook gebruikt worden voor meer dan alleen mensen uit willekeurige geboortejaren. Willekeurige Commons-categorieën werken ook (mits gekoppeld aan een Wikidata-item), net zoals SPARQL-queries (dat iets te ingewikkeld is om hier snel uit te leggen maar lees vooral dit artikel). Ik werk nu aan een mogelijkheid om challenges toe te voegen. Zodat bijvoorbeeld erfgoedinstellingen de tool kunnen gebruiken om kleine competities te organiseren: wie kan de meeste afbeeldingen depicten?
Enthousiast geworden? Wilt u zelf aan de slag? Log in met uw Wikimedia-account en ga lekker depicten!
PS: De Tilburger George van Heukelom, architect van De Inktpot in Utrecht, was getrouwd met jonkvrouw Henriëtte van den Brandeler. Leuk dat je het vraagt!
Erik
Wat een super tooltje!
Nu is het heel duidelijk bedoeld binnen1 ecosysteem. Maar lijkt me ook geweldig als ik op mijn WP site een afbeelding kan uploaden en er een tooltje als deze zou opkomen. Die mij dan helpt het van de juiste metadata te voorzien en het automatisch verrijkt met wikidata.
Valentijn
Leuk bezig Hay!
Bertus van Heusden
Hallo Hay,
Ik heb je tooltje gebruikt (user:Bertux) en het werkt goed, bedankt. Twee vragen:
1) Kun je de bedieningsknoppen een vaste plek op de pagina geven? Dan kun je lekker doorwerken. Nu verschuiven de knoppen steeds omhoog en omlaag met het formaat van de foto, wat ik erg vermoeiend vind.
2) Is het bedoeld om vast te stellen: er staat iemand op de foto en die lijkt er wel een beetje op dus die zal het wel zijn. Of is het de bedoeling dat je gaat googelen om te kijken of het echt wel diegene is?
Ik heb tot nu toe drie mensen geclassificeerd, maar ben zo slecht in het herkennen van gezichten, dat ik ze allemaal gegoogeld heb, zodat ik een kleine minuut per foto nodig heb. Als ik me op het standpunt stel ‘er staat zo iemand op de foto, het is geen grafsteen of zo’ dan kan het een factor dertig sneller. Zie eventueel https://commons.wikimedia.org/w/index.php?target=Bertux&namespace=all&tagfilter=&start=2021-10-28&end=2021-10-28&limit=100&title=Special%3AContributions
Reactie kan hieronder of op mijn OP (nl of Commons) of per mail / Wikimail
Bertus van Heusden
Oh, en ook nog: linkjes naar Google Afbeeldingen en naar https://yandex.com/images/ zouden de zaak ook vergemakkelijken. Dat moedigt meteen aan om bij twijfel even te checken!