Zelflerende computer voorspelt bewegingen in foto's

Onderzoekers van de technische universiteit MIT hebben een zelflerend systeem ontwikkeld dat bewegingen van objecten in foto's kan voorspellen. Daardoor is het in theorie mogelijk om een foto om te toveren tot een korte video.

Om het neurale netwerk op te zetten, hebben onderzoekers ruim twee miljoen video's gedownload van Flickr. Die werden ingedeeld in vier omgevingen die op de beelden te zien zijn: golfbanen, stranden, treinstations en ziekenhuizen. De beelden zijn daarna gestabiliseerd.

Het systeem heeft de video's geanalyseerd, waarna de onderzoekers foto's aan de database toevoegden. De computer voorspelde de bewegingen op basis van wat er in eerdere video's te zien was.

De video's die met het systeem worden gemaakt zijn enkele seconden lang, in een klein formaat en in de meeste gevallen onscherp. De techniek kan in de toekomst bijdragen aan voorspellingstechnieken voor computers.

Beelden

De computer voorspelde bijvoorbeeld dat treinen op foto's van een station door het beeld zouden rijden. Ook wist het systeem te voorspellen dat iemand over een golfbaan wandelt en een hond door het water zwemt.

Voor sommige video's wist het systeem niet precies welke objecten er zouden bewegen. Ook ziet het weglopen van mensen er niet realistisch uit. Volgens de onderzoekers ziet het er allemaal misschien niet gelikt uit, maar de voorspelde bewegingen zijn in de meeste gevallen wel correct.

Lees meer over:
Tip de redactie