Machineleren, een proces dat wordt gebruikt om kunstmatig intelligente algoritmes te trainen, kan extreem veel tijd in beslag nemen. Een quantumtruc kan de boel enorm versnellen voor taken die gebruikmaken van fotonen.
Bij reinforcement learning, een vorm van machineleren, doorloopt een algoritme steeds opnieuw hetzelfde probleem en krijgt het alleen een ‘beloning’ als het het juiste antwoord bereikt. Daardoor leert het systeem hoe het sneller een antwoord kan vinden wanneer het later met soortgelijke problemen wordt geconfronteerd. Nu hebben natuurkundige Valeria Saggio van de Universiteit van Wenen in Oostenrijk en haar collega’s, waaronder een Leidse fysicus, een quantumwending aan dit proces toegevoegd om het te versnellen.
Superpositie van toestanden
Saggio en haar team zetten een experiment op waarbij een foton – een lichtdeeltje – in een van vier mogelijke toestanden terechtkomt. Vervolgens gaven de onderzoekers een AI de opdracht ervoor te zorgen dat het foton in een bepaalde toestand terechtkwam en beloonden ze het als dat inderdaad gebeurde.
In de klassieke versie van dit experiment, zonder toegevoegde quantumeffecten, kan de AI het foton maar naar één specifieke toestand tegelijk verplaatsen. Het systeem krijgt dan een beloning als het toevallig de juiste toestand kiest.
In de quantumversie van het experiment kan de AI het foton in een superpositie van meer dan één toestand brengen. Dit stelt het systeem in staat om het aantal mogelijkheden terug te brengen voordat het met een laatste, klassieke gok kiest voor een bepaalde doeltoestand.
Kiezende robot
‘Stel je voor dat je een robot hebt die op een kruispunt staat en die twee opties heeft: hij kan naar links of naar rechts’, zegt Saggio. ‘Als de robot naar rechts gaat, krijgt hij geen beloning, maar als hij naar links gaat wel. Bij de volgende ronde neemt de kans dan toe dat hij naar links gaat. ‘
Dat is de klassieke versie van het experiment. Bij de quantumversie zou de robot bij elk kruispunt tegelijkertijd naar links en rechts kunnen gaan, waardoor hij veel minder pogingen nodig heeft voordat hij leert altijd naar links te gaan. Deze strategie versnelde de leertijd van de AI met 63 procent, van 270 keer raden naar slechts 100 keer.