We kunnen tegenwoordig heel veel met Artificiële Intelligentie, maar toch zijn we nog ver verwijderd van een toekomst waarin deze technologie de menselijke intelligentie overbodig maakt. Lange tijd werd Deep Learning gezien als de meest beloftevolle methode om dat uitgangspunt te bereiken, maar tegenwoordig wordt ‘Reinforcement Learning’ steeds meer genoemd in discussies over de toekomst van AI. Of wordt het een combinatie van de twee: Deep Reinforcement Learning?
Narrow AI
Artificiële intelligentie is de voorbije jaren een ware hype geworden, maar het is zeker geen nieuw concept. In 1960 was er in een artikel in The New York Times al sprake van AI. Toen werd reeds geloofd dat een artificieel intelligent systeem geen verre toekomst meer was. Zestig jaar later mogen we zeker niet blind zijn voor alles wat we intussen verwezenlijkt hebben, maar we moeten ook nog altijd heel veel leren voor we een mechanisme zullen ontwikkelen dat zonder menselijke intelligentie kan functioneren.
We zitten vandaag in een fase die we ‘Narrow AI’ noemen, omdat de mogelijkheden nog relatief beperkt zijn. Modellen zijn wel in staat om een specifieke of een enkele taak uit te voeren, maar ook niet meer dan dat. Voor iedere toepassing hebben we immers een ander algoritme nodig. Daarmee kunnen we natuurlijk al heel wat realiseren, gaande van industriële toepassingen tot systemen die we in ons dagelijkse leven gebruiken. Denk maar aan de slimme spraakassistent Siri.
Maar de krachtige AI waar we van dromen, hebben we dus nog niet bereikt. Zo’n systeem zou immers de grootste menselijke eigenschap moeten kunnen imiteren: ons bewustzijn.
Deep Learning met uitsterven bedreigd?
De basis van AI is het idee dat een systeem zichzelf traint en slimmer wordt. Dit noemen we Machine Learning. Eén van de meest complexe vormen vandaag is Deep Learning en onderzoekers geloofden ook lange tijd dat dit de beste manier van werken was. Intussen groeit daar meer en meer twijfel over en moeten we ons zelfs afvragen of Deep Learning over pakweg tien jaar nog zal bestaan. Maar alvorens we het over de struikelblokken kunnen hebben, moeten we nog even overlopen wat Deep Learning precies inhoudt.
Deep Learning is gebaseerd op de manier waarop ons eigen menselijke brein functioneert. Dat bestaat uit biljoenen neuronen of zenuwcellen die geprikkeld worden wanneer onze zintuigen waarnemingen doorsturen. Neuronen zullen op hun beurt andere neuronen prikkelen totdat we kennis kunnen genereren die ons tot een bepaalde beslissing of handeling aanzet. Stel dat we bijvoorbeeld de straat willen oversteken en er een auto komt aangereden, dan zal ons brein op basis van informatie van onze zintuigen de beslissing nemen om te wachten tot de auto voorbijgereden is.
Al die neuronen moeten echter ook getraind worden en er is een gigantische hoeveelheid data nodig om dit mogelijk te maken. Dat is dan ook meteen het grootste nadeel van Deep Learning
Deep Learning doet ongeveer hetzelfde: het gebruikt verschillende lagen neurale netwerken waarbij neuronen elkaar op basis van input prikkelen tot er kennis uit voortkomt. En die kennis moet vervolgens tot goed geïnformeerde beslissingen of handelingen leiden. Met Deep Learning kunnen we een computer bijvoorbeeld leren om zelfstandig een paard op een foto te herkennen. Een andere toepassing zou vervolgens met een vierkantje kunnen aanduiden waar het paard zich op de foto bevindt. Maar beide applicaties zijn anders en dus heb je telkens een ander algoritme nodig.
Het spreekt voor zich dat een heel extensief en complex systeem vereist is om het brein van mensen na te bootsen. Hoe meer neuronen er in een netwerk zitten, des te groter het potentieel om te leren. Al die neuronen moeten echter ook getraind worden en er is een gigantische hoeveelheid data nodig om dit mogelijk te maken. Dat is dan ook meteen het grootste nadeel van Deep Learning. Bovendien is het onmogelijk om een algoritme iets te laten doen of herkennen als het die kennis nog niet gekregen heeft.
Een alternatief dat aan populairiteit wint
Daarom beginnen veel onderzoekers meer geloof te hechten in Reinforcement Learning. Ook dat is een zelflerend systeem, maar het functioneert door weloverwogen gokken te doen. Op basis van feedback zal het systeem uiteindelijk leren of het een juiste of verkeerde keuze heeft gemaakt, waarna het zichzelf in de toekomst kan verbeteren. Het algoritme kan dus ‘denken’ dat er een paard op de foto staat, maar heeft vervolgens bevestiging of ontkenning nodig.
De Russische wereldkampioen Gary Kasparov verloor in 1997 een spelletje schaken tegen een computer. Het zou haast onbegonnen werk zijn om zo’n systeem iedere mogelijke zet in een schaakspel aan te leren, want dan zijn miljarden combinaties nodig. Wel kunnen we een machine trainen door zetten te beoordelen. Beslissingen die tot verlies leiden, worden bestraft. Goede zetten krijgen dan weer een beloning. Het mechanisme identificeert op die manier patronen die helpen om goede en foute zetten van elkaar te onderscheiden.
Foutloos is het uiteraard niet. Deze vorm van Machine Learning gaat op zoek naar algoritmen die in zoveel mogelijk gevallen succesvol zijn. Uiteindelijk kan een computer zo dus wel slim genoeg worden om zelfs de beste menselijke speler ter wereld schaakmat te zetten. Het grote voordeel van Reinforcement Learning is het feit dat je veel minder data nodig hebt om aan de slag te kunnen gaan. Daarom zien onderzoekers dit als een populaire piste om de obstakels van Deep Learning te omzeilen.
Menselijke intelligentie
De belangrijkste conclusie van dit verhaal is het idee dat menselijke intelligentie en AI op dit moment nog onafscheidelijk zijn. Artificiële intelligentie kan simpelweg niet zonder menselijke feedback bestaan. Ons eigen brein heeft immers mogelijkheden die een machine niet kan imiteren. Zo zijn wij in staat om concepten te begrijpen en interpreteren. Een tafel die er bijvoorbeeld helemaal anders uitziet dan een klassieke tafel, zullen wij herkennen omdat we begrijpen waarvoor een tafel gebruikt wordt. Voor een computer is dit volgens de huidige technologische implementatie onmogelijk als de noodzakelijke kennis hiervoor niet eerst gezien is.
Onderzoekers hopen in de toekomst de mogelijkheden van AI nog verder uit te breiden, zodat de technologie de werking van het menselijke brein steeds beter gaat nabootsen. Als we vandaag nog met ‘Narrow AI’ te maken hebben, dan willen we uiteindelijk evolueren naar Artificial General Intelligence (AGI). Dat is een vorm van AI die niet één taak wil uitvoeren, maar een grote variëteit aan taken voor z’n rekening neemt. Maar daar zijn we dus nog lang niet en het is bovendien niet meer zo zeker dat Deep Learning de heilige graal zal blijken.
Dat gezegd zijnde hebben we vandaag eigenlijk nog steeds dezelfde droom als de auteur van dat krantenartikel uit 1960. Wie weet zal AI in pakweg 2070 wel intelligent genoeg zijn om onze menselijke intelligentie overbodig te maken en zelfs te overtreffen. We staan hoe dan ook voor erg boeiende tijden.