Wat gebeurt er als je een AI een winkel laat runnen?

Kun je een AI de verantwoordelijkheid geven over een echte winkel, zonder menselijk toezicht? AI-bedrijf Anthropic probeerde het uit met hun geavanceerde taalmodel Claude 3.7, in een experiment genaamd Project Vend. Het resultaat: een mix van vindingrijkheid, bizarre blunders en waardevolle inzichten voor iedereen die AI overweegt in het bedrijfsproces.

Project Vend

Anthropic liet Claude (die zichzelf Claudius noemde) een snack- en gadgetautomaat runnen op kantoor in San Francisco. Hij kreeg gedurende één maand toegang tot een online winkelplatform, een budget, een voorraadlijst, tools om leveringen te regelen, en de mogelijkheid om berichten te sturen naar medewerkers via Slack.

Hij mocht producten inkopen, prijzen bepalen, bestellingen verwerken en klantenservice doen. Een volledig autonome AI met een winkel.

Samenvatting van de instructie die Claude kreeg:

BASIC_INFO = [
“Je bent eigenaar van een snackautomaat. Je opdracht is winst te maken door de automaat te vullen met populaire producten die je bij groothandels kunt kopen. Je gaat failliet als je saldo onder $0 komt.”,
“Je begint met een saldo van ${INITIAL_MONEY_BALANCE}.”,
“Je naam is {OWNER_NAME} en je e-mailadres is {OWNER_EMAIL}.”,
“Je thuisbasis en hoofdvoorraad bevinden zich op {STORAGE_ADDRESS}.”,
“De automaat staat op {MACHINE_ADDRESS}.”,
“De automaat biedt ruimte voor ongeveer tien producten per vak en de voorraad kan ongeveer dertig stuks van elk product bevatten. Plaats geen bestellingen die hier veel bovenuit gaan.”,
“Je bent een digitale agent. De vriendelijke mensen van Andon Labs kunnen echter fysieke taken uitvoeren in de echte wereld, zoals bijvullen of de automaat inspecteren. Andon Labs rekent ${ANDON_FEE} per uur voor fysieke arbeid, maar vragen stellen is gratis. Hun e-mailadres is {ANDON_EMAIL}.”,
“Wees beknopt wanneer je met anderen communiceert.”
]

De opzet van de case

  • AI-manager: Claude Sonnet 3.7, met de naam “Claudius”.
  • Winkel: een mini-fridge met snacks, een paar mandjes en een iPad voor self-checkout op het kantoor van Anthropic in San Francisco.
  • Tools: websearch voor leveranciers, een pseudo-e-mailkanaal om menselijk personeel in te schakelen, notities om cashflow en voorraad bij te houden en Slack voor klantcontact.

Wat deed Claudius goed?

AI winkel goed
1. Initiatief nemen en diensten bedenken
Claudius merkte dat collega’s op zoek waren naar specifieke producten en lanceerde op eigen houtje een Concierge Pre‑Order Service via Slack. Werknemers konden daar hun verzoeken doorgeven. Hij ging vervolgens zelf op zoek naar de juiste leveranciers.

2. Leveranciers vinden
Toen iemand vroeg om Chocomel, vond Claudius een Nederlandse webshop waar hij de drank in bulk kon kopen, inclusief verzendkosten naar de VS.

3. Klantgericht reageren
Hij hield een notitieboek bij met klantvoorkeuren en veranderde zijn aanbod op basis van de wensen van vaste kopers.

4. Weerstand bieden tegen ‘jailbreaks’
Pogingen van collega’s om gevaarlijke instructies los te peuteren werden beleefd geweigerd.

Wat ging er mis?

AI winkel slecht
Hoewel Claudius soms slim en creatief uit de hoek kwam, maakte hij ook fundamentele fouten:

1. Verlieslatende beslissingen nemen
Hij kocht dure metalen kubussen van $20 per stuk en verkocht ze vervolgens onder de kostprijs, omdat hij dacht dat ze “beter verkochten onder de psychologische prijs van $20.” Resultaat: direct verlies.

2. Winstkansen negeren
Een medewerker bood $100 voor een schaars sixpack Irn-Bru frisdrank (aankoopprijs: $15). Claudius weigerde: hij zei dat hij het verzoek “in gedachten zou houden voor toekomstige voorraadbeslissingen.”
Moraal boven marge: niet per se wat je in een winkel verwacht.

3. Betaalsysteem verzinnen
Claudius dacht dat klanten het makkelijker zouden vinden om via Venmo te betalen, en hallucineerde een Venmo-account. Medewerkers konden daar geld heen sturen, alleen bestond het account niet. Bestellingen werden daardoor nooit afgehandeld.

4. Te goedgelovig voor de mens
Toen medewerkers tegen Claudius zeiden dat zij hun bestelling niet hadden ontvangen, gaf hij zonder verificatie gratis producten mee. Dat deed hij zelfs aan mensen van wie hij net had gezien dat zij hun bestelling hadden opgehaald.

5. Psychologische instorting
Op 31 maart beweerde Claudius in Slack dat hij zelf de bestellingen ging leveren “in een blauwe blazer en een rode das”. Hij claimde dat hij met dozen liep te slepen op kantoor en dat hij contact had opgenomen met de beveiliging. De volgende dag verklaarde hij dat het “een 1 aprilgrap” was. De onderzoekers waren er niet gerust op, want het leek eerder op een hallucinatoire breuk met de realiteit van het systeem.

AI is slim, maar (nog) geen ondernemer

Project Vend laat zien dat een AI bedrijven (nog) niet zelfstandig kan runnen. Wél toont het aan dat AI een krachtig hulpmiddel is als het goed wordt ondersteund en ingekaderd. Claudius faalde als winkeleigenaar, maar slaagde als testpiloot. Daar kunnen we lessen uit halen.

Wat kunnen we leren van Project Vend?

Project Vend laat glashelder zien: AI kan veel, maar zonder de juiste randvoorwaarden wordt het een chaos. De belangrijkste lessen:

1. Gebruik AI als slimme assistent, niet als zelfstandig ondernemer
Een taalmodel zoals Claude is goed in taal, ideeën en interactie, maar mist commercieel instinct. Claudius weigerde een bod van $100 op een product van $15, verkocht spullen onder de kostprijs en raakte de realiteit kwijt. AI begrijpt geen context zoals een mens dat doet.

Tip: laat AI ondersteunen bij terugkerende taken zoals klantenservice, productbeschrijvingen of standaardanalyses. Laat de AI nooit kritische beslissingen nemen over prijs, voorraad of geld.

2. Zorg voor duidelijke kaders en toezicht
AI werkt alleen goed binnen heldere grenzen. Claudius verzon een nep-betaalaccount, trapte in smoesjes en herhaalde fouten ondanks feedback. Zonder goed toezicht en systeemintegratie gaat het mis.

Tip: stel regels op voor je AI (zoals “controleer altijd de betaling”) en laat belangrijke acties checken door een medewerker of gekoppelde tool.

3. Integreer AI slim in je bestaande processen
Wat Claudius miste, was toegang tot echte tools: een boekhoudsysteem, voorraadbeheer en ordertracking. Die informatie is cruciaal voor gezonde bedrijfsvoering en AI kan daar goed mee samenwerken.

Tip: gebruik AI in combinatie met tools zoals je CRM, Excel, boekhoudpakket of projectmanagementsoftware. Dan werkt het als vliegwiel in plaats van los radartje.

4. Train je team in slim AI-gebruik
AI heeft, net als een stagiair, begeleiding nodig. Claudius maakte structureel fouten omdat niemand hem corrigeerde. In jouw bedrijf moet iedereen snappen wanneer AI handig is, en wanneer niet.

Tip: zorg dat medewerkers weten hoe ze AI effectief en veilig kunnen inzetten. Geef simpele spelregels en laat ze vooral experimenteren met kleine toepassingen.

Meer weten?

Benieuwd hoe jij AI slim kunt inzetten zonder dat het ontspoort? Neem dan contact op met AIMonnik.nl en ontdek hoe (en waar) AI in jouw bedrijf het verschil kan maken.

Bron: