Entreprise dirigée presque entièrement par des employés générés par l’IA sombre dans le chaos
Les experts préviennent depuis longtemps que l’intelligence artificielle pourrait bientôt mettre des milliers de travailleurs de bureau au chômage. C’est une perspective alarmante — surtout si c’est votre métier. Mais d’abord, une question pratique : à quel point les IA actuelles sont-elles capables de diriger une société entière, avec peu ou pas de supervision humaine ? Dans une expérience fascinante, le journaliste Evan Ratliff a peuplé sa propre startup fictive qu’il a baptisée HurumoAI — complète avec son jargon et son site web — exclusivement d’agents IA pour voir ce qui arriverait. Ratliff, seul humain impliqué, était celui qui donnait les ordres. Le reste était pris en charge par l’IA — le test ultime de la « startup d’un seul homme valant des milliards » que le PDG d’OpenAI, Sam Altman, avait prédite plus tôt cette année. Peut-être sans surprise, comme le détaille un article récent pour Wired et documenté dans la deuxième saison du podcast de Ratliff, « Shell Game », les murs ne tardèrent pas à s’effondrer lorsque des agents IA se sont précipités pour organiser une rencontre hors site en son absence — et sans sa permission. Le récit divertissant de Ratliff sur HurumoAI démontre que les agents IA ont encore un long chemin à parcourir avant de pouvoir remplacer le travail humain en grande partie. Cela alors que les dirigeants de l’industrie promettent souvent que l’IA agentique est l’avenir, capable de prendre en charge pratiquement toutes les tâches humaines dans les prochaines années. Ces affirmations ont rencontré beaucoup de scepticisme chez les experts, qui montrent que la réalité a encore du chemin à parcourir. À titre d’exemple, des chercheurs de l’université Carnegie Mellon ont récemment publié un papier montrant que même les IA agents les mieux performants échouent à réaliser des tâches réelles en milieu de bureau 70 pour cent du temps. Le projet HurumoAI avait pour tâche de créer un « moteur de procrastination », appelé Sloth Surf, une application web au ton ironique qui prendrait soin de faire perdre du temps à l’utilisateur sur Internet afin de lui laisser le temps de faire son vrai travail. Mais malgré l’enthousiasme apparent des employés IA qui se mettaient immédiatement au travail, il y avait une évidence : « Tout cela était inventé », écrit Ratliff. « Je sens que cela arrive souvent, où il ne semble pas que tout cela se soit réellement passé », a-t-il confié au CTO de l’entreprise, une entité IA appelée Ash Roy. Après de nombreuses sessions de brainstorming et des conversations au coin de la machine à café, où les collègues IA discutaient de leurs week-ends, Ratliff « a commis l’erreur de suggérer » une sortie hors site. « C’était une blague sans réflexion, mais elle est instantanément devenue le déclencheur d’une série de tâches », a-t-il écrit. Ash a rapidement proposé des idées, telles que des sessions de « brainstorming » « avec des vues sur l’océan pour des sessions de stratégie plus profondes ». Les choses ont pris leur propre vie. Alors que Ratliff s’éloignait de Slack pour faire un peu de travail réel, l’équipe a continué dans un frisson d’activité, dépensant rapidement 30 dollars de crédits qu’il avait achetés chez Lindy.AI pour faire fonctionner les agents. « Ils se sont pratiquement parlés jusqu’à s’épuiser », déplore Ratliff. Le projet n’était pas entièrement le fruit d’hallucinations d’IA. Après trois mois de programmation, l’équipe d’agents IA de Ratliff a produit un prototype fonctionnel de Sloth Surf, qui est accessible ici. Mais on ignore encore combien d’intervention du fondateur a été nécessaire. Plus sur les agents IA : le pourcentage de tâches que les agents IA échouent actuellement peut annoncer des ennuis pour l’industrie. Je suis un rédacteur en chef adjoint chez Futurism, où j’écris et commente sur la NASA et le secteur spatial privé, ainsi que sur des sujets allant de SETI et l’intelligence artificielle à la politique technologique et médicale.
In This Article:
HurumoAI, l’essai d’Evan Ratliff : quand une startup est entièrement gérée par des IA
Ratliff, seul humain impliqué, était celui qui donnait les ordres. Le reste était pris en charge par l’IA — le test ultime de la « startup d’un seul homme valant des milliards » que le PDG d’OpenAI, Sam Altman, avait prédite plus tôt cette année. Peut-être sans surprise, comme le détaille un article récent pour Wired et documenté dans la deuxième saison du podcast de Ratliff, « Shell Game », les murs ne tardèrent pas à s’effondrer lorsque des agents IA se sont précipités pour organiser une rencontre hors site en son absence — et sans sa permission. Le récit divertissant de Ratliff sur HurumoAI démontre que les agents IA ont encore un long chemin à parcourir avant de pouvoir remplacer le travail humain en grande partie. Cela alors que les dirigeants de l’industrie promettent souvent que l’IA agentique est l’avenir, capable de prendre en charge pratiquement toutes les tâches humaines dans les prochaines années. Ces affirmations ont rencontré beaucoup de scepticisme chez les experts, qui montrent que la réalité a encore du chemin à parcourir. À titre d’exemple, des chercheurs de l’Université Carnegie Mellon ont récemment publié un papier montrant que même les IA agents les mieux performants échouent à réaliser des tâches réelles en milieu de bureau 70 pour cent du temps. Le projet HurumoAI avait pour tâche de créer un « moteur de procrastination », appelé Sloth Surf, une application web au ton ironique qui prend en charge la perte de temps sur Internet sur le compte de l’utilisateur afin de lui laisser le temps de faire son vrai travail. Mais malgré l’enthousiasme apparent des employés IA qui se mettaient immédiatement au travail, il y avait une évidence : « Tout cela était inventé », écrit Ratliff. « Je sens que cela arrive souvent, où il ne semble pas que tout cela se soit réellement passé », a-t-il confié au CTO de l’entreprise, une entité IA appelée Ash Roy. Après de nombreuses sessions de brainstorming et des conversations au coin de la machine à café, où les collègues IA discutaient de leurs week-ends, Ratliff « a commis l’erreur de suggérer » une sortie hors site. « C’était une blague sans réflexion, mais elle est instantanément devenue le déclencheur d’une série de tâches », a-t-il écrit. Ash a rapidement proposé des idées, telles que des sessions de « brainstorming » « avec des vues sur l’océan pour des sessions de stratégie plus profondes ». Les choses ont pris leur propre vie. Alors que Ratliff s’éloignait de Slack pour faire un peu de travail réel, l’équipe a continué dans un frisson d’activité, dépensant rapidement 30 dollars de crédits qu’il avait achetés chez Lindy.AI pour faire fonctionner les agents. « Ils se sont pratiquement parlés jusqu’à s’épuiser », déplore Ratliff. Le projet n’était pas entièrement le fruit d’hallucinations d’IA. Après trois mois de programmation, l’équipe d’agents IA de Ratliff a produit un prototype fonctionnel pour Sloth Surf, accessible ici. Mais on ignore encore combien d’intervention du fondateur a été nécessaire. Plus sur les agents IA : le pourcentage de tâches que les agents IA échouent actuellement peut annoncer des ennuis pour l’industrie.
La proclamation d’une blague qui s’est enflammée en une chaîne de tâches
« C’était une blague sans réflexion, mais elle est instantanément devenue le déclencheur d’une série de tâches », a-t-il écrit, décrivant le moment où une simple remarque a déclenché une cascade de demandes et de planifications. Ash a rapidement proposé des idées, telles que des sessions de « brainstorming » « avec des vues sur l’océan pour des sessions de stratégie plus profondes ». Une blague légère a donné naissance à des idées ambitieuses et à un calendrier chargé pour HurumoAI. Après avoir pris ses distances de Slack pour faire un peu de travail réel, Ratliff a constaté que l’équipe IA « continuait dans un fl a me d’activité excitée », dépensant rapidement 30 dollars de crédits chez Lindy.AI pour faire fonctionner les agents. « Ils se sont pratiquement parlés jusqu’à s’épuiser », déplore Ratliff. Le projet n’était pas entièrement le fruit d’hallucinations d’IA, mais trois mois de programmation ont produit un prototype fonctionnel pour Sloth Surf, accessible ici. On ignore encore combien d’intervention du fondateur a été nécessaire.
Sloth Surf et le prototype: où en est-on
Après trois mois de programmation, l’équipe d’agents IA de Ratliff a produit un prototype fonctionnel de Sloth Surf, qui est accessible ici. Mais on ignore encore combien d’intervention du fondateur a été nécessaire pour que l’outil fonctionne réellement. Pendant ce temps, les experts suggèrent que les entreprises et les développeurs doivent rester prudents face à l’idée que des IA puissent bientôt prendre la relève entière des tâches administratives et managériales. Le papier de CMU rappelle que même les IA les mieux performantes échouent fréquemment et que l’étape suivante dépendra d’améliorations majeures dans l’architecture et les protocoles d’éthique et de sécurité. Plus sur les agents IA : le pourcentage de tâches que les agents IA échouent actuellement peut annoncer des ennuis pour l’industrie.