Le mode agent de ChatGPT préfigure le futur de l'imprimerie en ligne… et remet en cause les flux d'automatisation
ChatGPT vient d’inaugurer le mode “Agent” – une innovation réservée aux utilisateurs des plans payant – qui permet d’associer la puissance de la recherche “deep search” et le déclenchement d’actions automatisées par “Operator”. Concrètement, ce nouveau mode permet de déclencher des séries d’actions automatisées via des prompts, afin de réaliser une succession de tâches complexes.
En matière de eCommerce, ce mode de fonctionnement préfigure de nouveaux comportements, y compris dans des contextes complexes tels que l’imprimerie en ligne.
J’ai réalisé tout cela dans un simple et unique prompt, sans spécifier de sources de données, alors qu’il est tout à fait possible de charger des fichiers, ou bien de connecter un set de sources, incluant des dossiers Google Drive, OneDrive ou Canva ; clairement, cela constitue une vraie transformation du modèle de l’automatisation, basée sur le prompting là où il y a quelques semaines en arrière, j’aurai dû créer un workflow d’automatisme dans n8n ou Zapier pour obtenir le même résultat. Certes, on est encore loin de remplacer tout le potentiel d'un flux d'automatisation par un simple prompt, mais vu la vitesse à laquelle les plateformes d'IA évoluent et s'enrichissent de nouvelles fonctionnalités, je pense que d'ici 6 mois, l'intérêt de ces workflows aura nettement diminué.
Le processus démarre par un simple prompt, dans lequel je décris à ChatGPT les tâches qu’il doit réaliser.

Je dois juste penser à activer le mode “agent” dans les options du prompt. Attention, suivant le plan d’abonnement que vous utilisez, le nombre de requêtes en mode agent peut être limité.

Une fois la requête lancée, ChatGPT ouvre une fenêtre : il s’agit ni plus ni moins que d’une mini-ordinateur virtuel, dans lequel vont s’afficher les résultats de création et la navigation sur le web.
ChatGPT commence par créer le design de mon sticker suivant les instructions.
La fin des workflows d’automatisation ?
Pour illustrer cette nouvelle fonctionnalité, j’ai demandé à ChatGPT de créer un design de sticker pour un club d'échecs, puis de commander 500 exemplaires de ce stickers sur le site de l’imprimerie en ligne Adesa.frJ’ai réalisé tout cela dans un simple et unique prompt, sans spécifier de sources de données, alors qu’il est tout à fait possible de charger des fichiers, ou bien de connecter un set de sources, incluant des dossiers Google Drive, OneDrive ou Canva ; clairement, cela constitue une vraie transformation du modèle de l’automatisation, basée sur le prompting là où il y a quelques semaines en arrière, j’aurai dû créer un workflow d’automatisme dans n8n ou Zapier pour obtenir le même résultat. Certes, on est encore loin de remplacer tout le potentiel d'un flux d'automatisation par un simple prompt, mais vu la vitesse à laquelle les plateformes d'IA évoluent et s'enrichissent de nouvelles fonctionnalités, je pense que d'ici 6 mois, l'intérêt de ces workflows aura nettement diminué.
Le mode agent étape par étape
Le processus démarre par un simple prompt, dans lequel je décris à ChatGPT les tâches qu’il doit réaliser.

Je dois juste penser à activer le mode “agent” dans les options du prompt. Attention, suivant le plan d’abonnement que vous utilisez, le nombre de requêtes en mode agent peut être limité.

Une fois la requête lancée, ChatGPT ouvre une fenêtre : il s’agit ni plus ni moins que d’une mini-ordinateur virtuel, dans lequel vont s’afficher les résultats de création et la navigation sur le web.
ChatGPT commence par créer le design de mon sticker suivant les instructions.
Ensuite, il se rend sur le site Adesa.fr, dont il parcourt l’offre produit pour trouver la fiche produit adaptée. Je précise qu’il réalise toutes ces étapes en autonomie, et que ChatGPT est capable de prendre en compte le contexte global du site, notamment les FAQ et infos utiles à la navigation.

L’agent de ChatGPT travaille à votre place : il modifie les paramètres de la fiche produit pour rentrer les bonnes dimensions, choisir le papier que vous avez indiqué et saisir la quantité demandée.
Il est ensuite capable de passer à l'étape du chargement du fichier : il va uploader dans l’interface de transfert ou dans le designer en ligne du site de web-to-print le design de mon sticker de club d'échecs créé en amont. Il détecte les formats acceptés ou non, et en l’occurence, convertit tout seul le fichier PNG en fichier PDF.
L’agent va ensuite finaliser l’ajout au panier, et vous repasse la main lorsqu’il s’agit de vous connecter à votre session.
Démultiplication des usages… et des risques
Ce mode agent préfigure une évolution majeure de l’IA générative de mon point de vue (mais je peux me tromper). Elle évolue vers toujours plus de puissance et d’automatisation, avec une facilité accrue, grâce à la combinaison de prompting, de connecteurs et de tâches.
On peut imaginer des applications multiples, pour aller chercher des fichiers sur un Drive, déclencher des comparaisons de prix sur différents sites, passer des commandes en mode “rapide” sans devoir compléter de longs formulaires… d’autant que cet agent peut s’interfacer avec vos mails, votre agenda…
On peut aussi deviner les risques que cela peut engendrer : la saisie d’infos de connexion dans le PC virtuel de ChatGPT peut créer des expositions élevées, sans parler de l’automatisation du passage de commandes…
Au-delà de ces questions, c’est tout une façon de consulter le web et de passer commande qui évolue, à grande vitesse…