IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Les développeurs d'Amazon et d'AWS pourraient ne pas vouloir inviter leurs PDG à des revues de code Java
Une erreur lors d'une démo de l'IA Amazon Q soulève des questions sur sa maturité et sa fiabilité

Le , par Stéphane le calme

102PARTAGES

4  0 
De la promesse à la réalité : Les développeurs d'Amazon et d'AWS pourraient ne pas vouloir inviter leurs PDG à des revues de code Java,
une erreur lors d'une démo de l'IA d'Amazon Q soulève des questions sur la maturité et la fiabilité de l'outil

Amazon Q AI, l’assistant génératif d’Amazon, a été conçu pour révolutionner le développement logiciel en automatisant des tâches complexes telles que la génération de code, les tests, et la mise à niveau des applications. Lors d’une démonstration vidéo, le PDG d’Amazon, Andy Jassy, et l’ancien PDG d’AWS, Adam Selipsky, ont présenté les capacités de mise à niveau de Java de l’outil Amazon Q AI. Malheureusement, une faute de frappe flagrante a été repérée : “Jave” au lieu de “Java”. Cette erreur, bien que mineure, a suscité des moqueries et des critiques sur les réseaux sociaux, soulignant l’importance de l’attention aux détails dans le développement logiciel mais aussi des questions sur la maturité et la fiabilité de cet outil.

Les fautes de frappe sont le lot des meilleurs d'entre nous, mais l'orthographe compte toujours lorsqu'il s'agit de développement de logiciels. Il est donc assez surprenant de constater que le PDG d'Amazon, Andy Jassy, et l'ancien PDG d'AWS, Adam Selipsky, n'ont pas remarqué une faute de frappe embarrassante dans une vidéo de démonstration qu'ils ont présentée à leurs millions d'adeptes sur les médias sociaux comme preuve des capacités de mise à niveau Java d'Amazon Q AI, qu'Amazon vante depuis des mois dans les documents déposés auprès de la SEC, les communications aux actionnaires et la dernière conférence téléphonique sur les résultats d'Amazon avec les analystes de Wall Street.

À peine 37 secondes après le début de la démonstration du logiciel qui, selon Amazon, lui a permis d'économiser 4 500 années de travail de développeurs et de réaliser des gains d'efficacité supplémentaires de 260 millions de dollars par an, Amazon Q lance la conversation sur la mise à niveau de Java en déclarant : « Je peux vous aider à mettre à niveau vos bases de code Jave [sic] 8 et 11 vers Java 17 ». Cette faute d'orthographe embarrassante a incité l'utilisateur de Twitter @archo5dev à alerter Jassy sur la faute de frappe, mais il n'y a pas encore eu de réponse de la part de Jassy, qui s'est vanté que les développeurs d'Amazon n'ont pas pu trouver d'erreurs dans le travail de Q dans « 79% des revues de code générées automatiquement ».

« Qu'est-ce qu'un script de mise à jour de code (qui n'est pas un concept nouveau) + une interface utilisateur normale ont à voir avec "l'IA" générique ? De plus, il y a une faute de frappe dans cette vidéo de mauvaise qualité ».

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">What does a code upgrade script (which is nothing new as a concept) + regular UI have to do with gen"AI"? Also, you have a typo in that obviously fake low quality video. <a href="https://t.co/DkmsYdSaHW">pic.twitter.com/DkmsYdSaHW</a></p>— Arvīds Kokins (@archo5dev) <a href="https://twitter.com/archo5dev/status/1826967180467990996?ref_src=twsrc%5Etfw">August 23, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]

Les implications pour les développeurs

Cette situation met en lumière plusieurs points importants pour les développeurs :
  • L’importance des détails : Même les plus petites erreurs peuvent avoir des répercussions importantes, surtout lorsqu’elles sont exposées publiquement. Une simple faute de frappe peut nuire à la crédibilité d’une démonstration et, par extension, à celle de l’entreprise.
  • La pression des démonstrations publiques : Présenter des outils ou des mises à jour devant un large public peut être stressant, et les erreurs peuvent facilement se produire. Les développeurs doivent être particulièrement vigilants lors de ces événements pour éviter les erreurs embarrassantes.
  • La perception publique : Les erreurs commises par des figures de proue comme les PDG peuvent affecter la perception publique de la compétence et de la fiabilité de l’entreprise. Une erreur mineure peut être amplifiée par les médias et les réseaux sociaux, entraînant des conséquences disproportionnées.

Les avantages et les inconvénients de l’implication des dirigeants

L’implication des dirigeants dans les aspects techniques du développement logiciel présente des avantages et des inconvénients :
  • Avantages :
    • Vision stratégique : Les dirigeants peuvent apporter une perspective stratégique et aligner les efforts de développement avec les objectifs globaux de l’entreprise.
    • Motivation des équipes : La participation des dirigeants peut motiver les équipes en montrant l’importance accordée à leur travail.
    • Visibilité et soutien : Les dirigeants peuvent utiliser leur influence pour obtenir des ressources et du soutien pour les projets techniques.

  • Inconvénients :
    • Manque de compétences techniques : Les dirigeants peuvent ne pas avoir les compétences techniques nécessaires pour comprendre les détails complexes du code, ce qui peut entraîner des erreurs ou des malentendus.
    • Pression supplémentaire : La présence des dirigeants peut ajouter une pression supplémentaire sur les développeurs, augmentant le risque d’erreurs.
    • Risques de communication : Les erreurs commises par les dirigeants lors des démonstrations publiques peuvent nuire à la réputation de l’entreprise.



La démonstration met en lumière les faiblesses de l'outil

Amazon Q AI est présenté comme un assistant puissant capable de transformer et d’implémenter de nouvelles fonctionnalités à partir des demandes des développeurs. Il peut générer du code, diagnostiquer des erreurs, effectuer des analyses de sécurité, et optimiser les ressources AWS. En théorie, cet outil devrait permettre aux développeurs de gagner en efficacité et en productivité.

Malgré ces promesses, l'outil présente des limites :
  • Erreurs humaines : Les erreurs comme celle observée lors de la démonstration peuvent être dues à des fautes humaines, mais elles soulignent également la nécessité d’une vérification rigoureuse des résultats générés par l’outil.
  • Complexité des tâches : Bien qu’Amazon Q AI soit capable de gérer des tâches complexes, il peut encore rencontrer des difficultés avec des scénarios particulièrement compliqués ou des demandes non standardisées.
  • Adaptation et apprentissage : Comme tout outil basé sur l’intelligence artificielle, Amazon Q AI nécessite du temps pour s’adapter et apprendre des erreurs passées. Les premières versions peuvent donc présenter des imperfections qui seront corrigées au fil du temps.

Les perspectives d’amélioration

Pour que Amazon Q AI atteigne son plein potentiel, plusieurs mesures peuvent être envisagées :
  • Amélioration continue : Les développeurs doivent continuer à affiner l’outil en se basant sur les retours d’expérience et les erreurs rencontrées.
  • Tests rigoureux : Avant toute démonstration publique, des tests approfondis doivent être réalisés pour minimiser les risques d’erreurs embarrassantes.
  • Formation des utilisateurs : Les utilisateurs, y compris les dirigeants, doivent être formés à l’utilisation de l’outil pour maximiser son efficacité et éviter les erreurs dues à une mauvaise manipulation.


Certains intervenants de la filière estiment que l’intelligence artificielle complique plutôt leur travail

Selon Harness, le code généré par l'intelligence artificielle est susceptible de tripler la charge de travail des développeurs dans l'année à venir. L'augmentation du volume de code livré accroît les risques de failles et de vulnérabilités si les tests et les mesures de sécurité ne sont pas rigoureusement appliqués. Bien que neuf développeurs sur dix utilisent déjà des outils d'IA pour accélérer la livraison de logiciels, cette tendance nécessite une vigilance accrue à chaque étape du cycle de vie du développement logiciel (SDLC) pour prévenir les incidents de sécurité.

L'augmentation du volume de code généré par les outils d'intelligence artificielle pose un défi majeur en termes de sécurité et de gestion des vulnérabilités. Bien que l'automatisation et la génération de code puissent considérablement accélérer le processus de développement, elles introduisent également de nouveaux risques. Si les tests et les mesures de sécurité ne sont pas rigoureusement appliqués à chaque étape du cycle de vie du développement logiciel, il devient presque inévitable que des failles passent inaperçues et soient déployées en production.

La rapidité avec laquelle le code est produit grâce à l'IA peut surpasser la capacité des développeurs à effectuer des tests approfondis et à assurer la sécurité de chaque ligne de code. Sans une infrastructure solide pour la détection et la correction des failles, les erreurs et les vulnérabilités peuvent s'accumuler, augmentant le risque d'exploits et de temps d'arrêt coûteux. La complexité accrue et la vitesse du développement exigent des outils de tests automatisés et des processus de sécurité intégrés pour compenser les limitations humaines.

Cette dépendance accrue aux outils d'IA pour la génération de code peut entraîner une réduction de la vigilance humaine, où les développeurs pourraient faire excessivement confiance aux suggestions de l'IA sans une vérification rigoureuse. Cette approche peut devenir dangereuse, car même les systèmes d'IA avancés peuvent générer du code défectueux ou vulnérable. Une approche équilibrée, combinant l'efficacité de l'IA avec une supervision humaine minutieuse, est essentielle pour garantir la qualité et la sécurité du code.

Conclusion

Amazon Q AI est un outil prometteur qui a le potentiel de transformer le développement logiciel. Cependant, comme toute technologie émergente, il présente des défis et des imperfections qui doivent être surmontés. Avec des améliorations continues et une utilisation prudente, Amazon Q AI pourrait devenir un atout majeur pour les développeurs et les entreprises.

Et vous ?

Quels sont les avantages et les inconvénients d’avoir des dirigeants d’entreprise impliqués dans les aspects techniques du développement logiciel ?
Comment les entreprises peuvent-elles mieux préparer leurs dirigeants pour des démonstrations techniques publiques ?
Pensez-vous que les erreurs mineures, comme une faute de frappe, peuvent réellement affecter la réputation d’une entreprise technologique ? Pourquoi ou pourquoi pas ?
Comment les équipes de développement peuvent-elles minimiser les erreurs lors des démonstrations publiques ?
Quelle est l’importance de la transparence et de l’honnêteté dans la communication des erreurs techniques au public ?
Avez-vous déjà vécu une situation similaire dans votre propre carrière ? Comment l’avez-vous gérée ?
Quels sont les meilleurs moyens pour une entreprise de réagir après une erreur publique pour maintenir la confiance des clients et des partenaires ?
Vous avez lu gratuitement 48 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de JPLAROCHE
Membre expérimenté https://www.developpez.com
Le 16/02/2025 à 11:10
Bonjour, je me sers de l'IA et je suis abonné, pas une IA ne fait pas d'erreur, quand il n'invente pas des fonctions inexistantes... peut-être intéressantes, mais non fonctionnel, mais je ne regrette pas de m'être abonné.
C'est un outil, d'ailleurs dans le contrat de Mistral, il est bien mentionné qu'il ne faut pas prendre pour argent comptant les réponses.
J'ai aussi travaillé avec ChatGPT c'est pareil et même mieux (pire), il me disait que c'était moi qui ne comprenais rien, je n'ai pas lâché et prouvé qu'il faisait fausse route, un algorithme pourri et des résultats bidon.
Au moins avec Mistral, il accepte de se remettre en cause, d'ailleurs quand vous signez le contrat, il vous est mentionné qu'il a le droit de se servir de votre code pour apprendre.

J'utilise Mistral, car je suis seul, à la retraite et je suis sur un projet important (pour moi) qui me tenait à cœur, ça me permet d'avoir un miroir et un recul, mais le codage reste mon œuvre, par contre pour la documentation, c'est plutôt chouette, le partage est constructif, mais je ne fais pas tout avec l'IA loin de là.

Il y a aussi quelque chose que je veux prendre sur mon dos, ce sont les questions que je pose, je me suis aperçu qu'il faut bien lui détailler sinon vous risquez de faire fausse route quant aux réponses attendues.

@bientôt
7  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 20/02/2025 à 18:43
L'IA peut écrire du code mais ne parvient pas à le comprendre, selon une étude d'OpenAI
Les mecs viennent seulement de se rendre compte qu'ils étaient en train de développer un générateur de contenu et pas une intelligence ?
Ou bien ils sont en train de préparer le terrain pour expliquer aux actionnaires que les miracles promis ne seront pas atteints ?

Les chercheurs ont confié à trois LLM - GPT-4o et o1 d'OpenAI et Claude-3.5 Sonnet d'Anthropic - 1 488 tâches d'ingénieur logiciel freelance provenant de la plateforme Upwork, pour un montant de 1 million de dollars. Ils ont divisé les tâches en deux catégories : les tâches de contribution individuelle (résolution de bogues ou mise en œuvre de fonctionnalités) et les tâches de gestion (où le modèle joue le rôle d'un gestionnaire qui choisira la meilleure proposition pour résoudre les problèmes).

« Les résultats indiquent que le travail en freelance dans le monde réel de notre benchmark reste un défi pour les modèles de langage d'avant-garde », écrivent les chercheurs.
Traduction : après 2 ans et demi à sortir version sur version de notre logiciel, on vient enfin de faire un test en environnement réel : ça marche pas.
6  0 
Avatar de d_d_v
Membre expérimenté https://www.developpez.com
Le 21/02/2025 à 9:11
Le coup de génie de ceux qui ont lancé cette technologie, c'est de l'avoir appelée intelligence artificielle. Maintenant que le mal est fait, certains continueront à penser qu'ils ont affaire à quelque chose d'intelligent, qui réfléchit. Mais quelle arnaque !
5  0 
Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 14/04/2025 à 11:50
L'IA, c'est le cancre qui a triché lors de l'examen en copiant sur son petit camarade sans réfléchir. Des fois le code marche, d'autres non.
5  0 
Avatar de FlaviusPERL
Membre habitué https://www.developpez.com
Le 28/08/2024 à 18:06
Je code avec le Q... ♫♫ lalala la la la la... ♫♫♫
2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 28/08/2024 à 20:35
Citation Envoyé par Stéphane le calme Voir le message
[...]une erreur lors d'une démo de l'IA d'Amazon Q soulève des questions sur la maturité et la fiabilité de l'outil [...]
Peut-être que c'est juste comme leur IA pour Amazon Just Walk Out: c'est un des 1000 Indiens derrière, qui a fait les fautes
2  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 13/03/2025 à 19:18
J’ai demandé à GPT-4 de m’aider à produire du code pour une version 3D du jeu Asteroid, j’ai ensuite copié et collé le code qui a fonctionné d’un coup
Bah moi j'ai trouvé un code d'exemple sur github d'Asteroid, Pong, une page welcome en ReactJS/Angular.
Sauf que heureusement/malheureusement, les clients ont des besoins plus complexe.

Tout le monde pourra créer des jeux vidéo » grâce à l’intelligence artificielle. Ce dernier propose une forge logicielle dénommée FRVR pour « permettre à quiconque de créer des jeux juste en les décrivant. »
étant moi même en train de développer un jv, de ce que j'ai vu de ces forges c'est de la merde. les assets sont dégueulasse et les possibilités des jeux fournie par l'ia sont tres tres limité. Mais bon c'est comme le no code, ca a tres vite ces limites.

Hélas j'ai une expérience très différente de ce monsieur, du apprendre a utiliser blender pour maitriser les concepts de PBR pour mes textures, les squelettes pour les animations et j'ai du apprendre a coder des shaders opengl.
Bon pour les assets, je suis pas graphiste, même chose, de ce que j'ai vu dans ces forges c'est pas ouf et puis faut les adapter a son moteur, dans mon cas c'est pas plug and play. Bref j'ai payé un gars pour me les faire.

Pour les textures par contre je vais sur https://texturelabs.org/, des textures de très bonne qualité et gratuite, c'est le seul domaine ou j'ai été convaincue niveau "forge".
et encore, certaine faut les retoucher pour les rendre "seamless ", même si c'est basique (juste 2 clique de souris) faut le savoir et le faire sur un logiciel spécialisé comme gimp. Je suis sur que juste cette simple manipulation élimine minimum 50% de la population sur terre qui peut crée un jv.

Je m'occupe juste du code "mon expertise", éventuellement, je modifie legerement une animation si je suis pas hyper convaincue, mais la partie asset 3d j'ai abandonné et j'ai payé quelqu'un pour me les fournirs plug and play.

Après je fais un jeu complexe, je dois pouvoir gérer en temps réel des armées de 300k soldats. ce qui implique pas mal de techniques d’optimisations, que seul du code bas niveau (opengl) peut gérer.

Ces logiciels sont juste bon a pondre des jeux videos basique et fade qui se ressemble tous tant en terme de design que de gameplay.
Et je parle pas du moteur, j'ai toujours détesté le rendu de unreal engine, juste la simple multiplications des jeux sur ce moteur m'énerve et j'ai une impression de déjà vu a chaque fois, je sais reconnaitre visuellement un jeu UE.
1  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 25/06/2025 à 12:14
Citation Envoyé par Matthieu Vergne Voir le message
Je peux donc tout à fait envisager un futur où de vrais entreprises feront de vrais applications mais sans vrai développeurs, juste avec des prompt engineers, et ça suffira bien. Par contre on n'y est pas encore, et tant que ce n'est pas le cas on doit maintenir la compétence pour éviter que la qualité ne chute. Ne serait-ce que pour garder un minimum de qualité pour entrainer encore les modèles.

Mais une fois qu'on aura ces outils, aurons-nous "envie" de compter sur eux ?
mais qu'es ce qui créera de la data pour les modèles ?
le monde du logiciel et vivant et évolue chaque jours.

qui va mettre à jours le kernel linux à la version 7.0, qui va faire évoluer php vers php8, qui va coder python4, qui va faire évoluer le framework angular/react a la version n+1...
pour les dev utilisant ces outils, comment une ia va savoir coder en python4/php8 ? si plus personne ne poste d'exemple sur stackoverflow ou de bug avec ces fix ?

on peut imaginer une ia connecté à github comprenant directement le code des libs et apis, par exemple relier au code de spring boot à la dernière version, mais pour construire leurs llm bizarrement les boites ne s'entraine pas que la dessus...
Pour avoir étudié la question, la ou les llms sont performante c'est en ayant des manuels scolaire comme datasource.
les ia relié au code sont une vrai cata, l'ia qui relis les mr sur github c'est une grosse blague.

Plus globalement les modeles commence déja à regresser/stagner tellement le web d'aujourd'hui a été pollué par ces memes llms.

l'ia est forte pour recrée des choses existante tres courante dans la vie, mais bien incapable sur des trucs mal entrainé.
J'ai un bon exemple avec le moteur panda3d en python, ca reste un moteur "peu" connu et peu utilisé dans le monde, j'ai essayé plusieurs ia (chatgpt, claude, gemini) elle est vraiment nul, la moitié du code marche pas, des fonctions qui existe pas, des imports faux...etc.
Avec des trucs bien plus populaire, comme la lib numpy par contre nikel.
j'ai meme tenté avec chatgpt pro de lui donner le code source du moteur panda3d histoire qu'il arrete de m'inventer des fonctions, mais c'était pas mieux, incapable de mettre les bons types.

quand le code marche, incapable de bien coder une physique avec bullet, je lui ai demandé un truc basique comme faire sauter mon personnage a la touche espace, j'ai eu n'importe quoi.
la gestion de la camera, incapable de me faire une vue fps/tps basique.

pour les textures, c'est pas trop mal, par exemple je lui dmeande de me faire une décoration de fenetre style parchemin medieval, je ne suis pas graphiste et ca donne un bon résultat.
pour les textures en boucle, comme de l'herbe ou du bois, c'est en dessous les libs de texture pbr gratuite.

mais pour dessiner des "motifs elfiques" ou des petites decos inventés comme mes bordures de fenetre c'est bon.
1  0 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 25/06/2025 à 21:28
Je n'ai pas dis toutes les entreprises. Déjà, tout ce qui est de l'ordre de l'innovation est peu adapté, vu que l'IA construit sur ce qu'elle connaît. Tout au plus elle peut faciliter le travail (e.g. fournir des méthodes connues pour traiter les nouveaux sujets), mais pas le faire entièrement (pas traiter le nouveau sujet lui-même, en tout cas pas de manière fiable).

Pour autant, il y a des tas d'entreprises qui se contentent de faire ce que font beaucoup d'autres comme elle : le contexte change, mais la méthode reste la même. Dans ce genre de cas, il n'y a a priori pas de raison que les IA n'arrivent pas un jour à une bonne autonomie : comme ça se trouve partout, des données il y en aura, donc l'apprentissage pourra se faire (à moins que le législateur ne l'entende pas de cette oreille). Pour moi ce genre de cas n'est qu'une question de temps avant d'y arriver.

Quand à tes expériences je ne peux pas en dire grand chose. Pour expérimenter moi-même, je me rends bien compte qu'il y a des fois où ça marche très bien, d'autres où ça foire lamentablement. Le truc c'est qu'à force de creuser j'adapte ma façon de l'utiliser et finalement j'obtiens ce que je veux. De la même manière, qu'est-ce qui te dis que tu n'aurais pas pu obtenir bien mieux avec un autre modèle ou un autre prompt ? Ce n'est pas le genre de choses facile à répondre de manière systématique. Et l'expérience d'aujourd'hui ne présage pas de celle de demain, vu qu'on en est encore au début.

C'est un outil. Avant de critiquer l'outil, il faut regarder sa façon de l'utiliser.
1  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 28/08/2024 à 18:42
pour qu'un code soit migrer de java 8 vers java17 c'est que ce code est pas maintenue et donc que c'est un projet qui est mort/sert à rien. En tous cas c'est un projet parmis les moins important de l'entreprise puisque aucun budget n'y est alloué visiblement.
Aucun dev ne devrait bosser sur ce genre de projet, car il ne sera pas considéré, sera sur les 1er de la liste en cas de licenciement car il bosse sur un truc inutile et pour les promotions il peut se gratter en bossant sur un projet inutile qui le rends pas visible aupres de ces managers.

Un projet qui est maintenue, tous est toujours mise a jours à la version N/N-1 (sauf raison technique)
Sur le projet ou je bosse, on applique tous les jours les patch de sécurité, on mets à jours les vm, les dockers, les BDD sont à leurs dernière version stable, enfin on mets à jours la base de code, on utilise python 3.12 et les dépendances pointe sur les dernières versions (ou avant dernière).

Si le backend d'aws tourne sur java 8, ca me fait flipper honnêtement

Pour les "4500ans", c'est du gros bullshit.
Amazon fait surtout une très mauvaise pub pour son logiciel, avec des chiffres bidons et des use case peu pertinentes. Ca me donne pas envie de tester Amazon Q et de rester avec gpt/copilot.
Avec Copilot MS pour l'heure a mener une assez bonne campagne marketing, ils savent quel est le vrai besoin. Déjà rien que le nom, copilot ça cible assez bien le besoin.
0  0