En Mai, l’IA fait ce qu’il vous plait

Depuis maintenant quelques années les acteurs de la tech ont redoublé d’efforts pour déployer leurs propres intelligences artificielles et les intégrer au sein de leurs solutions et services. Cette course effrénée a depuis entraîné des débats publics ayant des considérations sur l’actualité sociétale, technologique et économique. Désormais, les annonces quant au développement des diverses intelligences artificielles ont le même effet pour le grand public que la sortie d’un nouveau smartphone. Il est donc naturel de se demander ce que l’IA nous réserve pour demain.

Pvdputten
Par Peter Van der Putten Publié le 31 mai 2024 à 5h00
intelligence artificielle, ia, travail, diplome, automatisation, technologie
49%Microsoft détient 49% d'OpenAI

Le printemps des IA ?

Début mai, de nombreuses rumeurs circulaient sur les futures annonces d’OpenAI : un nouveau moteur de recherche, ou GPT 5 peut-être ? Finalement, Sam Altman, CEO d'OpenAI a déclaré le 10 mai qu’ils se concentreront sur la simplification de l'interface utilisateur et sur une version de bureau de ChatGPT. Toutefois, parmi les nouveautés présentées on peut noter l’arrivée du « nouveau modèle phare » GPT4-o, une mise à jour plus incrémentale que révolutionnaire. La leçon principale à tirer de cette présentation est que la plupart des démonstrations ont été réalisées à l'aide d'un téléphone, ce qui laisse entrevoir les évolutions à venir dans la pratique des consommateurs. En ajoutant des capacités vocales et visuelles notamment au travers de la vidéo, OpenAI pourrait viser le marché mobile, élargissant encore la portée de l'IA générative. Ce qui viendrait corréler le possible rapprochement entre Apple et OpenAI pour une intégration plus poussée sur iOS. Loin de décevoir le grand public en ne parlant pas de Chat GPT 5, OpenAI serait-il en train de redéfinir la vie des individus aux côtés de l’IA ?

À cette question, un autre acteur semble avoir apporté une réponse très rapide : Google avec son IA Gemini.

Le lendemain des annonces d’OpenAI, Google lors de sa keynote annuelle a également à son tour présenté ses innovations en termes d’IA : une intégration progressive mais poussée de son IA à l’ensemble de ses services du quotidien, par exemple le moteur de recherche, les mails et même la téléphonie pour protéger les utilisateurs des arnaques en temps réel, et ce, afin de révolutionner le quotidien de tous ses utilisateurs, soit des milliards.

Un avantage loin d’être négligeable pour Google qui, en plus de répondre aux attentes des utilisateurs, vient répondre aux enjeux des organisations ayant intégré les outils Google aux processus de travail.

Des annonces grands publics, mais aussi des implications fortes pour les entreprises

Si l’arrivée, pour le grand public, de modèles naturels et teintés d’émotions, de la génération de médias vidéos et de l’intégration sur smartphone, vise à faciliter le quotidien des utilisateurs, les perspectives pour les entreprises ne sont pas aussi évidentes. Les situations où l'utilisation multimodale sont moins perceptibles au premier abord, mais on peut d’ores et déjà imaginer que la compréhension de la voix en temps réel, et la réponse naturelle, organique et moins robotique peuvent être très utile dans le domaine du service client et de la vente. Une meilleure compréhension de l'image, statique ou vidéo quant à elle pourrait être utile, par exemple, dans les applications au secteur de l’assurance.

Pour Google, la situation est bien plus évidente puisque Gemini vient directement s’intégrer à ses solutions qui parsèment le quotidien des organisations publiques et privées. Ainsi, dans la même semaine que le Google I/O 2024 des solutions à destination du secteur de l’éducation ont été annoncées, et des géants de l’industrie tels qu’Airbus ont déjà annoncé la généralisation de cette technologie à court terme pour l’ensemble de leur organisation.

Que peut-on retenir de cette semaine de mai placée sous le signe de l’intelligence artificielle ?

Tout simplement que les modèles multimodaux sont loin d'être nouveaux. ChatGPT avait des capacités similaires (mais plus basiques), et la gamme de modules Gemini de Google a été nativement multimodale dès le début. Mais la force de l’application pratique ne doit pas être sous-estimée, c'est pourquoi l'ouverture de ces capacités à l'ensemble des utilisateurs, ainsi que la réduction des coûts et l'accélération de leur utilisation en temps réel, constituent une avancée importante.

La force des pionniers de l’IA se place dans l’itération et l'apprentissage continu, leur permettant de rester à la pointe de l’innovation et de répondre aux défis émergents. En adoptant une approche agile, réactive et multimodale, ces entreprises peuvent créer des systèmes d’IA plus robustes et adaptatifs, qui bénéficient à la fois aux utilisateurs et à la société dans son ensemble.

Pvdputten

directeur du Laboratoire IA de Pegasystems, et professeur de Machine Learning et d'IA à l'université de Leiden.

Suivez-nous sur Google News Economie Matin - Soutenez-nous en nous ajoutant à vos favoris Google Actualités.

Aucun commentaire à «En Mai, l’IA fait ce qu’il vous plait»

Laisser un commentaire

* Champs requis