Free a battu ChatGPT ?
par Numerama
Moshi est la première intelligence artificielle de Kyutai, le laboratoire de recherche lancé par Xavier Niel, Rodolphe Saadé et Eric Schmidt en novembre 2023. Il s’agit du premier modèle capable de répondre à des questions orales en temps réel, avec une rapidité digne d’un être humain. Kyutai devance OpenAI, qui a repoussé la sortie de son ChatGPT Voice à l’automne.En mai 2024, avec la nouvelle version de ChatGPT Voice alimentée par le modèle GPT-4o, OpenAI présentait au monde la première intelligence artificielle capable d’analyser la voix en temps réel. Plus besoin de transformer un son en un texte écrit (c’est de cette façon que fonctionnent Siri ou Google Assistant), les modèles de demain seront capables de reconnaître directement des bruits et de deviner ce que vous allez dire ensuite, quitte à aller plus vite que le cerveau humain. Pris dans différentes polémiques (dont l’imitation de la voix de Scarlett Johansson), OpenAI a repoussé la sortie du nouveau ChatGPT Voice à l’automne.Et puis, par surprise le 3 juillet, le laboratoire français Kyutai a dévoilé son propre modèle vocal, baptisé Moshi. Lui aussi peut répondre à la voix en temps réel, grâce à une capacité d’analyse native de la voix. Moshi, qui est un projet open source à but non commercial, est disponible en test sur le site de Kyutai. Pour rappel, il s’agit d’un laboratoire fondé notamment par Xavier Niel, qui rêve de rivaliser avec les géants américains et chinois.
Vidéo suivante dans 5 secondes
Autres vidéos
Vos réactions doivent respecter nos CGU.
-
13:47Monde - Désormais dans le viseur des talibans: les fenêtres qui permettent de voir des femmes
-
13:43Monde - Le Soudan rejette un rapport utilisé par l'ONU sur la propagation de la famine
-
13:41Monde - Présidentielle en Croatie: les électeurs aux urnes, le chef de l'Etat sortant donné favori
-
13:08Sports - Léon Marchand élu personnalité française la plus marquante en 2024
-
09:20Auto - Vélo : Peut-on rouler côte à côte sur la route ?