EN DIRECT en ligne connexion / inscription
Connexion

Surnom/Pseudo
Mot de Passe :

[ Vous avez perdu votre mot de pass ? | Devenir membre ]

×

GTC 2021 : Nvidia vous permet de créer votre propre avatar doté d'intelligence artificielle

NVIDIA annonce NVIDIA Omniverse Avatar, plate-forme technologique permettant de générer des avatars d'IA interactifs. Omniverse Avatar relie les technologies de la société en matière d'IA vocale, de vision par ordinateur, de compréhension du langage naturel, de moteurs de recommandation et de technologies de simulation. Les avatars créés dans la plateforme sont des personnages interactifs dotés de graphismes 3D à tracé de rayons, capables de voir, de parler, de converser sur un large éventail de sujets et de comprendre une intention exprimée naturellement.

Omniverse Avatar ouvre la voie à la création d'assistants IA facilement personnalisables pour pratiquement tous les secteurs d'activité. Ces assistants pourraient faciliter les milliards d'interactions quotidiennes avec les clients - commandes dans les restaurants, transactions bancaires, prise de rendez-vous et réservations personnelles, etc. " L'aube des assistants virtuels intelligents est arrivée ", a déclaré Jensen Huang, fondateur et CEO de NVIDIA. "Omniverse Avatar associe les technologies graphiques, de simulation et d'IA de NVIDIA pour créer des applications en temps réel parmi les plus complexes jamais créées. Les cas d'utilisation des robots collaboratifs et des assistants virtuels sont incroyables et d'une grande portée. "
Omniverse Avatar fait partie de NVIDIA Omniverse, une plate-forme de collaboration et de simulation de monde virtuel pour les flux de travail 3D actuellement en bêta ouverte avec plus de 70 000 utilisateurs. Dans son discours d'ouverture à la NVIDIA GTC, M. Huang a présenté plusieurs exemples d'Omniverse Avatar : le projet Tokkio pour le support client, NVIDIA DRIVE Concierge pour les services intelligents et permanents dans les véhicules et le projet Maxine pour la visioconférence.



nvidia omniverse avatar

Dans la première démonstration du projet Tokkio, Huang a montré des collègues engagés dans une conversation en temps réel avec un avatar conçu comme une réplique de lui-même, sur des sujets tels que la biologie et la science du climat.



Dans une deuxième démonstration du projet Tokkio, il a présenté un avatar de service client dans un kiosque de restaurant, capable de voir, de converser et de comprendre deux clients qui commandaient des hamburgers végétariens, des frites et des boissons. Les démonstrations étaient alimentées par le logiciel NVIDIA AI et Megatron 530B, qui est actuellement le plus grand modèle linguistique personnalisable au monde.

Dans une démonstration de la plate-forme d'IA DRIVE Concierge, un assistant numérique sur l'écran central du tableau de bord aide un conducteur à choisir le meilleur mode de conduite pour atteindre sa destination à l'heure, puis suit sa demande pour définir un rappel lorsque l'autonomie de la voiture passe en dessous de 100 miles.

Par ailleurs, Huang a montré la capacité du projet Maxine à ajouter des fonctions vidéo et audio de pointe aux applications de collaboration virtuelle et de création de contenu. Une personne parlant anglais participe à un appel vidéo dans un café bruyant, mais on peut l'entendre clairement sans bruit de fond. Pendant qu'elle parle, ses paroles sont à la fois transcrites et traduites en temps réel en allemand, en français et en espagnol avec la même voix et la même intonation.

Éléments clés d'Omniverse Avatar

Omniverse Avatar utilise des éléments issus de l'IA vocale, de la vision par ordinateur, de la compréhension du langage naturel, des moteurs de recommandation, de l'animation faciale et des graphiques grâce aux technologies suivantes :
  • - Sa reconnaissance vocale est basée sur NVIDIA Riva, un kit de développement logiciel qui reconnaît la parole dans plusieurs langues. Riva est également utilisé pour générer des réponses vocales semblables à celles d'un humain en utilisant des capacités de synthèse vocale.
  • - Sa compréhension du langage naturel est basée sur le grand modèle de langage Megatron 530B qui peut reconnaître, comprendre et générer du langage humain. Megatron 530B est un modèle pré-entraîné qui peut, avec peu ou pas d'entraînement, compléter des phrases, répondre à des questions sur un grand nombre de sujets, résumer des histoires longues et complexes, traduire dans d'autres langues et gérer de nombreux domaines pour lesquels il n'a pas été spécifiquement formé.
  • - Son moteur de recommandation est fourni par NVIDIA Merlin, un cadre qui permet aux entreprises de créer des systèmes de recommandation à apprentissage profond capables de traiter de grandes quantités de données pour faire des suggestions plus intelligentes.
  • - Ses capacités de perception sont assurées par NVIDIA Metropolis, un framework de vision par ordinateur pour l'analyse vidéo.
  • - Son animation d'avatar est alimentée par NVIDIA Video2Face et Audio2Face, des technologies d'animation faciale et de rendu 2D et 3D pilotées par l'IA.


Ces technologies sont composées dans une application et traitées en temps réel à l'aide de NVIDIA Unified Compute Framework. Conditionnées sous forme de microservices évolutifs et personnalisables, les compétences peuvent être déployées, gérées et orchestrées en toute sécurité sur plusieurs sites par NVIDIA Fleet Command.
communiqué de presse traduit par DeePl.
source : Nvidia
Marque : NVIDIA
Partagez :
Posté le par


8 commentaires
Vous devez être membre pour poster des commentaires.
Identification
Surnom/Pseudo :
Mot de Passe :
Top 100 dernières actualités des fermiers