Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Alibaba dévoile une puce IA pour améliorer la puissance du Cloud Computing


Rédigé par Communiqué de Alibaba le 29 Septembre 2019

Le NPU Hanguang 800 améliore les performances des solutions de recherche, de recommandation ainsi que les services à la clientèle pour le retail.



Alibaba dévoile une puce IA pour améliorer la puissance du Cloud Computing
Alibaba Group (NYSE : BABA) présente aujourd’hui sa première puce d’inférence IA développée par T-Head dans le cadre de l’initiative Alibaba DAMO Academy, qui porte les activités de développement technologique et de recherche scientifique du groupe. La puce d’inférence IA à haute performance, une unité de traitement neuronal (NPU), nommée Hanguang 800, spécialisée dans l’accélération des tâches de machine learning, a été annoncée lors de la conférence annuelle Apsara Computing d’Alibaba Cloud qui se tient du 25 au 27 septembre.

La Hanguang 800 est actuellement utilisée en interne pour les opérations commerciales d’Alibaba, notamment dans la recherche de produits et la traduction automatique pour ses sites e-commerce, les recommandations personnalisées, la publicité et les services clients intelligents. Ces domaines nécessitent une puissance de calcul considérable en matière d’intelligence artificielle afin d’optimiser l’expérience d’achat.

« Le lancement de Hanguang 800 est une étape importante dans notre quête de technologies de nouvelle génération. Elle améliore les capacités de calcul qui stimuleront nos activités actuelles et émergentes tout en augmentant l’efficacité énergétique », a déclaré Jeff Zhang, Directeur Technique du Groupe Alibaba et Président d’Alibaba Cloud Intelligence. « Dans un avenir proche, nous prévoyons de donner à nos clients les moyens d’accéder à de l’informatique avancée, grâce à cette puce, à tout moment et en tout lieu, par l’intermédiaire de notre activité cloud. »

L’un des principaux objectifs d’Alibaba Cloud est d’offrir une infrastructure technologique de pointe qui profite aux entreprises de toutes tailles et bouche les lacunes existantes en matière d’accès à la technologie, pour finalement rendre le monde plus inclusif.

Portée par une architecture matérielle développée en interne, et des algorithmes hautement optimisés et adaptés à des applications métiers telles que le retail et la logistique, la puce Hanguang 800 a enregistré des performances remarquables dans les tests. La performance de calcul sur une seule puce a atteint 78 563 IPS au moment du pic, tandis que les scores des tests d’efficience Restnet-50 Inference étaient de 500 IPS/W. Les deux scores de performance sont largement supérieurs à la moyenne de l’industrie, mettant en lumière un équilibre remarquable entre des capacités de calcul élevées et une grande efficience.

Par exemple, environ un milliard d’images de produits sont téléchargées chaque jour sur Taobao, le site e-commerce d’Alibaba, pour les commerçants. Auparavant, il fallait une heure à la machine pour catégoriser un si grand volume d’images, puis adapter la recherche et les recommandations personnalisées pour des centaines de millions de consommateurs. Avec Hanguang 800, il ne faut plus que 5 minutes à la même machine pour accomplir la même tâche.

L’unité de recherche d’Alibaba, T-Head — dont le nom chinois est « Pintouge », qui signifie « Ratel » — est à la pointe de l’innovation en matière de puces pour le cloud computing et le edge computing. T-Head est également responsable de la mise en place d’un écosystème informatique de pointe inclusif en collaborant avec des partenaires mondiaux de l’industrie de la carte à puce. Plus tôt cette année, T-Head a lancé la XuanTie 910, un processeur IoT haute performance basé sur RISC-V, un jeu d’instructions open source (ISA). XuanTie 910 a été conçu pour servir les applications IoT à haut rendement qui nécessitent des capacités de calcul élevées, telles que l’intelligence artificielle, la mise en réseau, les passerelles, les automobiles autonomes et les serveurs embarqués. Les développeurs du monde entier ont pu accéder avec succès à certains codes des processeurs hautes performances et utiliser cette technologie pour développer des prototypes pour leurs propres puces.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store