Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Qwen-VL et Qwen-VL-Chat, les tous derniers LLM open-source d'Alibaba Cloud


Rédigé par Communiqué de Alibaba le 28 Août 2023

Alibaba Cloud, la branche data intelligence et technologie numérique d’Alibaba Group, a lancé deux nouveaux LLM open-source : Qwen-VL et Qwen-VL-Chat, le premier est un modèle d’imagerie et le deuxième un modèle de conversation perfectionnés.



L'introduction de ces modèles, avec leur capacité à extraire du sens et des informations des images, pourrait révolutionner l'interaction avec le contenu visuel. Par exemple, grâce à leur capacité de compréhension des images et de réponse aux questions, les modèles pourraient à l'avenir fournir une aide aux personnes malvoyantes lors d’achats en ligne.

Qwen-VL est la version multimodale de Qwen-7B, le modèle à 7 milliards de paramètres d'Alibaba Cloud pour son LLM Tongyi Qianwen qui est également disponible sur ModelScope en open source. Capable de comprendre à la fois des images et des textes en anglais et en chinois, Qwen-VL peut effectuer diverses tâches telles que répondre à des questions ouvertes liées à différentes images et générer des légendes d'images. Qwen-VL peut traiter des images d'une résolution de 448*448, ce qui permet une meilleure reconnaissance et une meilleure compréhension des images.

Qwen-VL-Chat permet des interactions plus complexes, telles que la comparaison d'images multiples et la réponse à des questions ouvertes. S'appuyant sur des techniques d'alignement, cet assistant d'IA présente un éventail de capacités créatives, notamment la rédaction de poèmes et d'histoires à partir d'images, le résumé du contenu de plusieurs images et la résolution de questions mathématiques affichées sur des images.



Réponse aux questions ouvertes par Qwen-VL-Chat


Dans le but de démocratiser les technologies de l'IA, Alibaba Cloud partage en open-source avec des universitaires, des chercheurs et des institutions commerciales du monde entier via sa communauté de modèles d'IA d'Alibaba, ModelScope, et la plateforme collaborative d'IA, Hugging Face.

Publication de Cornell University - Qwen-VL: A Frontier Large Vision-Language Model with Versatile Abilities




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store