IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Mistral AI a dévoilé Mistral Small 3.1 : le nouveau LLM mini open source puissant


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 166
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 166
    Par défaut Mistral AI a dévoilé Mistral Small 3.1 : le nouveau LLM mini open source puissant
    La startup française d'intelligence artificielle (IA) Mistral AI a dévoilé Mistral Small 3.1, son nouveau modèle léger open source qui battrait Gemma 3, Claude et GPT-4o

    La startup française d'intelligence artificielle Mistral AI a dévoilé un nouveau modèle open-source qui, selon la société, surpasse les offres similaires de Google et d'OpenAI, ouvrant ainsi la voie à une concurrence accrue sur un marché dominé par les géants américains de la technologie. Le modèle, appelé Mistral Small 3.1, traite à la fois le texte et les images avec seulement 24 milliards de paramètres, soit une fraction de la taille des principaux modèles propriétaires, tout en égalant ou en dépassant leurs performances, selon l'entreprise.

    Fin janvier 2025, Mistral AI a dévoilé Mistral Small 3, son nouveau modèle d'IA à 24 milliards de paramètres, développé dans un souci de haute performance et de faible latence. Pour rappel, Mistral AI est une entreprise française fondée en avril 2023, spécialisée dans l'intelligence artificielle générative. Elle développe des grands modèles de langages open source et propriétaires. Mistral AI est considérée comme l'un des leaders européens de l'intelligence artificielle (IA).

    Avec une structure optimisée, Mistral Small 3 se positionne comme une alternative ouverte et transparente aux modèles propriétaires, offrant des résultats comparables à des modèles beaucoup plus grands tels que Llama 3.3 70B et Qwen 32B. Caractérisé par une efficacité de calcul, Small 3 serait un choix idéal pour 80 % des applications génératives basées sur l'IA, garantissant des temps de réponse rapides sans compromettre la précision.

    Récemment, Mistral AI a lancé un nouveau modèle léger appelé Mistral Small 3.1. Small 3.1 est open-source et capable de traiter du texte et des images avec seulement 24 milliards de paramètres. C'est une fraction de la taille des modèles les plus avancés sur le marché. Par rapport à son prédécesseur Small 3, Small 3.1 offre "des performances textuelles améliorées, une compréhension multimodale et un nombre de jetons étendu (128 000)".

    En outre, il peut traiter des données à une vitesse de 150 jetons par seconde. Cette "impressionnante réussite technique" serait due à la stratégie alternative employée par Mistral. L'accent est mis sur les améliorations algorithmiques et l'optimisation de la formation, plutôt que sur le déploiement de toujours plus de GPU pour les nouveaux modèles.

    Le fait que Mistral rende ses modèles open-source prouve une fois de plus que l'entreprise souhaite rendre l'IA accessible et n'opte pas pour des modèles fermés comme ceux d'OpenAI. Dans le même temps, elle bénéficie des opportunités de recherche et de développement de la communauté de l'IA au sens large. Cette approche porte ses fruits, puisqu'avec une valeur proche des 6 milliards d'euros, elle peut se targuer d'être la plus importante entreprise d'IA en Europe.


    Voici un extrait de l'annonce de Mistral AI :

    Nous annonçons aujourd'hui Mistral Small 3.1 : le meilleur modèle dans sa catégorie de poids.

    S'appuyant sur Mistral Small 3, ce nouveau modèle est doté de performances textuelles améliorées, d'une compréhension multimodale et d'une fenêtre contextuelle élargie pouvant contenir jusqu'à 128k tokens. Le modèle surpasse des modèles comparables tels que Gemma 3 et GPT-4o Mini, tout en offrant des vitesses d'inférence de 150 tokens par seconde.

    Mistral Small 3.1 est publié sous licence Apache 2.0.

    Les applications modernes d'intelligence artificielle exigent un mélange de capacités de traitement de texte, de compréhension d'entrées multimodales, de prise en charge de plusieurs langues et de gestion de contextes longs, avec une faible latence et un bon rapport coût-efficacité. Comme le montre le tableau ci-dessous, Mistral Small 3.1 est le premier modèle open source qui non seulement atteint, mais surpasse les performances des principaux petits modèles propriétaires dans tous ces domaines.

    Nom : 1.jpg
Affichages : 18490
Taille : 26,6 Ko

    Présentation de Mistral Small 3.1

    Mistral Small 3.1 est un modèle polyvalent conçu pour gérer un large éventail de tâches d'IA générative, notamment le suivi d'instructions, l'assistance à la conversation, la compréhension d'images et l'appel de fonctions. Il constitue une base solide pour les applications d'IA d'entreprise et grand public.

    Mistral Small 3.1 peut être utilisé dans diverses applications d'entreprise et grand public qui nécessitent une compréhension multimodale, telles que la vérification de documents, les diagnostics, le traitement d'images sur appareil, l'inspection visuelle pour les contrôles de qualité, la détection d'objets dans les systèmes de sécurité, l'assistance clientèle basée sur l'image et l'assistance générale.

    Voici les principales caractéristiques et capacités du modèle, selon Mistral AI :

    • Léger : Mistral Small 3.1 pourrait fonctionner avec une seule RTX 4090 ou un Mac avec 32 Go de RAM. Cela en fait un outil idéal pour les cas d'utilisation sur l'appareil.

    • Assistance conversationnelle à réponse rapide : Idéale pour les assistants virtuels et autres applications où des réponses rapides et précises sont essentielles.

    • Appel de fonction à faible latence : Capable d'exécuter rapidement des fonctions dans le cadre de flux de travail automatisés ou agentiques

    • Ajustement précis pour les domaines spécialisés : Mistral Small 3.1 peut être affiné pour se spécialiser dans des domaines spécifiques, créant ainsi des experts en la matière. Ceci est particulièrement utile dans des domaines tels que les conseils juridiques, les diagnostics médicaux et l'assistance technique.

    • Une base pour le raisonnement avancé : Nous continuons à être impressionnés par la façon dont la communauté construit sur les modèles ouverts de Mistral. Au cours des dernières semaines, nous avons vu plusieurs excellents modèles de raisonnement construits sur Mistral Small 3, tels que DeepHermes 24B de Nous Research. À cette fin, nous publions des points de contrôle de base et d'instruction pour Mistral Small 3.1 afin de permettre une personnalisation plus poussée du modèle en aval.


    Concernant les performances du modèle, voici les résultats publiés par Mistral AI :

    • Benchmarks d'instruction de texte

      Nom : 2.jpg
Affichages : 4567
Taille : 51,4 Ko

    • Multilingue

      Nom : 3.jpg
Affichages : 4569
Taille : 47,4 Ko

    • Contexte long

      Nom : 4.jpg
Affichages : 4576
Taille : 41,6 Ko

    Disponibilité

    Mistral Small 3.1 est disponible au téléchargement sur le site web de huggingface Mistral Small 3.1 Base et Mistral Small 3.1 Instruct. Il est également possible d'essayer le modèle via l'API ans le playground des développeurs de Mistral AI, La Plateforme. Le modèle est également disponible sur Google Cloud Vertex AI. Mistral Small 3.1 sera également disponible sur NVIDIA NIM dans les semaines à venir.


    Source : Mistral AI

    Et vous ?

    Pensez-vous que ce nouveau modèle est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    La société française Mistral AI lance son API OCR pour la reconnaissance optique de caractères, qui permet d'extraire avec précision des textes structurés et des médias et surpasserait la concurrence

    Google lance Gemma 3 : "le modèle d'IA le plus puissant que vous pouvez faire tourner sur un GPU", une IA open source avec un contexte de 128K optimisée pour fonctionner sur presque tout, du GPU au smartphone

    OpenAI change de cap et annule le lancement de son modèle d'IA o3 au profit d'une version « unifiée » baptisée GPT-5, Sam Altman évoque un souci de simplification mais certains y voient un problème de coûts
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Membre actif
    Profil pro
    DSI
    Inscrit en
    Février 2010
    Messages
    88
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : DSI

    Informations forums :
    Inscription : Février 2010
    Messages : 88
    Par défaut
    non mistral, tu nous surprend là

    "
    Le nombre 9.10 est plus grand que 9.9. En mathématiques, lorsque vous comparez des nombres décimaux, vous comparez d'abord les parties entières, puis les chiffres après la virgule, de gauche à droite. Ainsi, 9.10 est plus grand que 9.9 parce que le chiffre après la virgule dans 9.10 est 1, qui est plus grand que le chiffre 9 dans 9.9.
    "

    https://www.dropbox.com/scl/fi/ub0lv...rdam9gch9&dl=0

    "Les nombres 9.9 et 9.010 sont en fait égaux. En mathématiques, les zéros à la fin d'un nombre décimal n'affectent pas sa valeur. Ainsi, 9.010 est équivalent à 9.01, qui est inférieur à 9.9. Donc, 9.9 est plus grand que 9.010."

    https://www.dropbox.com/scl/fi/p66ga...3xt3d529b&dl=0

  3. #3
    Membre chevronné
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juin 2022
    Messages
    274
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 21
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2022
    Messages : 274
    Par défaut
    https://www.hibyrd.fr/actualites/que...t-limites.html
    On parlera d'IA quand un raisonnement sera réellement fait ... Et pas un ensemble de génération hasardeuse basé sur de la probabilité et des hallucinations.
    Un problème sans solution est un problème mal posé. (Albert Einstein)

  4. #4
    Membre chevronné Avatar de der§en
    Homme Profil pro
    Bretagne
    Inscrit en
    Septembre 2005
    Messages
    1 000
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Bretagne
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2005
    Messages : 1 000
    Par défaut
    De mémoire, en primaire, on nous disais que 9.9 est égale à 9.90 et même 9.900000000000, tout les zéros à droite non aucune signification !

  5. #5
    Membre actif
    Profil pro
    Inscrit en
    Novembre 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2003
    Messages : 117
    Par défaut
    Citation Envoyé par _informix_ Voir le message
    non mistral, tu nous surprend là

    "
    Le nombre 9.10 est plus grand que 9.9. En mathématiques, lorsque vous comparez des nombres décimaux, vous comparez d'abord les parties entières, puis les chiffres après la virgule, de gauche à droite. Ainsi, 9.10 est plus grand que 9.9 parce que le chiffre après la virgule dans 9.10 est 1, qui est plus grand que le chiffre 9 dans 9.9.
    "

    https://www.dropbox.com/scl/fi/ub0lv...rdam9gch9&dl=0

    "Les nombres 9.9 et 9.010 sont en fait égaux. En mathématiques, les zéros à la fin d'un nombre décimal n'affectent pas sa valeur. Ainsi, 9.010 est équivalent à 9.01, qui est inférieur à 9.9. Donc, 9.9 est plus grand que 9.010."

    https://www.dropbox.com/scl/fi/p66ga...3xt3d529b&dl=0
    Nom : msedge_N5fUkpM7Lv.png
Affichages : 3586
Taille : 53,0 Ko
    Pour utiliser efficacement un outil, on doit d'abord apprendre à s'en servir.
    Pour obtenir une bonne réponse d'un modèle de langage, on doit d'abord écrire une bonne question et là, votre question, bien qu'elle paraisse claire pour un humain, ne l'est pas du tout pour le modèle de langage.
    Une astuce, bien que ça ne corrige pas le problème initial, qui est que la question est mauvaise, est d'ajouter "prouve-le" à la fin, comme on peut le voir sur la capture d'écran que j'ai mise.

  6. #6
    Membre émérite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mars 2011
    Messages
    604
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2011
    Messages : 604
    Par défaut
    Pour utiliser efficacement un outil, on doit d'abord apprendre à s'en servir.
    Pour obtenir une bonne réponse d'un modèle de langage, on doit d'abord écrire une bonne question et là, votre question, bien qu'elle paraisse claire pour un humain, ne l'est pas du tout pour le modèle de langage.
    Une astuce, bien que ça ne corrige pas le problème initial, qui est que la question est mauvaise, est d'ajouter "prouve-le" à la fin, comme on peut le voir sur la capture d'écran que j'ai mise.
    Ah, c'est pas un bug, c'est une feature donc ?
    La perfection est atteinte, non pas lorsqu’il n’y a plus rien à ajouter, mais lorsqu’il n’y a plus rien à retirer. - Antoine de Saint-Exupéry

  7. #7
    Membre éprouvé
    Avatar de calvaire
    Homme Profil pro
    .
    Inscrit en
    Octobre 2019
    Messages
    1 907
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : Singapour

    Informations professionnelles :
    Activité : .
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2019
    Messages : 1 907
    Par défaut
    pour les commentaires du dessus.

    Es ce que vous utilisez chatgpt pour calculer l'itinéraire sur le gps ? heureusement que non, il existe mieux comme ia pour ca.
    l'ia c'est d'ailleurs des milliers de process et algorithmes (et variantes) qui existe, les llm ne sont d'ailleurs qu'un type particulier d'ia, qui n'est pas performant ou optimisé pour pleins de cas.

    On le sait tous que ces outils sont mauvais en mathématique, mais par contre il y'a énormément de use case ou ces outils sont formidable a utiliser au quotidien.
    La France est un pays qui redistribue tout sauf de l'espoir.

  8. #8
    Membre actif
    Profil pro
    Inscrit en
    Novembre 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2003
    Messages : 117
    Par défaut
    Citation Envoyé par pyros Voir le message
    Ah, c'est pas un bug, c'est une feature donc ?
    Non c'est un problème entre la chaise et le clavier, comme il arrive parfois.
    Dans une voiture, si vous mettez la marche arrière puis que vous vous étonnez de ne pas avancer, ce n'est pas un problème venant de la voiture si vous voyez ce que je veux dire.
    C'est vrai que ce message peut sembler insultant, mais en réalité, la faute ne vous revient pas vraiment. Car l'ensemble de la presse a tendance à parler d'intelligence artificielle alors que ce n'en est pas du tout une, et induit ainsi en erreur les gens qui ont peu de connaissances sur le sujet.

  9. #9
    Membre émérite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mars 2011
    Messages
    604
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2011
    Messages : 604
    Par défaut
    Citation Envoyé par jnspunk Voir le message
    Non c'est un problème entre la chaise et le clavier, comme il arrive parfois.
    Dans une voiture, si vous mettez la marche arrière puis que vous vous étonnez de ne pas avancer, ce n'est pas un problème venant de la voiture si vous voyez ce que je veux dire.
    C'est vrai que ce message peut sembler insultant, mais en réalité, la faute ne vous revient pas vraiment. Car l'ensemble de la presse a tendance à parler d'intelligence artificielle alors que ce n'en est pas du tout une, et induit ainsi en erreur les gens qui ont peu de connaissances sur le sujet.
    C'était du 2nd degré, mais ça souligne le décalage ancestrale entre les développeurs et les utilisateurs.

    Un programme fait toujours ce pour quoi il a été programmé (mise à part cas limite des rayon cosmique qui viennent changer les bit de mémoire, les "out of ressource" et autres problèmes materiel). A partir de là, Il y a 2 types de bug:
    • Le programme ne fait pas ce que le développeur pensait avoir programmé.
    • Le programme ne fait pas ce que à quoi l'utilisateur s'attend.


    Et le problème, c'est que ces 2 types de bug ne sont pas forcément équivalent. Un comportement buggé du point de vue développeur peut être perçu comme normal par l'utilisateur, et un comportement normal du programme peut être vue comme annormal du point de vue utilisateur. Et il ne faut pas oublier que l'on développe des programmes avant tout pour les utilisateurs, pas pour les développeurs.
    La perfection est atteinte, non pas lorsqu’il n’y a plus rien à ajouter, mais lorsqu’il n’y a plus rien à retirer. - Antoine de Saint-Exupéry

  10. #10
    Membre actif
    Profil pro
    Inscrit en
    Novembre 2003
    Messages
    117
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2003
    Messages : 117
    Par défaut
    Citation Envoyé par pyros Voir le message
    C'était du 2nd degré, mais ça souligne le décalage ancestrale entre les développeurs et les utilisateurs.

    Un programme fait toujours ce pour quoi il a été programmé (mise à part cas limite des rayon cosmique qui viennent changer les bit de mémoire, les "out of ressource" et autres problèmes materiel). A partir de là, Il y a 2 types de bug:
    • Le programme ne fait pas ce que le développeur pensait avoir programmé.
    • Le programme ne fait pas ce que à quoi l'utilisateur s'attend.


    Et le problème, c'est que ces 2 types de bug ne sont pas forcément équivalent. Un comportement buggé du point de vue développeur peut être perçu comme normal par l'utilisateur, et un comportement normal du programme peut être vue comme annormal du point de vue utilisateur. Et il ne faut pas oublier que l'on développe des programmes avant tout pour les utilisateurs, pas pour les développeurs.
    Ce n'est pas du tout ça, L'exemple de la voiture n'était peut être pas aussi clair que l'exemple d'un programme alors voici :
    Si vous cliquez sur "imprimer" alors que vous voulez un ouvrir un fichier alors ce n'est pas un des deux types de bug.
    Ne pas savoir se servir d'un outil c'est une chose bien différente.

Discussions similaires

  1. Réponses: 5
    Dernier message: 03/02/2025, 16h59
  2. Réponses: 4
    Dernier message: 26/10/2024, 16h17
  3. Réponses: 42
    Dernier message: 12/09/2024, 18h45
  4. Réponses: 2
    Dernier message: 28/03/2024, 13h56
  5. Microsoft lance Phi-2, un petit LLM plus performant que Llama 2 et Mistral 7B
    Par Bruno dans le forum Intelligence artificielle
    Réponses: 0
    Dernier message: 18/12/2023, 19h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo