Imaginez que vous puissiez parler à vos données comme s'il s'agissait de votre meilleur ami. C'est ce que fait Pandas AI ! Cette bibliothèque Python possède des capacités d'intelligence artificielle générative qui peuvent transformer vos cadres de données en agents conversationnels. Finies les heures interminables passées à regarder des lignes et des colonnes.
Mais ne vous inquiétez pas, Pandas AI n'est pas là pour remplacer votre Pandas bien-aimé. Il est là pour l'améliorer ! Avec Pandas AI, vous pouvez faire passer vos analyses et manipulations de données au niveau supérieur. Considérez-le comme un super-héros - il est là pour vous aider à sauver la situation et vous faciliter la vie.
Les possibilités offertes par Pandas AI sont infinies. Imaginez un cadre de données capable d'écrire ses propres rapports ou d'analyser des données complexes et de vous fournir des résumés faciles à comprendre.
Dans ce guide rapide, vous découvrirez étape par étape comment utiliser cette bibliothèque de pointe, quel que soit votre niveau d'expérience dans le domaine.
Que vous soyez un analyste de données expérimenté ou un débutant, ce guide vous fournira tous les outils dont vous avez besoin pour plonger dans le monde de Pandas AI en toute confiance. Alors, asseyez-vous, détendez-vous, et explorons les possibilités passionnantes que Pandas AI a à offrir !
Dépôt officiel GitHub -
https://github.com/gventuri/pandas-ai
Code -
https://colab.research.google.com/dr...n-?usp=sharing
Installation de Pandas AI à l'aide de pip
Notre dataframe contient des informations sur différents pays, notamment leur PIB (en millions d'USD) et leur indice de bonheur. Il se compose de 10 lignes et de 3 colonnes :
Importer Pandas AI avec OpenAI
Dans l'étape suivante, nous allons importer la bibliothèque
pandasai que nous avons installée précédemment et ensuite importer la fonctionnalité LLM (Large Language Model). Depuis mai 2023,
pandasai ne prend en charge que le modèle OpenAI, que nous utiliserons pour comprendre les données.
Pour utiliser l'API OpenAI, vous devez générer votre propre clé d'API. Si vous ne l'avez pas encore fait, vous pouvez facilement créer un compte sur le site officiel de la plateforme à l'adresse
platform.openai.com. Une fois votre compte créé, vous recevrez instantanément un crédit de 5 $ que vous pourrez utiliser pour explorer et expérimenter l'API.
Initialiser Pandas AI et poser des questions
Ensuite, nous fournirons notre modèle OpenAI à Pandas AI et poserons diverses questions.
Lorsque vous utilisez
pandas_ai.run, deux paramètres sont nécessaires : la base de données avec laquelle vous travaillez et la question à laquelle vous cherchez une réponse, il renvoie le top 5 des pays les plus heureux sur la base du cadre de données fourni.
Poser des questions complexes
Vérifions s'il peut dessiner les graphiques pour nous ?
Oui, il trace le graphique, en fonction de la question que j'ai posée.
Effectuons une tâche complexe, en supprimant les valeurs
NAN de l'ensemble de données ci-dessous :
Voici le résultat que nous obtenons :
Mais lorsque j'imprime à nouveau la variable
df, elle supprime effectivement les valeurs
NAN de l'ensemble de données, en supprimant entièrement cette ligne.
La bibliothèque
pandasai offre un large éventail de possibilités, et vous pouvez les explorer en visitant la page officielle du dépôt, que j'ai partagée plus tôt.
Note : Il est important de noter que travailler avec
pandasai implique une tarification OpenAI, et vous pouvez trouver les informations tarifaires les plus récentes sur leur site web. En mai 2023, le prix est d'environ 1000 tokens pour 0,0200 $ (pour le modèle GPT-3.5-Turbo). Lorsque vous posez une question, il est essentiel de se rappeler que l'ensemble du cadre de données est transmis avec la question à chaque fois, de sorte que ce n'est peut-être pas la solution idéale pour traiter de grands ensembles de données.
Partager