Démarrer avec l'IA sur Windows

Article
02/07/2025

La capacité à créer des expériences d’IA intelligentes sur et avec Windows se développe rapidement. Windows Copilot Runtime offre des fonctionnalités soutenues par l'IA et des APIs sur des PC Copilot+. Ces fonctionnalités sont en développement actif et s’exécutent localement en arrière-plan à tout moment. En savoir plus sur Windows Copilot Runtime.

Au-delà de Windows Copilot Runtime, Microsoft propose un large éventail de services d’IA, de support et de conseils. Pour commencer et apprendre à intégrer en toute sécurité l’IA pour vos besoins métier, explorez les conseils fournis dans notre documentation Windows AI, notamment :

Comment utiliser l’IA dans votre application Windows ?
choisir entre les services IA basés sur le cloud et locaux
Utiliser Windows Copilot Runtime
Utiliser des APIs basés sur le cloud
Utiliser un modèle personnalisé sur votre ordinateur local
Utiliser des pratiques d’IA responsable
FAQ

Comment utiliser l’IA dans votre application Windows ?

Voici quelques façons dont les applications Windows peuvent tirer parti des modèles Machine Learning (ML) pour améliorer leurs fonctionnalités et leur expérience utilisateur avec l’IA, notamment :

Les applications peuvent utiliser des modèles d’IA Générative pour comprendre les rubriques complexes pour résumer, réécrire, créer un rapport ou développer.
Les applications peuvent utiliser des modèles qui transforment du contenu de forme libre en un format structuré que votre application peut comprendre.
Les applications peuvent utiliser des modèles de recherche sémantique qui permettent aux utilisateurs de rechercher du contenu en signification et de trouver rapidement du contenu associé.
Les applications peuvent utiliser des modèles de traitement du langage naturel pour raisonner sur les exigences complexes du langage naturel, et planifier et exécuter des actions pour accomplir la demande de l’utilisateur.
Les applications peuvent utiliser des modèles de manipulation d’images pour modifier intelligemment des images, effacer ou ajouter des sujets, une mise à l’échelle ou générer du nouveau contenu.
Les applications peuvent utiliser des modèles de diagnostic prédictifs pour identifier et prédire les problèmes et guider l’utilisateur ou le faire pour eux.

Choisir entre les services IA basés sur le cloud et locaux

L’intégration de l’IA à votre application Windows peut être effectuée via deux méthodes principales : un modèle local ou un modèle basé sur le cloud. Il existe plusieurs aspects à prendre en compte lors de la détermination de l’option appropriée pour vos besoins.

Disponibilité des ressources
- Appareil local : l’exécution d’un modèle dépend des ressources disponibles sur l’appareil utilisé, notamment l’UC, le GPU, le NPU, la mémoire et la capacité de stockage. Cela peut être limité si l’appareil ne dispose pas d’une puissance de calcul élevée ou d’un stockage suffisant. Les petits modèles de langage (SLMs), comme Phi, sont plus idéaux pour une utilisation locale sur un appareil. PC Copilot+ proposent des modèles intégrés exécutés par Windows Copilot Runtime avec des fonctionnalités d’IA prêtes à l’emploi.
- Cloud : Les plateformes de services cloud, telles que Azure AI Services, offrent des ressources évolutives. Vous pouvez utiliser autant de puissance de calcul ou de stockage que nécessaire et payer uniquement pour ce que vous utilisez. Les modèles de langage volumineux (LLMs), comme les modèles de langage OpenAI , nécessitent plus de ressources, mais sont également plus puissants.
Confidentialité et sécurité des données
- Appareil local : Étant donné que les données restent sur l’appareil, l’exécution d’un modèle localement peut offrir des avantages en matière de sécurité et de confidentialité, avec la responsabilité de la sécurité des données sur l’utilisateur.
- Cloud : fournisseurs de cloud offrent des mesures de sécurité robustes, mais les données doivent être transférées vers le cloud, ce qui peut poser des problèmes de confidentialité des données pour le responsable de la maintenance des services d’application ou d’entreprise dans certains cas.
Accessibilité et Collaboration
- Appareil local : Le modèle et les données sont accessibles uniquement sur l’appareil, sauf si partagé manuellement. Cela a le potentiel de rendre la collaboration plus difficile sur les données de modèle.
- Cloud : Le modèle et les données sont accessibles depuis n’importe où avec une connectivité Internet. Cela peut être préférable pour les scénarios de collaboration.
Coût
- Appareil local : Il n’existe aucun coût supplémentaire au-delà de l’investissement initial dans le matériel de l’appareil.
- Cloud : Alors que les plateformes cloud fonctionnent sur un modèle de paiement à l’utilisation, les coûts peuvent s’accumuler en fonction des ressources utilisées et de la durée d’utilisation.
maintenance et mises à jour
- appareil local : l’utilisateur est responsable de la maintenance du système et de l’installation des mises à jour.
- Cloud : Maintenance, mises à jour système et nouvelles mises à jour de fonctionnalités sont gérées par le fournisseur de services cloud, ce qui réduit la surcharge de maintenance pour l’utilisateur.

Utilisez Windows Copilot Runtime.

Lorsqu’un modèle IA local est la bonne solution, vous pouvez utiliser Windows Copilot Runtime fonctionnalités pour intégrer des services IA pour les utilisateurs sur des PC Copilot+. Voici quelques-unes de ces fonctionnalités IA prêtes à l’emploi que vous pouvez tirer parti de votre application Windows :

Phi Silicon: modèle de langage local prêt à l’emploi.
Recall: API UserActivity qui utilise l’IA pour vous aider à effectuer une recherche dans votre activité passée, prise en charge par Click to Do, fonctionnalité qui utilise Phi Silicon pour connecter des actions au contenu (texte ou images) trouvé par Recall.
AI Imaging: pour mettre à l’échelle et affiner des images à l’aide de l’IA (super-résolution d’images), ainsi que pour identifier des objets au sein d’une image (segmentation d’images).
Windows Studio Effects: pour appliquer des effets IA à la caméra de l’appareil ou au microphone intégré.

En savoir plus sur les fonctionnalités disponibles dans la Vue d'ensemble Windows Copilot Runtime.

Utiliser des APIs basés sur le cloud

Si une solution basée sur le cloud fonctionne mieux pour votre scénario d’application Windows, vous serez peut-être intéressé par certains des didacticiels ci-dessous.

De nombreux APIs sont disponibles pour accéder aux modèles basés sur le cloud pour alimenter les fonctionnalités d’IA dans votre application Windows, que ces modèles soient personnalisés ou prêts à l’emploi. L’utilisation d’un modèle basé sur le cloud peut permettre à votre application de rester rationalisée en déléguant des tâches gourmandes en ressources vers le cloud. Voici quelques ressources pour vous aider à ajouter des APIs basées sur l’IA basée sur le cloud offertes par Microsoft ou OpenAI :

Ajouter des achèvements de conversation OpenAI à votre application de bureau WinUI 3 / Windows App SDK: didacticiel sur l’intégration des fonctionnalités d’achèvement OpenAI ChatGPT basées sur le cloud dans une application de bureau WinUI 3 / Windows App SDK.
Ajouter DALL-E à votre application de bureau WinUI 3 / Windows App SDK: didacticiel sur l’intégration des fonctionnalités de génération d’images OpenAI DALL-E basées sur le cloud dans une application de bureau WinUI 3 /Windows App SDK.
Créer une application de recommandation avec .NET MAUI et ChatGPT: didacticiel sur la création d’un exemple d’application recommandation qui intègre les fonctionnalités d’achèvement OpenAI ChatGPT basées sur le cloud dans une application .NET MAUI.
Ajouter DALL-E à votre application de bureau Windows .NET MAUI: didacticiel sur l’intégration des fonctionnalités de génération d’images Open DALL-E AI basées sur le cloud dans une application .NET MAUI.
Azure OpenAI Service: si vous souhaitez que votre application Windows accède aux modèles OpenAI, tels que GPT-4, GPT-4 Turbo avec Vision, GPT-3.5-Turbo, DALLE-3 ou la série de modèles Embeddings, avec les fonctionnalités de sécurité et d’entreprise ajoutées d’Azure, vous trouverez des conseils dans cette documentation Azure OpenAI.
Azure AI Services: Azure offre une suite complète de services IA disponibles via les kits SDK de bibliothèque de client et de APIs REST dans les langages de développement populaires. Pour plus d’informations, consultez la documentation de chaque service. Ces services basés sur le cloud aident les développeurs et les organisations à créer rapidement des applications intelligentes, à la pointe de la technologie, prêtes pour le marché et responsables avec des modèles et des solutions prêtes à l'emploi, préconçues et personnalisables APIs. Les exemples d’applications incluent le traitement en langage naturel des conversations, la recherche, l’analyse, la traduction, le message, la vision et la prise de décision.

Utiliser un modèle personnalisé sur votre ordinateur local

Si vous avez la possibilité d’entraîner votre propre modèle à l’aide de vos propres données privées avec des plateformes telles que TensorFlow ou PyTorch. Vous pouvez intégrer ce modèle personnalisé à votre application Windows en l’exécutant localement sur le matériel de l’appareil à l’aide de ONNX Runtime et de AI Toolkit pour Visual Studio Code.

AI Toolkit pour Visual Studio Code est une extension VS Code qui vous permet de télécharger et d’exécuter des modèles IA localement, notamment l’accès à l’accélération matérielle pour améliorer les performances et l’échelle via DirectML. L’IA Tookit peut également vous aider à :

Test de modèles dans un terrain de jeu intuitif ou dans votre application avec une API REST.
Réglage précis de votre modèle IA, localement ou dans le cloud (sur une machine virtuelle) pour créer de nouvelles compétences, améliorer la fiabilité des réponses, définir le ton et le format de la réponse.
Réglage des modèles populaires de langues à faibles ressources (SLMs), comme Phi-3 et Mistral.
Déployez votre fonctionnalité IA dans le cloud ou avec une application qui s’exécute sur un appareil.
Tirez parti de l’accélération matérielle pour améliorer les performances avec les fonctionnalités IA à l’aide de DirectML. DirectML est une API de bas niveau qui permet à votre matériel d’appareil Windows d’accélérer les performances des modèles ML à l’aide du GPU d’appareil ou du NPU. L’appairage de DirectML avec le ONNX Runtime est généralement le moyen le plus simple pour les développeurs d’apporter l’IA accélérée matériellement à leurs utilisateurs à grande échelle. En savoir plus : Vue d’ensemble de DirectML.

Vous pouvez également examiner ces concepts de réglage de modèle pour ajuster un modèle préentraîné afin de mieux adapter vos données.

Rechercher des modèles open source

Vous pouvez trouver des modèles ML open source sur le web, voici quelques-uns des modèles les plus populaires :

Hugging Face: hub de plus de 10 000 modèles ML préentraînés pour le traitement du langage naturel, alimenté par la bibliothèque Transformers. Vous trouverez des modèles pour la classification de texte, la réponse aux questions, la synthèse, la traduction, la génération, etc.
ONNX Model Zoo: collection de modèles ML préentraînés au format ONNX qui couvrent un large éventail de domaines et de tâches, tels que la vision par ordinateur, le traitement du langage naturel, la parole, etc.
Qualcomm AI Hub: une plateforme qui fournit l’accès à un large éventail de modèles et d’outils ML optimisés pour les appareils Snapdragon. Vous trouverez des modèles pour le traitement d’images, de vidéos, d’audio et de capteurs, ainsi que des frameworks, des bibliothèques et des kits SDK pour la création et le déploiement d’applications ML sur des appareils mobiles. L’IA Hub d’Intelligence Artificielle offre également des didacticiels, des guides et un support communautaire pour les développeurs et les chercheurs.
Pytorch Hub: référentiel de modèles préentraîné conçu pour faciliter la reproductibilité de la recherche et permettre de nouvelles recherches. Il s’agit d’une API et d’un flux de travail simples qui fournissent les blocs de construction de base pour améliorer la reproductibilité de la recherche machine learning. PyTorch Hub se compose d’un référentiel de modèles préentraîné conçu spécifiquement pour faciliter la reproductibilité de la recherche.
TensorFlow Hub: référentiel de modèles ML préentraînés et de composants réutilisables pour TensorFlow, qui est une infrastructure populaire pour la création et l’apprentissage de modèles ML. Vous pouvez trouver des modèles pour le traitement d’images, de texte, de vidéo et d’audio, ainsi que l’apprentissage par transfert et l’ajustement.
Zoo de modèles: plateforme qui organise et classe les meilleurs modèles ML open source pour diverses infrastructures et tâches. Vous pouvez parcourir les modèles par catégorie, infrastructure, licence et évaluation, et voir des démonstrations, du code et des documents pour chaque modèle.

Certaines bibliothèques de modèles ne sont pas destinées à être personnalisées et distribuées via une application, mais sont des outils utiles pour l’exploration et la découverte pratiques dans le cadre du cycle de vie de développement, tels que :

Ollama: Ollama est un marché de modèles ML prêts à l’emploi pour différentes tâches, telles que la détection des visages, l’analyse des sentiments ou la reconnaissance vocale. Vous pouvez parcourir, tester et intégrer les modèles dans votre application en quelques clics.
LM Studio: Lmstudio est un outil qui vous permet de créer des modèles ML personnalisés à partir de vos propres données, à l’aide d’une interface glisser-déplacer. Vous pouvez choisir parmi différents algorithmes ML, prétraiter et visualiser vos données, et entraîner et évaluer vos modèles.

Utiliser des pratiques d’IA responsable

Chaque fois que vous incorporez des fonctionnalités IA dans votre application Windows, nous vous recommandons vivement de suivre le guide pratique Développement d’applications et de fonctionnalités d’IA générative responsable sur Windows.

Ces conseils vous aideront à comprendre les stratégies de gouvernance, les pratiques et les processus, à identifier les risques, à recommander des méthodes de test, à utiliser des mesures de sécurité telles que les modérateurs et les filtres, et à appeler des considérations spécifiques lors de la sélection d’un modèle qui est sûr et responsable de travailler avec.

Windows Copilot Runtime modèles IA génératifs sur appareil peuvent vous aider à appliquer des fonctionnalités de sécurité de contenu locales, telles que des moteurs de classification sur appareil pour le contenu dangereux et une liste de blocs par défaut. Microsoft hiérarchise la prise en charge des développeurs pour créer des expériences IA fiables et fiables avec des modèles locaux sur Windows.

Ressources supplémentaires

Phi Silica, un PML sur appareil petit mais puissant (Blogs Windows)
Galerie d’exemples AI sur Windows : des exemples illustrant des façons d’intégrer l’IA dans les applications Windows.
FAQ sur l’utilisation de l’IA avec Windows : des questions fréquentes sur la terminologie et les concepts liés à l’utilisation de l’IA dans un contexte Windows, couvrant les questions telles que « Qu’est-ce que DirectML ? », « Qu’est-ce que ONNX ? », « Qu’est-ce qu’un NPU ? », « Qu’est-ce qu’un SLM ? », « Qu’est-ce que l’inférence ? », « Qu’est-ce que l’ajustement ? », etc.
ONNX: norme ouverte pour représenter et échanger des modèles ML entre différents frameworks et plateformes. Si vous trouvez un modèle ML préentraîné au format ONNX, vous pouvez utiliser ONNX Runtime (ORT) pour charger et exécuter le modèle dans votre application Windows. ORT vous permet d’accéder aux fonctionnalités d’inférence accélérées matérielles de votre appareil et d’optimiser les performances de votre modèle ML. Si vous avez un modèle ML préentraîné dans un autre format, tel que PyTorch ou TensorFlow, vous pouvez le convertir en ONNX à l’aide d’un outil d’optimisation de modèle comme Olive. Pour obtenir de l’aide sur l’utilisation d’Olive, consultez Fine-tune SLM with Microsoft Olive (Journey Series for Generative AI Application Architecture). Pour obtenir des didacticiels sur la création et l’utilisation de modèles ONNX, consultez didacticiels ONNX sur GitHub. Pour obtenir des exemples illustrant comment utiliser des modèles ONNX dans une application Windows, consultez la galerie d'exemples de l'IA dans Windows.
Bien démarrer avec Phi3 et d’autres modèles de langage dans votre application Windows avec ONNX Runtimel’IA générative
Bien démarrer avec les modèles ONNX dans votre application WinUI avec ONNX Runtime
API WebNN pour les applications web: une norme web permettant d’accéder à l’accélération matérielle des réseaux neuronaux dans les navigateurs, basée sur WebIDL et JavaScript APIs. Il permet aux développeurs web de créer et d’exécuter efficacement des modèles Machine Learning côté client, sans compter sur les services cloud ou les bibliothèques natives. Les exemples WebNN sur GitHub. Exemples WebNN utilisant ONNX Runtime dans la galerie d'exemples d'IA sur Windows.
PyTorch: infrastructure de deep learning open source très populaire disponible avec une interface Python et C++. Il s’agit probablement du format le plus courant que vous trouverez pour les modèles ML. Si vous souhaitez utiliser des modèles PyTorch ML dans votre application Windows (C# ou C++) ou dans une application web, vous pouvez utiliser TorchSharp et LibTorch, qui sont des liaisons .NET et C++ pour la bibliothèque PyTorch. TorchSharp et LibTorch vous permettent de créer, charger et manipuler des tenseurs, générer et exécuter des réseaux neuronaux, et enregistrer et charger des modèles à l’aide du format PyTorch. Pour obtenir des exemples, consultez Exemples TorchSharp, TorchScript pour le déploiement, Exemples PyTorch C++. Pour les applications web, consultez Créer une application web avec ONNX Runtime. Pour obtenir des exemples d’exécution de modèles PyTorch avec DirectML, consultez la galerie d'exemples d'IA sur Windows.
TensorFlow est une autre bibliothèque de logiciels open source populaire pour le Machine Learning et l’intelligence artificielle utilisées pour créer et déployer des modèles Machine Learning pour différentes tâches.

Partager via

Démarrer avec l'IA sur Windows

Comment utiliser l’IA dans votre application Windows ?

Choisir entre les services IA basés sur le cloud et locaux

Utilisez Windows Copilot Runtime.

Utiliser des APIs basés sur le cloud

Utiliser un modèle personnalisé sur votre ordinateur local

Rechercher des modèles open source

Utiliser des pratiques d’IA responsable

Ressources supplémentaires

Commentaires

Ressources supplémentaires