Carichi di lavoro di intelligenza artificiale in Azure

Articolo
01/08/2025

Questo articolo risolve le problematiche dell'architettura della progettazione di carichi di lavoro di intelligenza artificiale. Si concentra sulle funzionalità non deterministiche, sulla progettazione di dati e applicazioni e sulle operazioni. Le raccomandazioni si basano sui principi di Azure Well-Architected Framework e includono informazioni dettagliate da implementazioni di Azure riuscite.

Questi articoli sono destinati ai proprietari dei carichi di lavoro e agli stakeholder tecnici, ad esempio architetti, responsabili dello sviluppo e responsabili IT. I ruoli specializzati di intelligenza artificiale e dati, ad esempio data scientist, devono anche essere consapevoli di queste linee guida perché la collaborazione tra diversi ruoli e team è un aspetto chiave.

Nota

Azure offre vari servizi di intelligenza artificiale che è possibile integrare nel carico di lavoro o utilizzarli per costruire nuove soluzioni attorno ad esso. A seconda delle esigenze aziendali, è possibile scegliere tra soluzioni SaaS (Software as a Service) completamente gestite, soluzioni PaaS (Platform as a Service) o creare una soluzione di intelligenza artificiale personalizzata. I servizi di Azure specifici e le relative funzionalità non sono trattati qui. Per tali informazioni, è consigliabile fare riferimento alla rispettiva documentazione del prodotto.

Inoltre, alcuni carichi di lavoro di intelligenza artificiale non sono inclusi nell'ambito, ad esempio:

Carichi di lavoro realizzati tramite offerte con poco codice e senza codice, ad esempio Copilot Studio.
Carichi di lavoro che richiedono l'elaborazione ad alte prestazioni.
Carichi di lavoro che non implementano casi d'uso generativi o discriminanti di intelligenza artificiale.

Che cos'è un carico di lavoro di intelligenza artificiale?

Nel contesto di Well-Architected Framework, un carico di lavoro di intelligenza artificiale soddisfa le esigenze delle attività predittive, discriminatorie o generative. Si concentra sulle funzionalità etiche, adattandosi alle tecnologie di IA in rapida evoluzione e rimanendo pertinenti e spiegabili. Applicare i pilastri di Well-Architected Framework a ogni punto decisionale per garantire che il sistema sia affidabile, sicuro, efficiente e conveniente.

I carichi di lavoro di intelligenza artificiale sono diversi da quelli tradizionali perché sostituiscono funzionalità deterministiche in parti del carico di lavoro con un comportamento non deterministico che risolve le situazioni in cui i risultati fissi sono poco pratici. Combinano invece codice e dati in un'entità o in un modello , per consentire esperienze uniche che i sistemi tradizionali non possono fornire.

Prima di iniziare le strategie di progettazione, considerare prima questi punti chiave.

Acquisire familiarità con le grandi categorie di modelli

Generative AI: usa Machine Learning per creare in modo autonomo nuovi contenuti. Include modelli linguistici che possono essere personalizzati con i dati utente o usati come servizi come il servizio Azure OpenAI. Ad esempio, GPT, un tipo di modello linguistico, è specializzato nella simulazione del linguaggio di conversazione umana ed è ideale per le esperienze di chat e linguaggio naturale.

Casi d'uso: l'intelligenza artificiale generativa può produrre articoli, storie e arte. Può anche generare dati sintetici per bilanciare i set di dati e rendere i chatbot più umani.
Intelligenza Artificiale Discriminativa: utilizza la programmazione esplicita per eseguire attività specifiche basate su regole e algoritmi. È suddiviso in:
- Modello: I sistemi predittivi trovano schemi basati su addestramento derivato da osservazioni precedenti per fare previsioni, ma non possono creare nuovi contenuti o adattarsi autonomamente.
- non basati su modelli: gli agenti autonomi seguono regole predefinite per interagire con i sistemi, ad esempio i personaggi del videogiochi.
Caso d'uso: l'intelligenza artificiale discriminante viene usata per l'analisi predittiva, i sistemi di raccomandazione e il rilevamento delle frodi.

Questa serie di articoli illustra diversi carichi di lavoro di intelligenza artificiale e si concentra su tipi specifici come i modelli linguistici quando necessario.

Importante

Quando si sceglie tra modelli generativi e discriminanti, considerare l'attività da eseguire. I modelli generativi creano nuovi dati. I modelli discriminanti classificano i dati esistenti in base alle funzionalità. Per le attività di classificazione o regressione, selezionare modelli adatti al processo. Ad esempio, un modello linguistico che può classificare può essere più versatile di uno che classifica solo .

Valutare le opzioni di compilazione e acquisto

Se le risposte generiche sono accettabili, un modello predefinito o una soluzione basata su servizi di intelligenza artificiale che usa l'elaborazione opaca deve essere sufficiente per il carico di lavoro. Tuttavia, se sono necessari dati specifici per l'azienda o si hanno requisiti di conformità, creare un modello personalizzato.

Quando si sceglie tra un modello personalizzato, un modello predefinito o un servizio, considerare questi fattori:

Controllo Dati: I modelli personalizzati offrono maggiore controllo sui dati sensibili. I modelli predefiniti sono più facili per le attività generali.
Personalizzazione: I modelli personalizzati sono migliori per esigenze uniche. I modelli predefiniti potrebbero non avere flessibilità.
Costi e manutenzione: i modelli personalizzati necessitano di manutenzione e risorse in corso. I modelli predefiniti hanno in genere costi iniziali inferiori e meno carico di infrastruttura.
Prestazioni: I servizi integrati offrono un'infrastruttura e una scalabilità ottimizzate. Sono ideali per esigenze di bassa latenza o scalabilità elevata.
Esperienza: i modelli personalizzati richiedono un team qualificato. I modelli predefiniti sono spesso più rapidi da distribuire e usare più facilmente se l'esperienza è limitata.

Importante

La creazione e la gestione del proprio modello richiedono molte risorse, tempo e competenze. È importante eseguire ricerche approfondite prima di decidere. In genere, la scelta di un modello predefinito o di un servizio gestito è un'opzione migliore.

Quali sono le sfide comuni?

i costi di calcolo: le funzioni di intelligenza artificiale possono essere costose a causa di esigenze di calcolo elevate e le esigenze di calcolo possono variare in base alla progettazione del carico di lavoro. Comprendere i requisiti e scegliere il servizio appropriato per gestire i costi.
Requisiti di sicurezza e conformità: le soluzioni preconfezionate potrebbero non soddisfare le esigenze di sicurezza e conformità. Opzioni di ricerca per evitare oneri non necessari.
volume di dati: la gestione di volumi di dati di grandi dimensioni in vari formati comporta problemi di protezione delle informazioni riservate e di un'elaborazione efficiente. L'ottimizzazione dei costi di archiviazione, elaborazione e trasferimento deve essere un'attività in corso.
decadimento del modello: i modelli possono degradarsi nel tempo, con risultati imprecisi. Il test dei sistemi di intelligenza artificiale è complesso a causa della loro casualità.
sfide alle competenze: i nuovi carichi di lavoro di intelligenza artificiale potrebbero richiedere ruoli specializzati e nuovi processi operativi che richiedono un training completo.
Ritmo dell'innovazione dell'IA: Adottare le tecnologie più recenti può essere allettante per rimanere all'avanguardia. Valutare attentamente le nuove tecnologie per assicurarsi che migliorino l'esperienza utente e non solo aggiungere complessità per l'aggiornamento.
requisiti etici: determinare chiaramente se il caso d'uso è un obiettivo etico per l'IA. La gestione degli standard etici è necessaria in tutte le fasi di pianificazione e implementazione per assicurarsi di creare un sistema responsabile.

Come usare queste linee guida

✔ Inizia con la metodologia di progettazione, che delinea le motivazioni e i temi ricorrenti nelle aree tecniche e operative. Questo approccio sistematico consente di definire i requisiti e le strategie di progettazione. Rivedere questa metodologia quando si affrontano scelte incerte per rimanere allineati agli obiettivi complessivi del carico di lavoro. Fornisce anche un framework per collaborare con gli stakeholder per giustificare le decisioni tecniche e incorporare il feedback dei clienti per un miglioramento continuo.

✔ Procedere ai principi di progettazione per vedere in che modo la metodologia di progettazione è allineata ai pilastri principali di Well-Architected Framework. Considerare l'evoluzione della crescita. Valutare i principi sottostanti per tutti i pilastri collettivamente, inclusi i compromessi.

✔ Concentrarsi sulle aree di progettazione che hanno il maggior effetto sulla soluzione. Ogni area include considerazioni e consigli per guidare l'utente nelle decisioni di progettazione.

✔ Usare lo strumento di revisione valutazione per valutare l'idoneità del carico di lavoro di intelligenza artificiale ottimizzato nell'ambiente di produzione.

Modelli e aree di progettazione tipiche dell'architettura

Il diagramma seguente illustra il flusso dei dati attraverso il sistema dalla raccolta iniziale all'interazione dell'utente finale.

L'architettura evidenzia l'integrazione di diversi componenti per abilitare l'elaborazione efficiente dei dati, l'ottimizzazione del modello e la distribuzione di applicazioni in tempo reale nelle soluzioni guidate dall'intelligenza artificiale. Include moduli come origini dati, elaborazione dati, training del modello, distribuzione di modelli e interfacce utente.

Nella tabella seguente vengono descritte alcune aree di progettazione chiave correlate a tale modello.

Aree di progettazione
progettazione delle applicazioni: Scopri le considerazioni specifiche per i carichi di lavoro di intelligenza artificiale che potrebbero avere un effetto significativo sugli standard di progettazione delle applicazioni esistenti.
piattaforma applicativa: determinare le migliori piattaforme da usare per supportare le funzioni del carico di lavoro dell'intelligenza artificiale, ad esempio l'hosting di modelli, l'allenamento del modello e l'inferenza.
Progettazione dei dati di addestramento: Progettare strategie per l'inserimento dei dati, la pre-elaborazione, la conservazione e la governance per gestire i dati di addestramento del modello.
dati di base: strategie di progettazione per ottimizzare la ricerca e il recupero, rispettando allo stesso tempo i requisiti di sicurezza e conformità per i dati di base.
piattaforma dati: determinare la piattaforma di hosting migliore per gestire le grandi quantità e potenzialmente molti formati di dati usati dal carico di lavoro.
operazioni di Machine Learning e operazioni di intelligenza artificiale generative: stabilire procedure DevOps moderne per supportare funzioni e sistemi di intelligenza artificiale generativi.
operazioni del carico di lavoro: modernizzare le procedure operative con nuovi approcci e aggiungere ruoli e formazione specializzati.
test e valutazione: sviluppare strategie di test e valutazione per misurare caratteristiche quali accuratezza, precisione, sensibilità e specificità tramite metriche destinate ai carichi di lavoro di intelligenza artificiale.
Personas del carico di lavoro: Comprendere come le personas sono coinvolte nel ciclo di vita completo del carico di lavoro di intelligenza artificiale per aiutare a garantire che il team sia pienamente in grado di costruirlo e supportarlo.
IA responsabile: prestare particolare attenzione all'esperienza utente e alle implicazioni etiche del rilascio della soluzione di intelligenza artificiale al pubblico. L'IA offre opportunità incredibili per nuovi prodotti e servizi, ma comporta anche un notevole grado di rischio.

Suggerimento

Ogni decisione architetturale prevede una serie di considerazioni e una serie di compromessi riconosciuti che bilanciano diversi aspetti del framework. Questi compromessi sono indicati da questa icona .

Passaggio successivo

Metodologia di progettazione

Condividi tramite