Bagikan melalui


Cara kerja AI dan LLM generatif

AI generatif adalah jenis kecerdasan buatan yang mampu membuat konten asli, seperti bahasa alami, gambar, audio, dan kode. Output AI generatif didasarkan pada input yang disediakan oleh pengguna. Salah satu cara umum bagi pengguna untuk berinteraksi dengan AI generatif adalah melalui aplikasi obrolan yang menggunakan bahasa alami sebagai input mereka. ChatGPT, yang dikembangkan oleh OpenAI, adalah contoh populer dari ini. Aplikasi AI generatif yang menggunakan bahasa alami sebagai input didukung oleh model bahasa besar (LLM) untuk melakukan pemrosesan bahasa alami (NLP).

Cara kerja AI generatif

Semua AI generatif dibangun di atas model. Model-model ini dilatih dengan sekumpulan besar data dalam bentuk konten, seperti bahasa alami, gambar, audio, dan kode. Model AI generatif menggunakan pola yang diidentifikasi dalam data pelatihan untuk menghasilkan konten baru yang serupa secara statistik.

Input yang disediakan oleh pengguna digunakan oleh model AI untuk membangun output. Input pertama kali diurai ke dalam bentuk data yang dapat dipahami model. Model kemudian menggunakan data tersebut untuk mengidentifikasi pola yang cocok dari pelatihannya yang digabungkannya untuk membangun output akhir. Model AI generatif dirancang untuk menghasilkan konten unik, sehingga tidak akan menghasilkan output yang sama untuk input yang identik.

Aplikasi AI generatif yang mendukung bahasa alami sebagai input atau output menggunakan LLM untuk melakukannya. LLM digunakan untuk melakukan NLP, yang mengklasifikasikan teks input dan menentukan sentimennya. Klasifikasi dan analisis sentimen tersebut digunakan oleh model AI generatif untuk mengidentifikasi pola dan membangun output. Jika output adalah teks, LLM saja dapat digunakan untuk menghasilkannya. Jika output adalah audio atau gambar, model tambahan digunakan untuk menyediakan data dan pola untuk menghasilkan output dalam format tersebut.

Penggunaan umum AI generatif

Aplikasi AI generatif mendukung berbagai kasus penggunaan potensial dan output potensial, yang dieksplorasi di bagian berikut.

Pembuatan bahasa alami

Beberapa aplikasi AI generatif dapat menghasilkan output bahasa alami, seperti:

  • Ringkasan bernada profesional untuk profil LinkedIn
  • Deskripsi item yang kaya di etalase online
  • Ide untuk makanan sehat

Misalnya, mengingat input pengguna Beri saya tiga ide untuk sarapan sehat termasuk paprika, aplikasi AI generatif mungkin menghasilkan output berikut:

OK, berikut adalah tiga sarapan sehat yang mencakup paprika:

  1. Telur dan Merica Orak-arik: Celupkan beberapa paprika dan tumis dalam wajik sampai sedikit melembutkan. Kemudian, tambahkan beberapa telur kocok dan acak semuanya bersama-sama. Sajikan dengan roti panggang utuh untuk sarapan bergizi.

  2. Pepper dan Avocado Toast: Panggang sepotong roti utuh dan di atasnya dengan paprika irisan, alpukat tumbuk, dan taburan garam dan merica. Ini adalah cara yang bagus untuk mendapatkan beberapa lemak sehat dari avokad bersama dengan vitamin C dari paprika.

  3. Sarapan Burrito dengan Peppers: Tumis beberapa paprika dadu, bawang, dan telur orak-arik bersama-sama dalam wajik. Kemudian, sendok campuran ke tortilla utuh biji-bijian dan atasnya dengan beberapa salsa atau saau panas. Gulung dan nikmati sarapan yang memuaskan dan bergizi.

Pembuatan gambar

Beberapa aplikasi AI generatif menghasilkan output gambar dari input bahasa alami. Bergantung pada aplikasi dan modelnya, pengguna mungkin dapat menentukan:

  • Orang-orang atau hal-hal untuk muncul gambar
  • Gaya artistik untuk membuat gambar di
  • Referensi untuk menghasilkan gambar serupa

Pembuatan gambar dapat membuat avatar virtual untuk akun online, mendesain logo untuk bisnis, atau memberikan inspirasi artistik bagi kreator. Misalnya, pengguna dapat memasukkan permintaan, Membuat gambar gajah yang memakan burger. Aplikasi AI generatif mungkin menghasilkan output berikut:

Contoh AI menghasilkan gambar gajah yang memakan hamburger.

Pembuatan audio

Beberapa aplikasi AI generatif menghasilkan output audio dari input bahasa alami. Bergantung pada aplikasi dan modelnya, pengguna mungkin dapat:

  • Mensintesis suara alami yang terdengar dari teks input
  • Membuat musik dengan gaya tertentu atau menampilkan instrumen tertentu
  • Mengubah file audio input berdasarkan kriteria yang ditetapkan yang disediakan dalam bahasa alami

Pembuatan audio dapat memberikan respons lisan dari asisten suara digital, menambahkan instrumen dukungan ke lagu untuk produksi musik, atau mereproduksi suara asli pengguna dari rekaman referensi.

Pembuatan kode

Beberapa aplikasi AI generatif menghasilkan kode dari input bahasa alami. Bergantung pada aplikasi dan modelnya, pengguna mungkin dapat menghasilkan kode yang:

  • Dalam bahasa pilihan mereka
  • Menerima struktur input dan output tertentu
  • Menggunakan teknologi tertentu berdasarkan dokumentasi referensi mereka

Pembuatan kode dapat menyediakan implementasi cepat operasi umum, seperti mengurutkan atau memfilter data, mempercepat penerjemahan kode dari satu bahasa ke bahasa lain, atau menjawab pertanyaan tentang teknologi berdasarkan dokumentasi referensi tertentu. Misalnya, mengingat input "Tunjukkan kepada saya cara membuat kode permainan tic-tac-toe dengan C#", aplikasi AI generatif mungkin menghasilkan output berikut:

Berikut adalah contoh sederhana tentang bagaimana Anda dapat mengkodekan permainan tic-tac-toe di C#:

using System;

namespace TicTacToe
{
    class Program
    {
        static char[] board = { '1', '2', '3', '4', '5', '6', '7', '8', '9' };
        static int player = 1; // Player 1 will start
        static int choice; // The number the player chooses
        static int flag = 0; // Set the flag value to 0

        // Check if the position is already marked or not
        private static int CheckPosition(char mark)
        {
            for (int i = 0; i < 9; i++)
            {
                if (board[i] == mark)
                {
                    return 1;
                }
            }
            return 0;
        }

        // The rest of the generated code has been omitted for brevity
        // ...
    }
}

Kode ini membuat game tic-tac-toe berbasis konsol sederhana di C#. Ini menggunakan array dimensi tunggal untuk mewakili papan dan memeriksa kemenangan atau gambar setelah setiap pemindahan.

Cara kerja LLM

Saat melatih LLM, teks pelatihan pertama kali dipecah menjadi token. Setiap token mengidentifikasi nilai teks unik. Token bisa menjadi kata yang berbeda, kata parsial, atau kombinasi kata dan tanda baca. Setiap token diberi ID, yang memungkinkan teks direpresentasikan sebagai urutan ID token.

Setelah teks dipecah menjadi token, vektor kontekstual, yang dikenal sebagai penyematan, ditetapkan ke setiap token. Vektor penyematan ini adalah data numerik multinilai di mana setiap elemen vektor token mewakili atribut semantik token. Elemen vektor token ditentukan berdasarkan seberapa umum token digunakan bersama-sama atau dalam konteks yang sama.

Tujuannya adalah untuk memprediksi token berikutnya secara berurutan berdasarkan token sebelumnya. Bobot ditetapkan ke setiap token dalam urutan yang ada yang mewakili pengaruh relatifnya pada token berikutnya. Perhitungan kemudian dilakukan yang menggunakan bobot dan penyematan token sebelumnya untuk memprediksi nilai vektor berikutnya. Model kemudian memilih token yang paling mungkin untuk melanjutkan urutan berdasarkan vektor yang diprediksi.

Proses ini berlanjut secara berulang untuk setiap token dalam urutan, dengan urutan output yang digunakan secara regresif sebagai input untuk iterasi berikutnya. Output dibangun satu token pada satu waktu. Strategi ini dianalogikan dengan cara kerja penyelesaian otomatis, di mana saran didasarkan pada apa yang telah di ketik sejauh ini dan diperbarui dengan setiap input baru.

Selama pelatihan, urutan lengkap token diketahui, tetapi semua token yang datang setelah token yang saat ini dianggap diabaikan. Nilai yang diprediksi untuk vektor token berikutnya dibandingkan dengan nilai aktual dan kerugian dihitung. Bobot kemudian disesuaikan secara bertahap untuk mengurangi kehilangan dan meningkatkan model.