Aracılığıyla paylaş


Önemli terimlerin makine öğrenmesi sözlüğü

Aşağıdaki liste, özel modellerinizi ML.NET'de oluştururken yararlı olan önemli makine öğrenmesi terimlerinin bir derlemesidir.

Doğruluk

sınıflandırmadoğruluk, doğru sınıflandırılmış öğelerin test kümesindeki toplam öğe sayısına bölünmesi sayısıdır. 0 (en az doğru) ile 1 (en doğru) arasında değişir. Doğruluk, model performansının değerlendirme ölçümlerinden biridir. duyarlık,geri çağırma ve F puanıile birlikte düşünün.

Eğrinin altındaki alan (AUC)

ikili sınıflandırmaiçinde, doğru pozitif oranı (y ekseninde) yanlış pozitifler oranına (x ekseninde) göre çizen eğrinin altındaki alanın değeri olan değerlendirme ölçümü. 0,5 (en kötü) ile 1 (en iyi) arasında değişir. ROC eğrisinin altındaki alan olarak da bilinir, yani alıcı çalışma karakteristik eğrisi. Daha fazla bilgi için Wikipedia'da Alıcı işletim özelliği makalesine bakın.

İkili sınıflandırma

etiketi iki sınıftan yalnızca birinin olduğu bir sınıflandırma. Daha fazla bilgi için Machine learning görevleri konusunun İkili sınıflandırma bölümüne bakın.

Kalibrasyon

Kalibrasyon, ikili ve çok sınıflı sınıflandırma için ham puanı sınıf üyeliğine eşleme işlemidir. Bazı ML.NET eğitmenlerin NonCalibrated soneki vardır. Bu algoritmalar, daha sonra bir sınıf olasılığına eşlenmesi gereken bir ham puan üretir.

Katalog

ML.NET katalog, ortak bir amaca göre gruplandırılmış bir uzantı işlevleri koleksiyonudur.

Örneğin, her makine öğrenmesi görevinin (ikili sınıflandırma, regresyon, derecelendirme vb.) kullanılabilir makine öğrenmesi algoritmaları (eğitmenler) kataloğu vardır. İkili sınıflandırma eğitmenleri için katalog: BinaryClassificationCatalog.BinaryClassificationTrainers.

Sınıflandırma

Veriler bir kategoriyi tahmin etmek için kullanıldığında, denetimli makine öğrenmesi görevi sınıflandırma olarak adlandırılır. İkili sınıflandırma yalnızca iki kategoriyi tahmin etmek anlamına gelir (örneğin, bir görüntüyü 'kedi' veya 'köpek' resmi olarak sınıflandırma). Çok Sınıflı sınıflandırma birden çok kategorinin tahminini ifade eder (örneğin, bir görüntüyü belirli bir köpek türünün resmi olarak sınıflandırırken).

Katsayı belirleme

regresyonverilerin bir modele ne kadar uygun olduğunu gösteren bir değerlendirme ölçümü. 0 ile 1 arasında değişir. 0 değeri, verilerin rastgele olduğu veya başka bir şekilde modele sığamayacağı anlamına gelir. 1 değeri, modelin veriyle tam olarak eşleşmesi anlamına gelir. Bu genellikle r2, R2veya r-squared olarak adlandırılır.

Veri

Veriler, tüm makine öğrenmesi uygulamalarının merkezinde yer alır. ML.NET verileri IDataView nesneler tarafından temsil edilir. Veri görünümü nesneleri:

  • sütun ve satırlardan oluşur
  • göz göre değerlendirilir, yani yalnızca bir işlem tarafından çağrıldığında veri yüklenir
  • her sütunun türünü, biçimini ve uzunluğunu tanımlayan bir şema içerir

Tahmincisi

IEstimator<TTransformer> arabirimini uygulayan ML.NET sınıfı.

Tahmin aracı, bir dönüşümün belirtimidir (hem veri hazırlama dönüşümü hem de makine öğrenmesi modeli eğitim dönüşümü). Tahmin araçları bir dönüşüm işlem hattına zincirlenebilir. Tahmin aracının veya tahmin aracı işlem hattının parametreleri, Fit çağrıldığında öğrenilir. Fit sonucu bir Transformatör.

Uzantı yöntemi

Bir sınıfın parçası olan ancak sınıfın dışında tanımlanan bir .NET yöntemi. Uzantı yönteminin ilk parametresi, uzantı yönteminin ait olduğu sınıfa yönelik statik bir this başvurusudur.

Uzantı yöntemleri, ML.NETtahmin aracı örneklerini oluşturmak için yaygın olarak kullanılır.

Özellik

Ölçülen fenomenin ölçülebilir özelliği, genellikle sayısal (çift) bir değerdir. Birden çok özellik Özellik vektör olarak adlandırılır ve genellikle double[]olarak depolanır. Özellikler, ölçülen fenomenin önemli özelliklerini tanımlar. Daha fazla bilgi için Wikipedia'da Özellik makalesine bakın.

Özellik mühendisliği

Özellik mühendisliği, bir dizi özellik tanımlamayı ve mevcut olgu verilerinden özellik vektörleri üreten yazılım geliştirmeyi (özellik ayıklama gibi) içerir. Daha fazla bilgi için Wikipedia'da özellik mühendisliği makalesine bakın.

F puanı

sınıflandırmaduyarlık dengeleyen vegeri çekmeyi sağlayan bir değerlendirme ölçümü.

Hiper Parametre

Makine öğrenmesi algoritmasının parametresi. Örnek olarak karar ormanında öğrenebileceğiniz ağaç sayısı veya gradyan azalma algoritmasındaki adım boyutu verilebilir. Hyperparameters değerleri modeli eğitmeden önce ayarlanır ve tahmin işlevinin parametrelerini bulma sürecini (örneğin, bir karar ağacındaki karşılaştırma noktaları veya doğrusal regresyon modelindeki ağırlıklar) yönetir. Daha fazla bilgi için Wikipedia'da Hiper Parametre makalesine bakın.

Etiket

Makine öğrenmesi modeliyle tahmin edilecek öğe. Örneğin, köpeğin cinsi veya gelecekteki bir hisse senedi fiyatı.

Günlük kaybı

sınıflandırmasınıflandırıcının doğruluğunu niteleyen bir değerlendirme ölçümü. Günlük kaybı ne kadar küçük olursa sınıflandırıcı da o kadar doğru olur.

Loss işlevi

Kayıp işlevi, eğitim etiketi değerleriyle model tarafından yapılan tahmin arasındaki farktır. Modelin parametreleri, kayıp işlevi en aza indirilerek tahmin edilir.

Farklı eğitmenler farklı kayıp işlevleri ile yapılandırılabilir.

Ortalama mutlak hata (MAE)

regresyonmodel hatalarının ortalaması olan ve model hatasının tahmin edilen etiket değeri ile doğru etiket değeri arasındaki uzaklık olduğu bir değerlendirme ölçümüdür.

Model

Geleneksel olarak, tahmin işlevinin parametreleri. Örneğin, doğrusal regresyon modelindeki ağırlıklar veya karar ağacındaki bölme noktaları. ML.NET model, bir etki alanı nesnesinin etiketi tahmin etmek için gereken tüm bilgileri (örneğin, resim veya metin) içerir. Bu, ML.NET modellerin hem gerekli özellik geliştirme adımlarını hem de tahmin işlevinin parametrelerini içerdiği anlamına gelir.

Çok sınıflı sınıflandırma

etiketi üç veya daha fazla sınıftan biri olduğu bir sınıflandırma. Daha fazla bilgi için Machine learning görevleri konusunun Çok Sınıflı sınıflandırma bölümüne bakın.

N-gram

Metin verileri için bir özellik ayıklama düzeni: N sözcük dizileri özellik değerine dönüşür.

Normal -leştirme

Normalleştirme, kayan nokta verilerini 0 ile 1 arasındaki değerlere ölçeklendirme işlemidir. ML.NET'de kullanılan eğitim algoritmalarının çoğu giriş özelliği verilerinin normalleştirilmesini gerektirir. ML.NET, normalleştirme için bir dizidönüştürmesi sağlar.

Sayısal özellik vektör

Yalnızca sayısal değerlerden oluşan vektör özelliği. Bu, double[]benzer.

Ardışık düzen

Modeli bir veri kümesine sığdırmak için gereken tüm işlemler. İşlem hattı veri içeri aktarma, dönüştürme, özellik geliştirme ve öğrenme adımlarından oluşur. İşlem hattı eğitildikten sonra modele dönüşür.

Kesinlik

sınıflandırmabir sınıfın duyarlığı, o sınıfa ait olarak doğru tahmin edilen öğelerin sayısıdır ve sınıfın ait olduğu tahmin edilen öğelerin toplam sayısına bölünür.

Anımsamak

sınıflandırmada, bir sınıfın geri çağırması, o sınıfa ait olarak doğru tahmin edilen öğelerin sayısıdır ve gerçekten sınıfa ait olan öğelerin toplam sayısına bölünür.

Normalleştirme

Normalleştirme, doğrusal modeli çok karmaşık olduğu için cezalı hale getirir. İki tür düzenlileştirme vardır:

  • $L_1$ normalleştirme, önemsiz özellikler için ağırlıkları sıfırlar. Bu tür bir normalleştirmeden sonra kaydedilen modelin boyutu küçülebilir.
  • $L_2$ normalleştirme, önemsiz özellikler için ağırlık aralığını en aza indirir. Bu daha genel bir işlemdir ve aykırı değerlere daha az duyarlıdır.

Gerileme

Çıkışın gerçek bir değer olduğu denetimli makine öğrenmesi görevi (örneğin, çift). Hisse senedi fiyatlarını tahmin etme örnekleri verilebilir. Daha fazla bilgi için Machine learning görevleri konusunun Regresyon bölümüne bakın.

Göreli mutlak hata

regresyoniçinde, doğru etiket değerleri arasındaki uzaklıkların toplamına ve tüm doğru etiket değerlerinin ortalamalarına bölünen tüm mutlak hataların toplamı olan değerlendirme ölçümü.

Göreli kare hatası

regresyoniçinde, doğru etiket değerleri ile tüm doğru etiket değerlerinin ortalaması arasındaki kareli uzaklıkların toplamına bölünen tüm kare mutlak hataların toplamı olan bir değerlendirme ölçümü.

Ortalama kare hatanın (RMSE) kökü

regresyoniçinde, hataların karelerinin ortalamasının karekökünü oluşturan bir değerlendirme ölçümü.

Puanlama

Puanlama, eğitilmiş bir makine öğrenmesi modeline yeni veri uygulama ve tahmin oluşturma işlemidir. Puanlama, çıkarım olarak da bilinir. Modelin türüne bağlı olarak puan ham değer, olasılık veya kategori olabilir.

Denetimli makine öğrenmesi

İstenen modelin henüz görünmeyen veriler için etiketi tahmin ettiği makine öğrenmesi alt sınıfı. Örnek olarak sınıflandırma, regresyon ve yapılandırılmış tahmin verilebilir. Daha fazla bilgi için Wikipedia'da Denetimli öğrenme makalesine bakın.

Antrenman

Belirli bir eğitim veri kümesi için modeli tanımlama işlemi. Doğrusal model için bu, ağırlıkları bulmak anlamına gelir. Bir ağaç için, bölünmüş noktaları tanımlamayı içerir.

Trafo

ITransformer arabirimini uygulayan bir ML.NET sınıfı.

Transformatör bir IDataView diğerine dönüştürür. Transformatör,tahmin aracı veya tahmin hattı eğitilerek oluşturulur.

Denetimsiz makine öğrenmesi

İstenen modelin verilerdeki gizli (veya gizli) yapıyı bulduğu makine öğrenmesinin alt sınıfı. Örnek olarak kümeleme, konu modelleme ve boyut azaltma verilebilir. Daha fazla bilgi için Wikipedia'da Denetimsiz öğrenme makalesine bakın.