Aracılığıyla paylaş


Ödül puanları kişiselleştirmenin başarılı olduğunu gösterir

Önemli

20 Eylül 2023 tarihinden itibaren yeni Kişiselleştirme kaynakları oluşturamayacaksınız. Kişiselleştirme hizmeti 1 Ekim 2026'da kullanımdan kaldırılıyor.

Ödül puanı, kişiselleştirme seçimi olan RewardActionID'nin kullanıcı için ne kadar iyi sonuçlandığına işaret eder. Ödül puanının değeri, kullanıcı davranışı gözlemlerine göre iş mantığınıza göre belirlenir.

Kişiselleştirici, ödülleri değerlendirerek makine öğrenmesi modellerini eğitiyor.

Kişiselleştirme kaynağınız için Azure portalında varsayılan ödül puanını yapılandırmayı öğrenin.

Ödül puanını Kişiselleştirme'ye göndermek için Reward API'sini kullanma

Rewards, Reward API tarafından Kişiselleştirici'ye gönderilir. Genellikle, ödül 0 ile 1 arasında bir sayıdır. -1 değeriyle negatif bir ödül, belirli senaryolarda mümkündür ve yalnızca pekiştirme öğrenmesi (RL) konusunda deneyimliyseniz kullanılmalıdır. Kişiselleştirici, modeli zaman içinde mümkün olan en yüksek ödül toplamını elde etmek için eğitir.

Ödüller, kullanıcı davranışı gerçekleştikten sonra gönderilir ve bu da günler sonra olabilir. Kişiselleştiricinin bir etkinliğin ödülü olmadığı kabul edilene veya Azure portalındaki Ödül Bekleme Süresi ile varsayılan ödül yapılandırılana kadar bekleyeceği maksimum süre.

Bir etkinliğin ödül puanı Ödül Bekleme Süresi içinde alınmadıysa, Varsayılan Ödül uygulanır. Varsayılan Ödül genellikle sıfır olarak yapılandırılır.

Ödüller için dikkate alınacak davranışlar ve veriler

Ödül puanı bağlamında şu sinyalleri ve davranışları göz önünde bulundurun:

  • Seçenekler söz konusu olduğunda öneriler için doğrudan kullanıcı girişi ("X mi demek istiyorsunuz?").
  • Oturum uzunluğu.
  • Oturumlar arasındaki süre.
  • Kullanıcının etkileşimlerinin yaklaşım analizi.
  • Bot kullanıcıdan yararlılık ve doğruluk hakkında geri bildirim istediği doğrudan sorular ve mini anketler.
  • Uyarılara yanıt verme veya uyarılara yanıt verme gecikmesi.

Ödül puanlarını oluşturma

İş mantığınızda bir Reward puanı hesaplanmalıdır. Puan şu şekilde gösterilebilir:

  • Bir kez gönderilen tek bir numara
  • Hemen gönderilen bir puan (0,8 gibi) ve daha sonra gönderilen ek puan (genellikle 0,2).

Varsayılan Ödüller

Ödül Bekleme Süresi içinde ödül alınmazsa, Derece çağrısından bu yana olan süre olan Kişiselleştirme, Varsayılan Ödülü bu Derece olayına örtük olarak uygular.

Birden çok faktörle ödül oluşturma

Etkili kişiselleştirme için ödül puanını birden çok faktöre göre oluşturabilirsiniz.

Örneğin, video içeriğinin listesini kişiselleştirmek için şu kuralları uygulayabilirsiniz:

Kullanıcı davranışı Kısmi puan değeri
Kullanıcı üst öğeye tıkladı. +0,5 ödül
Kullanıcı bu öğenin gerçek içeriğini açtı. +0,3 ödül
Kullanıcı içeriğin 5 dakikasını veya %30'unu (hangisi daha uzunsa) izledi. +0,2 ödül

Ardından toplam ödülü API'ye gönderebilirsiniz.

Ödül API'sini birden çok kez çağırma

Ödül API'sini farklı ödül puanları göndererek aynı olay kimliğini kullanarak da çağırabilirsiniz. Kişiselleştirici bu ödülleri aldığında, Kişiselleştirici yapılandırmasında belirtilen şekilde toplayarak bu etkinliğin son ödülünü belirler.

Toplama değerleri:

  • İlk: Etkinlik için alınan ilk ödül puanını alır ve gerisini atar.
  • Toplam: eventId için toplanan tüm ödül puanlarını alır ve bunları bir araya ekler.

Ödül Bekleme Süresinden sonra alınan bir etkinliğin tüm ödülleri atılır ve modellerin eğitimini etkilemez.

Ödül puanları ekleyerek, nihai ödülünüz beklenen puan aralığının dışında olabilir. Bu, hizmetin başarısız olmasına neden olmaz.

Ödül puanını hesaplamak için en iyi yöntemler

  • Başarılı kişiselleştirmenin gerçek göstergelerini göz önünde bulundurun: Tıklamalar açısından düşünmek kolaydır, ancak iyi bir ödül, kullanıcılarınızın yapmak istedikleri yerine ne elde etmelerini istediğinize bağlıdır. Örneğin tıklamaları ödüllendirmek, tıklamaya açık içeriğin seçilmesine neden olabilir.

  • Kişiselleştirmenin ne kadar iyi çalıştığı için bir ödül puanı kullanın: Bir film önerisini kişiselleştirmek, kullanıcının filmi izlemesine ve yüksek derecelendirmeye sahip olmasına neden olur. Film derecelendirmesi muhtemelen birçok şeye (oyunculuğun kalitesi, kullanıcının ruh hali) bağlı olduğundan, kişiselleştirmenin ne kadar iyi çalıştığı için iyi bir ödül sinyali değildir. Ancak, filmin ilk birkaç dakikasını izleyen kullanıcı, kişiselleştirme etkinliğinin daha iyi bir sinyali olabilir ve 5 dakika sonra 1 ödül göndermek daha iyi bir sinyal olacaktır.

  • Ödüller yalnızca RewardActionID için geçerlidir: Kişiselleştirici, RewardActionID'de belirtilen eylemin etkinliğini anlamak için ödülleri uygular. Diğer eylemleri görüntülemeyi seçerseniz ve kullanıcı bunları seçerse ödül sıfır olmalıdır.

  • İstenmeyen sonuçları göz önünde bulundurun: Etik ve sorumlu kullanım ile sorumlu sonuçlara yol açan ödül işlevleri oluşturun.

  • Artımlı Ödülleri kullanma: Daha küçük kullanıcı davranışları için kısmi ödüller eklemek, Kişiselleştirme'nin daha iyi ödüller elde etmesine yardımcı olur. Bu artımlı ödül, algoritmanın son istenen davranışta kullanıcıyla etkileşime geçmek üzere olduğunu bilmesini sağlar.

    • Bir film listesi gösteriyorsanız, kullanıcı daha fazla bilgi görmek için bir süre için ilkinin üzerine gelirse, bazı kullanıcı etkileşiminin gerçekleştiğini belirleyebilirsiniz. Davranış, 0,1 ödül puanıyla sayılabilir.
    • Kullanıcı sayfayı açtıysa ve sonra çıktıysa ödül puanı 0,2 olabilir.

Ödül bekleme süresi

Kişiselleştirme, modeli eğitmek için Reward çağrılarında gönderilen ödüllerle bir Rank çağrısının bilgilerini ilişkilendirir ve bu da farklı zamanlarda gelebilir. Kişiselleştirici, karşılık gelen Sıralama çağrısı gerçekleştiğinde başlayarak, tanımlı sınırlı bir süre için ödül puanını bekler. Bu, Rank çağrısı ertelenmiş etkinleştirme](concept-active-inactive-events.md) kullanılarak yapılmış olsa bile yapılır.

Ödül Bekleme Süresi sona erdiğinde ve ödül bilgisi yoksa, eğitim için bu etkinliğe varsayılan bir ödül uygulanır. 10 dakika, 4 saat, 12 saat veya 24 saatlik bir ödül bekleme süresi seçebilirsiniz. Senaryonuz daha uzun ödül bekleme süreleri gerektiriyorsa (örneğin pazarlama e-posta kampanyaları için) daha uzun bekleme sürelerinin özel önizlemesini sunuyoruz. Ekiple iletişim kurmak ve uygun olup olmadığınız ve size sunulabileceğini görmek için Azure portalında bir destek bileti açın.

Ödül bekleme süresi için en iyi yöntemler

Daha iyi sonuçlar için bu önerileri izleyin.

  • Ödül Bekleme Süresi'ni olabildiğince kısa yapın ve kullanıcı geri bildirimi almak için yeterli zaman bırakın.

  • Geri bildirim almak için gereken süreden daha kısa bir süre seçmeyin. Örneğin, bir kullanıcı videonun 1 dakikasını izledikten sonra ödüllerinizden bazıları gelirse deneme uzunluğu en az iki kat daha uzun olmalıdır.

Sonraki adımlar