Düzenle

Aracılığıyla paylaş


Azure Veri Gezgini alımı hakkında sık sorulan sorular

Bu makalede Azure Veri Gezgini alımı hakkında sık sorulan sorular yanıtlanmaktadır.

Kuyruğa alınan alma ve veri gecikme süreleri

Kuyruğa alınan alım verilerimi nasıl etkiler?

Toplu işlem yöneticisi, alma toplu işlem ilkesindeki alma ayarlarına göre giriş verilerini arabelleğe alır ve toplu işler. Alma toplu işlem ilkesi, toplu iş oluşturma işleminden bu yana geçen süre, birikmiş öğe sayısı (bloblar) veya toplam toplu iş boyutu olmak üzere ilk ulaşılan üç sınırlayıcı faktöre göre toplu iş sınırlarını ayarlar. Varsayılan toplu işlem ayarları 5 dakika / 1 GB / 1.000 blob'tır; başka bir deyişle, alma için örnek veriler kuyruğa alınırken en az 5 dakikalık bir gecikme olacaktır.

Kuyruğa alınmış mı yoksa akış alımı mı kullanmalıyım?

Kuyruğa alınan alma, yüksek alım aktarım hızı için iyileştirilmiştir ve tercih edilen ve en yüksek performanslı alım türüdür. Buna karşılık, akış alımı düşük alım gecikmesi için iyileştirilmiştir. Kuyruğa alınmış ve akış alımı hakkında daha fazla bilgi edinin.

Toplu işlem ilkesini değiştirmem gerekiyor mu?

Alma toplu işlem ilkesi için varsayılan ayarlar gereksinimlerinize uygun değilse, toplu işlem ilkesini timedüşürmeyi deneyebilirsiniz. Bkz . Aktarım hızı için iyileştirme. Alımın ölçeğini artırdığınızda da ayarları güncelleştirmeniz gerekir. Toplu işlem ilkesi ayarlarını değiştirdiğinizde, etkili olması 5 dakika kadar sürebilir.

Kuyruğa alınan alma gecikme süresine ne neden olur?

Veri alımı gecikmesi, alma toplu işlem ilkesi ayarlarından veya veri kapsamı birikmesinden kaynaklanabilir. Bu sorunu gidermek için toplu işlem ilkesi ayarlarını yapın. Alma işleminin parçası olan gecikme süreleri izlenebilir.

Kuyruğa alınmış alım gecikmesi ölçümlerini nerede görüntüleyebilirim?

Kuyruğa alınan alma gecikmesi ölçümlerini görüntülemek için bkz . veri alımı gecikme süresini izleme. Ölçümler Stage Latency ve Discovery Latency alma işlemindeki gecikme sürelerini gösterir ve uzun gecikme süreleri olup olmadığını gösterir.

Kuyruğa alınmış alım gecikme sürelerini nasıl kısaltabilirim?

Toplu veri boyutu nasıl hesaplanır?

Toplu işlem ilkesi veri boyutu sıkıştırılmamış veriler için ayarlanır. Sıkıştırılmış verileri alırken sıkıştırılmamış veri boyutu alma toplu işlem parametrelerinden, ZIP dosyaları meta verilerinden veya sıkıştırılmış dosya boyutu üzerindeki faktörden hesaplanır .

Alım izleme, ölçümler ve hatalar

Alma sorunlarını nasıl izleyebilirim?

Ölçümleri kullanarak ve ayrıntılı tablo düzeyinde izleme için alım tanılama günlüklerini ayarlayıp kullanarak, ayrıntılı alım hata kodlarını görüntüleyerek vb. alımı izleyebilirsiniz. İzlemek için belirli ölçümleri seçebilir, sonuçlarınızı toplamayı seçebilir ve panonuzda görüntülemek üzere ölçüm grafikleri oluşturabilirsiniz. Akış ölçümleri ve kuyruğa alınan alımı izleme hakkında daha fazla bilgi edinin.

Alımla ilgili içgörüleri nerede görüntüleyebilirim?

Alma hatalarını nereden denetleyebilirim?

Tam veri alımı işlemi, veri alımı ölçümleri ve tanılama günlükleri kullanılarak izlenebilir. Alma hataları ölçüm veya FailedIngestion tanılama günlüğü kullanılarak IngestionResult izlenebilir. Komut, .show ingestion failures veri alımı yönetimi komutlarıyla ilişkili alma hatalarını gösterir ve izleme hataları için önerilmez. komutu, .dup-next-failed-ingest bir depolama kapsayıcısına alma dosyaları ve meta verileri yükleyerek sonraki başarısız alım hakkında bilgi sağlar. Bu, bir alım akışını denetlemek için yararlı olabilir, ancak sürekli izleme için önerilmiyor.

Çok sayıda yeniden deneme hatası bulursam ne yapabilirim?

Ölçüm durumunu birçok kez içeren RetryAttemptsExceeded ölçümler, yinelenen geçici bir hatanın ardından alımın yeniden deneme denemesi sınırını veya zaman aralığı sınırını aştığını gösterir. Bu hata tanılama günlüğünde hata kodu General_RetryAttemptsExceeded ve "Depolamaya erişilemedi ve blob için bilgi alınamadı" ayrıntılarıyla birlikte görünüyorsa, bu yüksek yük depolama erişim sorununa işaret eder. Event Grid alımı sırasında Azure Veri Gezgini depolama hesabından blob ayrıntılarını istemektedir. Depolama hesabında yük çok yüksek olduğunda depolama erişimi başarısız olabilir ve veri alımı için gereken bilgiler alınamaz. Denemeler tanımlanan en fazla yeniden deneme miktarını geçerse Azure Veri Gezgini başarısız blobu alma denemesini durdurur. Yük sorununu önlemek için bir premium depolama hesabı kullanın veya alınan verileri daha fazla depolama hesabına bölün. İlgili hataları bulmak için tanılama günlüklerinde hata kodlarını ve başarısız blobların yollarını denetleyin FailedIngestion .

Geçmiş verileri alma

Büyük miktarlarda geçmiş verileri nasıl alabilir ve iyi performans sağlayabilirim?

Büyük miktarlarda geçmiş verileri verimli bir şekilde almak için LightIngest kullanın. Daha fazla bilgi için bkz . Geçmiş verileri alma. Birçok küçük dosyanın performansını artırmak için toplu iş ilkesini ayarlayın, toplu işlem koşullarını değiştirin ve gecikme sürelerini giderin. Son derece büyük veri dosyalarını alırken veri alımı performansını geliştirmek için bulut tabanlı bir veri tümleştirme hizmeti olan Azure Data Factory'yi (ADF) kullanın.

Geçersiz veri alma

Geçersiz veriler alınınca ne olur?

Hatalı biçimlendirilmiş veriler, ayrıştırılamayan, çok büyük veya şemaya uygun olmayan veriler düzgün şekilde alınamayabilir. Daha fazla bilgi için bkz . Geçersiz verilerin alımı.

SDK'lar ve bağlayıcılar

SDK'larla alımı nasıl geliştirebilirim?

SDK aracılığıyla alma işlemi yaparken, performansı artırmak için alma toplu işlem ilkesi ayarlarını kullanabilirsiniz. Tablo veya veritabanı toplu işlem ilkesinde alınan verilerin boyutunu artımlı olarak 250 MB'a düşürmeyi deneyin. İyileştirme olup olmadığını denetleyin.

Daha iyi alım performansı için Kusto Kafka Havuzu'nda nasıl ayarlama yapabilirim?

Kafka Sink kullanıcıları, toplu işlem süresini, boyutunu ve öğe numarasını ayarlayarak alma toplu işlem ilkesiyle birlikte çalışacak şekilde bağlayıcıyı ayarlamalıdır.