다음을 통해 공유


예측 코딩 모델 만들기(미리 보기)

중요

이 문서는 클래식 eDiscovery 환경에만 적용됩니다. 클래식 eDiscovery 환경은 2025년 8월에 사용 중지되며 사용 중지 후 Microsoft Purview 포털에서 환경 옵션으로 사용할 수 없습니다.

이 전환에 대한 계획을 일찍 시작하고 Microsoft Purview 포털에서 새 eDiscovery 환경을 사용하는 것이 좋습니다. 최신 eDiscovery 기능 및 기능을 사용하는 방법에 대한 자세한 내용은 eDiscovery에 대해 알아보기를 참조하세요.

중요

예측 코딩은 2024년 3월 31일부터 사용 중지되었으며 새로운 eDiscovery 사례에서는 사용할 수 없습니다. 학습된 예측 코딩 모델이 있는 기존 사례의 경우 기존 점수 필터를 검토 집합에 계속 적용할 수 있습니다. 그러나 새 모델을 만들거나 학습시킬 수는 없습니다.

eDiscovery(프리미엄)에서 예측 코딩의 기계 학습 기능을 사용하는 첫 번째 단계는 예측 코딩 모델을 만드는 것입니다. 모델을 만든 후에는 검토 집합에서 관련 콘텐츠와 관련이 없는 콘텐츠를 식별하도록 학습할 수 있습니다.

예측 코딩 워크플로를 검토하려면 eDiscovery의 예측 코딩에 대한 자세한 정보(프리미엄)를 참조하세요.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 평가판 허브에서 지금 시작합니다. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

모델을 만들기 전에

  • 예측 코딩 모델을 만들려면 검토 집합에 최소 2,000개 항목이 있어야 합니다.
  • 모델을 만들기 전에 모든 컬렉션을 검토 집합에 커밋해야 합니다. 모델을 만든 후 검토 집합에 추가된 항목은 처리되지 않으며 모델에서 생성된 예측 점수가 할당되지 않습니다.
  • 텍스트가 포함되지 않은 검토 집합의 모든 항목은 모델에서 처리되거나 예측 점수가 할당되지 않습니다. 텍스트가 있는 항목은 컨트롤 집합 또는 학습 집합에 포함됩니다.

모델 만들기

참고

제한된 시간 동안 클래식 eDiscovery 환경은 새 Microsoft Purview 포털에서 사용할 수 있습니다. eDiscovery 환경 설정에서 Purview 포털 클래식 eDiscovery 환경을 사용하도록 설정하여 새 Microsoft Purview 포털에서 클래식 환경을 표시합니다.

  1. Microsoft Purview 포털에서 eDiscovery(프리미엄) 사례를 연 다음 , 검토 집합 탭을 선택합니다.

  2. 검토 집합을 연 다음 분석>예측 코딩 관리(미리 보기)를 선택합니다.

    검토 집합에서 분석 드롭다운 메뉴를 선택하여 예측 코딩 페이지로 이동합니다.

  3. 예측 코딩 모델(미리 보기) 페이지에서 새 모델을 선택합니다.

  4. 플라이아웃 페이지에서 모델의 이름과 설명(선택 사항)을 입력합니다.

  5. 필요에 따라 신뢰 수준 및 오차 범위와 관련된 고급 설정(플라이아웃 페이지에서 고급 옵션을 선택하여)을 구성할 수 있습니다. 이러한 설정은 컨트롤 집합에 포함된 항목 수에 영향을 미칩니다. 컨트롤 집합은 학습 프로세스 중에 모델에서 학습 라운드 중에 수행하는 레이블이 지정된 항목에 할당하는 예측 점수를 평가하는 데 사용됩니다. organization 문서 검토에 대한 신뢰도 수준 및 오차 범위와 관련하여 지침이 있는 경우 해당 상자에 지정합니다. 그렇지 않으면 기본 설정을 사용합니다.

  6. 저장을 선택하여 모델을 만듭니다.

    시스템에서 모델을 준비하는 데 몇 분 정도 걸립니다. 준비가 되면 첫 번째 훈련을 수행할 수 있습니다.

모델을 만든 후 발생하는 작업

모델을 만든 후 모델을 만들고 준비하는 동안 백그라운드에서 다음과 같은 작업이 수행됩니다.

  • 시스템은 컨트롤 집합의 항목 수를 계산합니다. 이 크기는 검토 집합의 항목 수와 신뢰도 수준 및 오차 범위 설정을 기반으로 합니다. 컨트롤 집합에 대한 항목은 임의로 선택되고 컨트롤 집합 항목으로 지정됩니다. 시스템에는 첫 번째 학습 라운드에서 설정된 컨트롤의 10개 항목이 포함됩니다.
  • 시스템은 첫 번째 학습 라운드에 대한 학습 집합에 포함할 검토 집합에서 40개의 항목을 임의로 선택합니다. 따라서 첫 번째 학습 라운드에는 레이블 지정을 위한 50개 항목(학습 집합의 항목 40개 및 컨트롤 집합의 항목 10개)이 포함됩니다.

다음 단계

검토 집합에 대한 모델을 만든 후 다음 단계는 조사와 관련된 콘텐츠를 식별하기 위해 모델을 "학습"하기 위한 학습 라운드를 수행하는 것입니다. 자세한 내용은 예측 코딩 모델 학습을 참조하세요.