Preparar um modelo de processamento de documentos não estruturado no SharePoint
Aplica-se a: ✓ Processamento de documentos não estruturados
Siga as instruções em Criar um modelo no Syntex para criar um modelo de processamento de documentos não estruturado num centro de conteúdos. Em alternativa, siga as instruções em Criar um modelo num site do SharePoint local para criar o modelo num site local. Em seguida, comece com este artigo para começar a preparar o seu modelo.
Criar um classificador
Um classificador é um tipo de modelo que você pode usar para automatizar a identificação e a classificação de um tipo de documento.
Por exemplo, talvez você queira identificar toda os documentos deRenovação de Contrato que são adicionados à biblioteca de documentos, como o é mostrado na ilustração a seguir.
A criação de um classificador permite criar um novo tipo de conteúdo do Microsoft Office SharePoint Online que será associado ao modelo.
Ao criar o classificador, você precisa criar explicações para definir o modelo. Este passo permite-lhe anotar dados comuns que seria de esperar que encontrassem consistentemente este tipo de documento.
Use exemplos do tipo de documento ("arquivos de exemplo") para "treinar" seu modelo para identificar arquivos que têm o mesmo tipo de conteúdo.
Para criar um classificador, você precisa:
- Nomear seu modelo.
- Adicionar os arquivos de exemplo.
- Rotular os arquivos de exemplo.
- Criar uma explicação.
- Testar seu modelo.
Observação
Enquanto o modelo usa um classificador para identificar e classificar os tipos de documento, você também pode optar por extrair informações específicas de cada arquivo identificado pelo modelo. Para fazer isso, crie um extrator para adicionar ao seu modelo. Confira Criar um extrator.
Nomeie seu modelo
A primeira etapa para criar seu modelo é dar um nome a ele:
No centro de conteúdos, selecione Novo e, em seguida , Modelo.
Na página Opções para a criação de modelos , selecione Método de ensino.
Na página Método de ensino: Detalhes , selecione Seguinte.
Na página Criar um modelo com o método de ensino , no campo Nome do modelo, escreva o nome do modelo. Por exemplo, se você deseja identificar documentos de renovação de contrato, nomeie o modelo como Renovação de Contrato.
Escolha Criar. Esta ação cria uma home page para o modelo.
Quando cria um modelo, também está a criar um novo tipo de conteúdo de site. Um tipo de conteúdo representa uma categoria de documentos que tem características comuns e compartilha um conjunto de propriedades de colunas ou metadados para esse conteúdo específico. Os tipos de conteúdo do Microsoft Office SharePoint Online são gerenciados através da Galeria de tipos de conteúdos. Neste exemplo, quando cria o modelo, está a criar um novo tipo de conteúdo Renovação de Contrato .
Selecione Definições avançadas se quiser mapear este modelo para um tipo de conteúdo empresarial existente na galeria de tipos de Conteúdo do SharePoint para utilizar o respetivo esquema. Os tipos de conteúdo corporativo são armazenados no Hub de Tipo de Conteúdo no centro de administração do SharePoint e são agregados a todos os sites no locatário. Tenha em atenção que, apesar de poder utilizar um tipo de conteúdo existente para tirar partido do respetivo esquema para ajudar na identificação e classificação, ainda tem de preparar o modelo para extrair informações dos ficheiros identificados.
Adicionar arquivos de exemplo
Na home page do modelo, adicione os seus ficheiros de exemplo que terá de ajudar a preparar o modelo para identificar o seu tipo de documento.
Observação
Você deve usar os mesmos arquivos tanto para o classificador quanto para o Treinamento do extrator. Você tem a opção de adicionar mais tarde, mas normalmente adicionará um conjunto completo de arquivos de exemplo. Rotule alguns para treinar o seu modelo e testar as restantes não-rotulados para avaliar a adequação do modelo.
Para seu conjunto de treinamento, você vai querer usar exemplos positivos e negativos:
- Exemplo positivo: documentos que representam o tipo de documento. Eles contêm cadeias de caracteres e informações que estarão sempre neste tipo de documento.
- Exemplo negativo: qualquer outro documento que não represente o documento que pretende classificar.
Use pelo menos cinco exemplos positivos e pelo menos um exemplo negativo para treinar o seu modelo. Quer criar outras para testar o modelo após o processo de preparação.
Para adicionar arquivos de exemplo:
Na home page do modelo, no mosaico Adicionar ficheiros de exemplo , selecione Adicionar ficheiros.
Na páginaselecione arquivos de exemplo para sua página de modelo, selecione os arquivos de exemplo da biblioteca Arquivos de treinamento no centro de conteúdo. Se ainda não os tinha carregado para lá, opte por carregá-los agora ao clicar em Carregar para copiá-los para a biblioteca ficheiros de Preparação.
Depois de selecionar os ficheiros de exemplo a utilizar para preparar o modelo, selecione Adicionar.
Rotule os arquivos de exemplo
Depois de adicionar os arquivos de exemplo, é necessário rotulá-los como exemplos positivos ou negativos.
Na home page do modelo, no mosaico Classificar ficheiros e executar a preparação , selecione Preparar classificador. Este passo apresenta a página de etiqueta que mostra uma listagem dos seus ficheiros de exemplo, com o primeiro ficheiro visível no visualizador.
No visualizador, na parte superior do primeiro arquivo de exemplo, você deve ver o texto perguntando se o arquivo é um exemplo do modelo que você acabou de criar. Se for um exemplo positivo, selecione Sim. Se for um exemplo negativo, selecione Não.
Na lista deExemplos rotulados à esquerda, selecione arquivos adicionais que você deseja usar como exemplos e etiquete-los.
Observação
Rotule pelo menos cinco exemplos positivos. Você também deve rotular pelo menos um exemplo negativo.
Criar uma explicação
A próxima etapa é criar uma explicação na Página de treinamento. Uma explicação ajuda o modelo a entender como reconhecer o documento. Por exemplo, os documentos de Renovação de Contrato sempre contêm um cadeia de texto de Solicitação de divulgação.
Observação
Quando usado com extratores, uma explicação identifica a cadeia que você deseja extrair do documento.
Para criar uma explicação:
Na página inicial do modelo, selecione a guia Treinar para ir para a página de treinamento.
Na página Treinar, na seção Arquivos treinados, você verá uma lista dos arquivos de exemplo que você rotulou anteriormente. Selecione um dos arquivos positivos na lista, e ele será exibido no visualizador.
Na seção Explicação, selecione Nova e, em seguida, Em branco.
Na página Criar uma explicação :
a. Digite o Nome (por exemplo, "Bloqueio de Divulgação").
b. Selecione o Tipo. Para o exemplo, selecione Lista de frases, já que você adiciona uma cadeia de texto.
c. Na caixa Digite aqui, digite a cadeia. Para o exemplo, adicione "Solicitar divulgação adicional". Você pode selecionar Diferenciar maiúsculas de minúsculas se a cadeia precisar diferenciar maiúsculas de minúsculas.
d. Selecione Salvar.O centro de conteúdo agora verifica se a explicação que você criou está completa o suficiente para identificar corretamente os demais arquivos de exemplo rotulados, como exemplos positivos e negativos. Na seção Arquivos treinados, marque a coluna Avaliação após a conclusão do treinamento para ver os resultados. Os arquivos mostram um valor de Correspondência, se as explicações que você criou foram o suficiente para corresponder ao que foi rotulado como positivo ou negativo.
Se você receber uma Incompatibilidade nos arquivos rotulados, talvez seja necessário criar uma explicação adicional para fornecer informações sobre o modelo ao tipo de documento. Se ocorrer um erro de correspondência, selecione o ficheiro para obter mais informações sobre o motivo do erro de correspondência.
Depois de treinar um extrator, esse extrator treinado pode ser usado como uma explicação. Na seção Explicações, isso é mostrado como uma referência Modelo.
Testar seu modelo
Se recebeu uma correspondência nos seus ficheiros de exemplo etiquetados, agora pode testar o modelo nos restantes ficheiros de exemplo não etiquetados que o modelo nunca viu antes. Este passo é opcional, mas é um passo útil para avaliar a "condição física" ou a preparação do modelo antes de o utilizar, ao testá-lo em ficheiros que o modelo nunca viu antes.
Na página inicial do modelo, selecione a guia Testar. Isso executará o modelo em seus arquivos de exemplo não rotulados.
Na lista Arquivos de teste, os arquivos de exemplo são exibidos e mostram se o modelo os previu como positivos ou negativos. Use essas informações para ajudá-lo a determinar a eficácia do seu classificador na identificação de seus documentos.