Ir para o conteúdo

Lab 4.2: Funcionalidade Datapool

O Datapool é uma funcionalidade da BotCity que permite o processamento de um conjunto de itens em larga escala. Com ele é possível gerenciar os itens de forma individual por um ou mais processos de automação.

Funcionalidade Datapool

Criar um Datapool

Para esse projeto, navegue no Orquestrador BotCity no menu lateral Datapool, clique em + Novo Datapool e preencha os formulários:

1. Informações Básicas

  • Label: O identificador único que será utilizado para acessar o Datapool.
  • Nome: O nome amigavel do Datapool.
  • Repositório: O repositório onde o Datapool será armazenado.
  • Status: O status do Datapool, que pode ser Ativo ou Inativo.
  • Politica de consumo: Você pode escolher entre duas políticas de consumo.
    • FIFO: O primeiro item a ser adicionado ao Datapool também será o primeiro item a ser processado.
    • LIFO: O último item a ser adicionado ao Datapool será o primeiro item a ser processado.

Datapool etapa 1

2. Configurações de Processamento

Nessa etapa, você deve configurar o comportamento do Datapool durante o processamento dos itens.

  • Tempo de processamento: permite definir qual o tempo esperado (em minutos) para que um item do Datapool seja processado em condições normais.
  • Auto-retry: permite que um item seja reprocessado automaticamente em caso de erro do tipo SYSTEM.
  • Abortar em caso de erro: faz com o que o Datapool fique inativo e não seja mais consumido em caso de erros consecutivos do tipo SYSTEM.
  • Gatilhos de disparo de tarefas: define se o Datapool criado também vai ser responsável por disparar novas tarefas:
    • Nunca disparar nova tarefa: O Datapool nunca será responsável por disparar tarefas de um processo de automação.
    • Disparar nova tarefa a cada item adicionado: Sempre que um novo item for adicionado ao Datapool, uma nova tarefa de um determinado processo de automação será criada.
    • Disparar nova tarefa apenas se não houver tarefas pendentes: Sempre que um novo item for adicionado, o Datapool irá disparar uma nova tarefa de um processo de automação somente se não existirem tarefas desse processo sendo executadas ou pendentes.
    • Automação: O processo de automação que será utilizado pelo Datapool para disparar novas tarefas, se algum gatilho estiver sendo utilizado.

Datapool etapa 2

3. Definir o Esquema

Pode ser definida a estrutura dos itens que serão adicionados ao Datapool, ou seja, quais campos irão compor cada item.

  • Label: O identificador único que será utilizado para acessar esse campo.
  • Tipo: O tipo esperado para o valor desse campo (TEXT, INTEGER, DOUBLE).
  • ID único: Se marcado, o campo irá representar uma "chave única" para o item, ou seja, não será permitido adicionar itens duplicados que tenham o mesmo valor para esse campo em específico.
  • Exibir valor: Se marcado, o valor desse campo será exibido na lista de itens do Datapool, servindo como um identificador visual para os itens em questão.

Para esse treinamento usaremos as seguintes colunas, todas com o tipo TEXT:

full_name
vacancy
email
contact_number
keywords

Datapool etapa 3

4. Resumo

Ao final, revise as informações e clique em Confirmar.

Nota

Para entender cada um dos campos, veja a documentação do Datapool.

Datapool etapa 4

Adicionar itens ao Datapool

Após criar o Datapool, clique nele para verificar os detalhes. A tela será semelhante a essa:

Detalhes do Datapool

A partir desse ponto, adicione os itens de várias formas.

Adicionar manualmente

Para adicionar manualmente, clique em + Adicionar entrada, depois em + Adicionar, informando o label, o value e também a prioridade de um item.

Adicionar item manualmente

Dessa forma, cada item é adicionado individualmente. Esse processo pode ser demorado e causar erros de digitação, principalmente por ter que definir todas as colunas e valores.

Adicionar em lote

Uma forma mais eficiente de adicionar itens é por um arquivo .csv. Para isso, clique em Importar CSV e arraste o arquivo ou clique para selecionar.

Adicionar por CSV

Assim, a primeira linha é considerada o cabeçalho, que define as colunas e as demais linhas se tornam os itens.

Nota

O arquivo CSV utilizado neste exemplo está disponível para download clicando nesse link.

Vários itens

Note que os itens adicionados possuem o status PENDENTE, isso significa que estão aguardando processamento.

Nota

Para entender mais sobre os status durante o processo, veja a documentação do Datapool.

Processar os itens

Com os itens prontos para serem processados, faça uma alteração no código da automação, informando o label do Datapool criado na seguinte linha:

# Definir o datapool
datapool = maestro.get_datapool(label="orange_candidatos")