O objetivo deste componente é elencar a probabilidade de um conjunto de contextos conter a resposta a uma dada pergunta. Este componente utiliza diferentes modelos de similaridade entre textos para a sua inferência.
Espera-se como entrada para o componente uma tabela com uma coluna de contextos para a aplicação do Retriever e uma coluna com as perguntas para serem aplicadas aos contextos.
A seguir são listados todos os parâmetros utilizados pelo componente:
string
(Obrigatório).string
(Obrigatório).integer
(Obrigatório).string
(Obrigatório).string
(Opcional).string
(Opcional).string
, {"cuda"
, "cpu"
}, padrão: "cuda"
(Obrigatório)."cuda"
e ela não estiver disponível na máquina, automaticamente será transferido para "cpu"
.string
, {"paraphrase_multilingual"
, "bm25"
, "tf_idf"
, "word2vec"
}, padrão: "paraphrase_multilingual"
(Obrigatório).As métricas de performance tem o propósito de ajudar o usuário a avaliar a performance do modelo. Essas métricas variam de acordo com o tipo de problema, tal como: classificação, regressão, agrupamento, entre outros.
rank
, em que rank
é o número N de contextos que serão elencados.O retorno durante a experimentação ajuda o usuário a analisar tanto métricas distintas de forma visual, como a distribuição dos dados e os dados brutos ao final da execução. Sendo assim, é possível visualizar diversos retornos para este componente como os listados a seguir:
Na implantação, espera-se uma requisição do tipo POST
com os dados em formato JSON
, com os campos ndarray
e names
seguindo a mesma estrutura dos dados utilizados na experimentação, em que ndarray
refere-se aos valores, e names
aos nomes das colunas de entrada. Um exemplo de uso seria:
$ curl --header "Content-Type: application/json" https://URL-DO-MODELO-IMPLANTADO -d "{"data":{"ndarray":[[1, "A bola é um objeto esférico utilizado para lazer e em diversos desportos.", "Qual é o formato da bola?"], [1, "A bola é um objeto esférico utilizado para lazer e em diversos desportos.", "Quando foi assinado o Tratado de Versalhes?"]], "names": ["index", "text", "question"]}}"
Espera-se como retorno um objeto JSON
contendo os campos ndarray
e names
, referentes ao array de valores produzidos e ao nome das colunas após a aplicação. Um exemplo de saída seria:
{
"data":
{
"ndarray":[
[1, "A bola é um objeto esférico utilizado para lazer e em diversos desportos.", "Qual é o formato da bola?", 0.754],
[1, "A bola é um objeto esférico utilizado para lazer e em diversos desportos.", "Quando foi assinado o Tratado de Versalhes?", 0.246]
],
"names": ["index", "text", "question", "retriever_score"]
}
}