Carregando os templates

Carregue o pacote para poder utilizar suas funcionalidades

>>> import QApedia

Você pode carregar o seu dataset utilizando a função QApedia.io.load_templates() presente no pacote. O arquivo do dataset deve estar no formato csv, a primeira linha deve conter o nome das colunas. Esses nomes devem ser os mesmos que são mostrados no Tutorial. São eles:

  • query - consulta SPARQL contendo uma lacuna no formato <LETTER>.
  • question - pergunta em linguagem natural contendo a mesma lacuna presente na query.
  • generator_query - query utilizada para preencher as lacunas e assim permitir a geração do conjunto de question-query.

Na tabela seguir é mostrado um exemplo de dataset contendo apenas um template.

question query generator_query
<A> é autor de que? select distinct ?uri where { ?uri dbo:author <A>} select distinct ?a where { ?uri dbo:author ?a}

O template é carregado como um pandas.Dataframe, então as operações de Dataframe podem ser realizadas em cima do conjunto de dados. As variáveis presentes no select da generator_query são extraídas no processo de leitura do conjunto de dados e são disponibilizadas na coluna variables. No exemplo a seguir, podemos ver as primeiras linhas do arquivo templates.csv.

>>> from QApedia import io
>>> templates = io.load_templates("templates.csv")
>>> templates.head()
                                        question  ... variables
0        <A> e <B> é produzido por qual empresa?  ...    [a, b]
1  <A> e <B> é o trabalho notável de qual autor?  ...    [a, b]
2         <A> e <B> são escritos por qual autor?  ...    [a, b]
3                       <A> escreveu qual livro?  ...       [a]
4          <A> pertence a qual partido político?  ...       [a]

[5 rows x 4 columns]

Para o exemplo mostrado na tabela anterior, sobre a generator_query «select distinct ?a where { ?uri dbo:author ?a}», a variável extraída seria o a.