Carregando os templates¶
Carregue o pacote para poder utilizar suas funcionalidades
>>> import QApedia
Você pode carregar o seu dataset utilizando a função
QApedia.io.load_templates()
presente no pacote. O arquivo do dataset
deve estar no formato csv, a primeira linha deve conter o nome das colunas.
Esses nomes devem ser os mesmos que são mostrados no Tutorial. São
eles:
- query - consulta SPARQL contendo uma lacuna no formato
<LETTER>
. - question - pergunta em linguagem natural contendo a mesma lacuna presente na query.
- generator_query - query utilizada para preencher as lacunas e assim
permitir a geração do conjunto de
question-query
.
Na tabela seguir é mostrado um exemplo de dataset contendo apenas um template.
question | query | generator_query |
---|---|---|
<A> é autor de que? | select distinct ?uri where { ?uri dbo:author <A>} | select distinct ?a where { ?uri dbo:author ?a} |
O template é carregado como um pandas.Dataframe
, então as operações de
Dataframe podem ser realizadas em cima do conjunto de dados. As variáveis
presentes no select da generator_query são extraídas no processo de
leitura do conjunto de dados e são disponibilizadas na coluna variables.
No exemplo a seguir, podemos ver as primeiras linhas do arquivo templates.csv.
>>> from QApedia import io
>>> templates = io.load_templates("templates.csv")
>>> templates.head()
question ... variables
0 <A> e <B> é produzido por qual empresa? ... [a, b]
1 <A> e <B> é o trabalho notável de qual autor? ... [a, b]
2 <A> e <B> são escritos por qual autor? ... [a, b]
3 <A> escreveu qual livro? ... [a]
4 <A> pertence a qual partido político? ... [a]
[5 rows x 4 columns]
Para o exemplo mostrado na tabela anterior, sobre a generator_query «select distinct ?a where { ?uri dbo:author ?a}», a variável extraída seria o a.