Aula SPARQL - Setembro/21

Como parte das atividades de docência da disciplina INF de 2021.2, ministrei duas aulas de SPARQL no curso do CCE

Planejamento

Material sobre SPARQL - https://cambridgesemantics.com/blog/semantic-university/learn-sparql/sparql-by-example/

* requer uma introdução sobre Grafo, Modelo RDF e Schema RDFS, Semantic Web Stack

Dataset de exercício Linked Internet Movie Database (Linkedmdb) - https://triplydb.com/Triply/linkedmdb

Subset do ... IMDb is an online database of information related to world films, television programs, home videos and video games, and internet streams, including cast, production crew, personnel and fictional character biographies, plot summaries, trivia, and fan reviews and ratings.

SPARQL EndPoint para consulta no LinkedMDB - https://triplydb.com/Triply/linkedmdb/sparql/linkedmdb

Download em formato NTriple do LinkedMDB - https://www.cs.toronto.edu/~oktie/linkedmdb/

* caso o EndPoint esteja indisponível podemos carregar em um repositório no Allegro como contingência

Exemplos de sub grafos

The title of the films directed by Quentin Tarantino.

15/09

Contexto e Motivação para SPARQL
Sintaxe SPARQL - Parte 1

Os Dados Conectados podem ser definidos como dados cuja interpretação e valor requerem um bom entendimento das relações de seus elementos. Redes sociais e interação de proteínas em sistemas biológicos são exemplos de dados conectados. Este tipo de dados geralmente é modelado como grafos.

RDBMS - SQL x NoSQL

Labeled Property Graph (LPG) and Resource Description Framework (RDF) são os dois modelos de dados em grafo mais populares usados pelos bancos de dados NoSQL na prática.

LPG - Neo4J e TigerGraph

RDF - Triple Store

basic path (navigational/traversal): é usada para determinar a existência de um caminho conectando dois nós de um grafo de propriedades, independentemente dos rótulos de arestas

pattern matching query: é usada para encontrar todos os subgráficos de um grafo de dados que são isomórficos (ou seja, equivalentes na estrutura e nos rótulos) para um determinado padrão de grafo.

OFFSET faz com que as soluções geradas comecem após o número especificado de triplas. Um OFFSET de zero não tem efeito. Usar LIMIT e OFFSET para selecionar subconjuntos diferentes das soluções de consulta se combinado com ORDER BY.

SELECT (projeção), CONSTRUCT (recuperar/criar o subgrafo), ASK (verificar existência ou validade) e DESCRIBE (subgrafo centrado no recurso)

20/09

Exemplos Sintaxe SPARQL - Parte 1
Sintaxe SPARQL - Parte 2
LOD
Exemplos Sintaxe SPARQL - Parte 2

AVG: Calcula o valor médio de uma expressão numérica.
COUNT: conta o número de vezes que o valor especificado é associado à variável fornecida.
GROUP_CONCAT: executa uma concatenação de string de todos os valores vinculados à variável fornecida.
MAX: Retorna o valor máximo do conjunto de valores especificado.
MIN: Retorna o valor mínimo do conjunto de valores especificado.
SAMPLE: Retorna um valor arbitrário do conjunto de valores especificado.
SUM: Adiciona os valores especificados.

Uma consulta SPARQL pode especificar o conjunto de dados a ser usado para correspondência usando a cláusula FROM e a cláusula FROM NAMED para descrever o conjunto de dados RDF. O FROM/WHERE especifica um OR e não AND. Quando não especifica o FROM é sempre o default graph que faz o merge de todos os grafos. Todos são grafos do mesmo repositório (local).

Federated Query SPARQL 1.1: encapsular vários repositórios remotos em um único repositório virtual que pode ser manipulada como se fosse uma executando uma consulta SPARQL paralela. EndPoint é um repositório que responde a consultas SPARQLs

SERVICE <URI>

DELETE / INSERT pq não tem UPDATE

A operação LOAD lê um documento RDF de um IRI e insere as triplas no grafo especificado.
A operação CLEAR remove todos as triplas no(s) grafo(s) especificado(s) sem remover o grafo. … Semelhante ao TRUNCATE

A operação CREATE cria um novo grafo em repositórios que suportam grafos vazios.
A operação DROP remove um grafo e todo o seu conteúdo.
A operação COPY modifica um grafo para conter uma cópia de outro.
A operação MOVE move todos os dados de um grafo para outro.

Linked Open Data (LOD) é um conjunto de princípios para o compartilhamento na web de dados, que podem ser usados e distribuídos livremente, de modo interligado com outras bases e legíveis por máquina.

★ torne seus dados disponíveis na Web sob uma licença aberta

★★ torne seus dados disponíveis em formato estruturados

★★★ utilize formatos não-proprietários (ex. CSV e não excel)

★★★★ utilize identificadores únicos e universais (URIs) para identificar recursos

★★★★★ conecte seus dados com dados de outras fontes para prover contexto (dados linkado)

Exemplo de queries simples

1) Todas as triplas de um grafo

SELECT ?s ?p ?o
FROM <https://triplydb.com/Triply/linkedmdb/graphs/vocab>
WHERE {?s ?p ?o }

PREFIX graphs: <https://triplydb.com/Triply/linkedmdb/graphs/>
SELECT ?s ?p ?o
FROM graphs:vocab
WHERE {?s ?p ?o }

2) Todos os predicados de um grafo

PREFIX graphs: <https://triplydb.com/Triply/linkedmdb/graphs/>

SELECT distinct ?pred
FROM graphs:data
WHERE {?s ?pred ?o }

3) Todas as classes de um grafo

PREFIX graphs: <https://triplydb.com/Triply/linkedmdb/graphs/>

SELECT distinct ?class
FROM graphs:data
WHERE {?s a ?class }
ORDER BY ?class

4) Quem são diretores

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX lmdb: <https://triplydb.com/Triply/linkedmdb/vocab/>

SELECT ?d1 ?name
WHERE {?d1 a lmdb:Director; rdfs:label ?name }
ORDER BY ?name

5) Quem são diretores dos filmes

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX lmdb: <https://triplydb.com/Triply/linkedmdb/vocab/>

SELECT distinct ?title ?name
WHERE {?d1 a lmdb:Director; rdfs:label ?name .
?f1 a lmdb:Film; rdfs:label ?title; lmdb:director ?d1}
ORDER BY ?title

6) Quem são os diretores dos filmes sobre o Batman

7) Obter todas as triplas ligadas a um nó

DESCRIBE <https://triplydb.com/Triply/linkedmdb/id/film/26393>

8) Verificar se existem filmes brasileiros

PREFIX country: <https://triplydb.com/Triply/linkedmdb/id/country/>
PREFIX lmdb: <https://triplydb.com/Triply/linkedmdb/vocab/>

ASK
WHERE { ?s a lmdb:Film; lmdb:country country:BR .
}

9) Quantidades de filmes por gênero em ordem decrescente (formatar a visualização em um gráfico)

PREFIX lmdb: <https://triplydb.com/Triply/linkedmdb/vocab/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>

SELECT ?genre_name (count(?genre_name) AS ?total)
WHERE {
?s lmdb:genre ?genre . ?genre rdfs:label ?genre_name
}
GROUP BY ?genre_name
ORDER BY DESC(?total)

10) Frequência das classes - Exercício para o pontuação

PREFIX graphs: <https://triplydb.com/Triply/linkedmdb/graphs/>

SELECT ?class (count(?class) AS ?total)
FROM graphs:data
WHERE {?s a ?class }
GROUP BY ?class
ORDER BY DESC(?total)

Knowledge graphs: Introduction, history, and perspectives - Leitura de Artigo

Chaudhri, V. K., C. Baru, N. Chittar, X. L. Dong, M. Genesereth, J. Hendler, A. Kalyanpur, D. Lenat, J. Sequeda, D. Vrandečić, and K.Wang 2022. “ Knowledge graphs: Introduction, history, and perspectives. ” AI Magazine 43: 17–29. https://doi.org/10.1002/aaai.12033 Knowledge graphs (KGs) have emerged as a compelling abstraction for organizing the world’s structured knowledge and for integrating information extracted from multiple data sources. KNOWLEDGE GRAPH DEFINITION A KG is a directed labeled graph in which domain-specific meanings are associated with nodes and edges. [ Definição focado no COMO representar, diferente dos KBs ] There are multiple approaches for associating meanings with the nodes and edges. At the simplest level, the meanings could be stated as documentation strings expressed in a human understandable language such as English. At a computational level, the meanings can be expressed in a formal specification language such as first-order logic. An active area of curren...

Pesquisa de Doutorado da Veronica

Pesquisar este blog

Aula SPARQL - Setembro/21

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Aprendizado de Máquina Relacional

Connected Papers: Uma abordagem alternativa para revisão da literatura

Knowledge graphs: Introduction, history, and perspectives - Leitura de Artigo