@inproceedings{inproceedings,
author = {Vidal, Tulio and Viktor, Caio and Avila, S and Arruda Junior, Narciso and Dutra, Jose and Costa, Jamires and Mariano, Roberval and Brayner, Angelo and Vidal, Vania},
year = {2022},
month = {11},
pages = {},
title = {Construção do Grafo de Conhecimento Semântico de Dados Abertos de Pessoas Jurídicas}
}
Ontology Research in Brazil (ONTOBRAS) and 6th Doctoral and Masters Consortium on Ontologies (WTDO)
Esse trabalho construção de um Grafo de Conhecimento Semântico (SKG:CNPJ) que integra fontes de dados abertas públicas: O Cadastro Nacional de Pessoas Jurídicas (CNPJ) da Receita Federal (RFB), IBGE (IBGE-CNAE e IBGE-Localizacao), Correios, Cadastro Nacional de Empresas Inidôneas e Suspensas (CEIS) e do Sistema de Inabilitados e Inidôneos (TCU). Grafos de Conhecimento Semântico (GCS) é um novo paradigma que estás endo usado para consolidar e integrar semanticamente um grande número de dados advindos de fontes de dados heterogêneas. O objetivo principal de uma integração de dados baseadas em GCS é fornecer uma camada de dados unificada, flexível e usável, que é semanticamente conectada à fonte de dados, para que aplicações possam ter acesso integrado aos dados das fontes através de uma Camada Semântica.
https://semantic-cnpj.github.io/Semantic-CNPJ/camada_relacional.html
https://semantic-cnpj.github.io/Semantic-CNPJ/camada_semantica.html
https://semantic-cnpj.github.io/Semantic-CNPJ/grafos_locais.html
https://semantic-cnpj.github.io/Semantic-CNPJ/visoes_ligacoes_semanticas.html
2. Modelo conceitual do SKG:CNPJ
[Quais propriedades e relações poderia ser associadas a contexto?]
Conceitualmente, o SKG:CNPJ é um grafo virtual definido a partir da união dos grafos das fontes de dados locais juntamente com as ligações semânticas entre suas instâncias. Todos os grafos de conhecimento locais com seus respectivos modelos conceituais locais e mapeamentos podem ser acessados no portal semântico...
4. Trabalhos Relacionados
No domínio de dados de pessoas jurídicas de fontes públicas, trabalhos recentes demonstram esforços para se integrar a crescente quantidade de coleções de dados públicos. Dentre estes,alguns utilizam tecnologias da Web Semântica, tais como, ontologias, RDF, links, etc. Isto como intuito de publicar e ou integrar estes conjuntos de dados com o uso da semântica visando melhorias na transparência e no processo de descoberta de conhecimento.
Em [1], os autores apresentam um modelo conceitual proposto, junto de sua arquitetura e uma ferramenta demonstrativa para facilitar a busca por dados abertos disponibilizados pelo governo brasileiro. A abordagem faz uso de ontologias para a transformação dos dados abertos para Linked Open Data. No entanto, o estudo não aborda aspectos da homogeneização e integração semântica das fontes, limitando-se a ligá-las e publicá-las.
[10] apresenta uma forma de garantir um conjunto de metadados capazes de descrever datasets publicados por municípios, fazendo assim com que os dados sejam encontrados de uma forma mais simples além de fornecer uma linguagem comum e compreensível ao cidadão.
[11] propõe uma ontologia de domínio sobre licitações como base de conhecimento primário, visando facilitar a elicitação de requisitos para novos portais de transparência municipal.
Tendo em vista os trabalhos anteriormente citados, podemos observar que até então as pequisas na área vem focando em pontos específicos dos processos de transformação, integração, publicação ou consumo. Neste contexto, nosso trabalho diferencia-se por tratar todo o processopara a criação de um grafo de conhecimento semântico baseado em dados abertos públicos,desde sua modelagem, representação, acesso e consumo.
Comentários
Postar um comentário
Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.