Pular para o conteúdo principal

Quality of Experience - QoE - medir eficácia

Quality of Experience (também QoE ou QoX)


Quality of experience (QoE) is defined by the ITU-T as “the overall acceptability of an application or service, as perceived subjectively by the end-user” (ITU-T, n.d.).

Diferente de QoS (Quality of Service)

Medida subjetiva (satisfação é individual da pessoa e no nosso caso da tarefa que motiva a busca por informação)

Satisfação do Usuário em relação a necessidade de informação: satisfação é booleana (assim como a confiança)?

( ) Satisfeito ( ) Não satisfeito

OU

( ) Muito Satisfeito ( ) Satisfeito ( ) Pouco satisfeito ( ) Insatisfeito

Considerando Information Seeking, poderia converter em Usou ou Não usou a informação para tomar a decisão? A informação atendeu ou não atendeu para cobrir o gap de conhecimento? 

Cenários para a "melhor resposta"

1) o KB não tem resposta (O Oráculo não sabe tudo!): 

Melhor resposta: informar ao usuário que não é possível atender (NR - Não Resposta)

Usuário satisfeito? Não

2) O KB tem respostas (O Oráculo vai te ajudar!)

Usuário satisfeito? ( ) Sim ( ) Não

2.1) A pergunta e a tarefa estão representadas no KB

Melhor resposta: resposta exata e justificada (contextualizada)  (RE - Resposta Exata)

2.2) A pergunta está representada no KB mas a tarefa não foi informada

Melhor resposta: respostas possíveis, por tarefa, justificadas (contextualizadas)  (RP - Respostas Possíveis)

2.3) A tarefa está representada no KB mas a pergunta não está

Melhor resposta: respostas possíveis, por pergunta, justificadas (contextualizadas)  (RP - Respostas Possíveis)

3) Talvez o KB tenha alguma resposta (O Oráculo quer te ajudar!)

Usuário satisfeito? ( ) Sim ( ) Não ( ) Parcialmente

3.1) Nem a pergunta e nem a tarefa estão representadas no KB

Melhor resposta: respostas aproximadas justificadas (contextualizadas)  (RA - Respostas Aproximadas)

3.2) A tarefa não foi especificada e a pergunta não está representada

Melhor resposta: respostas aproximadas justificadas (contextualizadas) (RA - Respostas Aproximadas)

 

Métricas

Taxa de resposta de consultas (TR):  

RAs + RPs + RE / Total de consultas

Taxa de sucesso nas respostas (SR): 

(RAs x Satisfeito) + (RPs  x Satisfeito) + (RE x Satisfeito) + (RAs x Parcialmente x 0.5) / RAs + RPs + RE

 QoE level:

                Satisfeito x A + Parcialmente Satisfeito x B + Insatisfeito x C  / Total de consultas

Como a KB não é completa, podemos fazer  A > B > C e A + B + C = 1

 

Se a TR menor que X, Oráculo está rejeitando consultas pq: (1) o KB ainda é muito incompleto; (2) o usuário tem necessidades de informação que o KB não cobre. 

Se SR menor que X, Oráculo não está ajudando pq: (1) o KB ainda é muito incompleto; (2) o usuário tem necessidades de informação que o KB não cobre e; (3) o usuário não confia nas justificativas referentes as respostas

  • Contras: requer feedback de usuário
  • Pró: não requer gabarito das resposta como as métricas de Precisão, Cobertura, F1 e derivadas

Comentários

Postagens mais visitadas deste blog

Connected Papers: Uma abordagem alternativa para revisão da literatura

Durante um projeto de pesquisa podemos encontrar um artigo que nos identificamos em termos de problema de pesquisa e também de solução. Então surge a vontade de saber como essa área de pesquisa se desenvolveu até chegar a esse ponto ou quais desdobramentos ocorreram a partir dessa solução proposta para identificar o estado da arte nesse tema. Podemos seguir duas abordagens:  realizar uma revisão sistemática usando palavras chaves que melhor caracterizam o tema em bibliotecas digitais de referência para encontrar artigos relacionados ou realizar snowballing ancorado nesse artigo que identificamos previamente, explorando os artigos citados (backward) ou os artigos que o citam (forward)  Mas a ferramenta Connected Papers propõe uma abordagem alternativa para essa busca. O problema inicial é dado um artigo de interesse, precisamos encontrar outros artigos relacionados de "certa forma". Find different methods and approaches to the same subject Track down the state of the art rese...

Knowledge Graph Embedding with Triple Context - Leitura de Abstract

  Jun Shi, Huan Gao, Guilin Qi, and Zhangquan Zhou. 2017. Knowledge Graph Embedding with Triple Context. In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17). Association for Computing Machinery, New York, NY, USA, 2299–2302. https://doi.org/10.1145/3132847.3133119 ABSTRACT Knowledge graph embedding, which aims to represent entities and relations in vector spaces, has shown outstanding performance on a few knowledge graph completion tasks. Most existing methods are based on the assumption that a knowledge graph is a set of separate triples, ignoring rich graph features, i.e., structural information in the graph. In this paper, we take advantages of structures in knowledge graphs, especially local structures around a triple, which we refer to as triple context. We then propose a Triple-Context-based knowledge Embedding model (TCE). For each triple, two kinds of structure information are considered as its context in the graph; one is the out...

KnOD 2021

Beyond Facts: Online Discourse and Knowledge Graphs A preface to the proceedings of the 1st International Workshop on Knowledge Graphs for Online Discourse Analysis (KnOD 2021, co-located with TheWebConf’21) https://ceur-ws.org/Vol-2877/preface.pdf https://knod2021.wordpress.com/   ABSTRACT Expressing opinions and interacting with others on the Web has led to the production of an abundance of online discourse data, such as claims and viewpoints on controversial topics, their sources and contexts . This data constitutes a valuable source of insights for studies into misinformation spread, bias reinforcement, echo chambers or political agenda setting. While knowledge graphs promise to provide the key to a Web of structured information, they are mainly focused on facts without keeping track of the diversity, connection or temporal evolution of online discourse data. As opposed to facts, claims are inherently more complex. Their interpretation strongly depends on the context and a vari...