quarta-feira, janeiro 28, 2009

Semantics-Assisted Problem Solving on the Semantic Grid

Autores: Liming Chen, Nigel Richard Shadbolt, Feng Tao, Carole Goble, Colin Puleston and Simon J. Cox
Publicado em: Computational Intelligence, Volume 21, Number 2, 2005

Grades computacionais fornecem um conjunto extensível de serviços e permitem a composição e decomposição rápida de tais serviços em confederações transientes de várias maneiras de forma que tarefas maiores do que aquelas permitidas pelos componentes individuais possam ser completadas. Existe uma separação crucial entre os projetos atuais de grades e a visão de e-Science, onde há um alto grau de facilidade e automatização, sendo que existem colaborações flexíveis e computações de escala global. A grade semântica busca suportar toda a riqueza da e-Science ao considerar seus requisitos através do uso para recursos da Grade em seu sentido mais amplo. Tecnologias de conhecimento avançado são relacionadas com a gerência de conhecimento científico na grade em termos de uma atividade de ciclo de vida orientada ao conhecimento que varia desde aquisição de conhecimento até modelagem, recuperação, reuso, publicação e manutenção. Engineering Design Search and Optimisation (EDSO) é o processo onde modelagem e análise são utilizadas para recuperar projetos aprimorados. O objetivo da e-Science em EDSO é explorar a computação distribuída de larga escala das grades juntamente com seus recursos de dados, ambos inacessíveis no primeiro momento, para engenharia de projetos.

No framework apresentado, informação e conhecimento sobre um domínio específico são adquiridos, modelados e representados utilizando uma variedade de técnicas e formalismos, que podem incluir ontologias, regras de produção e outras informações relacionadas ao domínio. Engenharia e gerência de conhecimento tentam tratar seis desafios do ciclo de vida do conhecimento: aquisição, modelagem, recuperação, reuso, publicação e manutenção. Ao contrário de práticas tradicionais de engenharia de conhecimento que concentram em capacidades separadas, esse framework trata cada problema individual em maneira muito mais coordenada para que os resultados de uma parte do trabalho possam ser usados de maneira apropriada. As ontologias são parte fundamental na interação e inter-operação das atividades de conhecimento. Também é adotada uma abordagem orientada a serviços para gerência distribuída de conhecimento. Todas as atividades relacionadas ao consumo e fornecimento do conhecimento são implementadas como serviços. Um framework modular em camadas faz a gerência de conhecimento robusta e escalar. Apesar de interagirem, as interações das atividades de manipulação de conhecimento não são fortemente acopladas.

Um conjunto básico de serviços tem sido considerado indispensável para as grades semânticas. São os seguintes:

  • Serviços de ontologia fornecem acesso aos conceitos, suas propriedades e relacionamentos em um modelo de dados ontológico.

  • Serviços de anotação associam recursos da grade com suas interfaces semânticas e meta-dados através de ontologias para agregar semântica a tais recursos.

  • Serviços de publicação de conhecimento são responsáveis pela disponibilização de conhecimento na grade para reuso.

  • Serviços de inferência fornecem capacidades de raciocínio sobre várias entidades de conhecimento nos repositórios.

O portal de conhecimento, o ponto de entrada para o sistema de gerência integrado de conhecimento, possibilita uma infra-estrutura de segurança para autenticação e autorização, fazendo com que o conhecimento seja usado e atualizado de maneira controlada.

Resolução de problemas na grade consiste em descobrir serviços e compô-los em um workflow. Para a maioria das disciplinas científicas, um workflow é tanto específico ao domínio quanto ao problema. A seleção apropriada de serviços em um determinado ponto do workflow geralmente depende dos resultados dos serviços executados anteriormente. Desta forma, não é prático especificar, a priori, a seqüência precisa dos serviços para um problema. Descoberta semântica de serviços geralmente utiliza meta-dados semânticos de um perfil de serviço tais como autor, organização, algoritmo utilizado, versão e utilização para criar um critério de busca para o recurso buscado. Um motor de inferência baseado em lógica descritiva irá realizar inferências sobre recursos de grade semânticos para descobrir aqueles que estão de acordo com seus objetivos de busca. Quando um workflow é construído, cada vez que um serviço é adicionado os usuários podem obter a informação semântica da saída gerada. Utilizando essa saída, é possível que um raciocinador de DL consiga realizar buscas semânticas no repositório de serviços, retornando uma lista de serviços compatíveis. Devemos observar que também é comum o caso onde há muitos serviços disponíveis para uma tarefa e cada serviço pode ter diferentes desempenhos em diversas configurações. Em resumo, resolução de problemas baseada em semântica pode ajudar a descobrir os serviços necessários de maneira precisa e tem a vantagem de fornecer orientação específica em múltiplos níveis de granularidade durante a composição de serviços.

Um ambiente de resolução de problemas (Problem Solving Environment - PSE) baseado em grade tenta abstrair as complexidades de acessar a grade fornecendo um conjunto de ferramentas completo de alto nível projetado para resolver determinado tipo de problema. O projeto GEODISE (Grid Enabled Optimisation and Design Search in Engineering) possui estabelecido um PSE com vários módulos de funcionalidade. O módulo dos serviços de ontologia fornecem um mecanismo para usuários acessarem e utilizarem qualquer ontologia na Web. O módulo de serviços de computação semânticos abriga todos os tipos de recursos EDSO tais como ferramentas computacionais e algoritmos que podem usados para alcançar uma tarefa específica. A descoberta de serviços é feita através da Semantics-based Web Search Engine (SWSE).

O componente básico do PSE em estudo é o ambiente de construção de workflow (Workflow Construction Environment – WCE). Os seus principais componentes são:

  • Navegador de Serviços Classificados: apresenta uma hierarquia de serviços classificados em termos da ontologia de serviços EDSO.

  • Orientador de Workflows: fornece orientação na composição e configuração de serviços baseadas nas informações semânticas.

  • Monitor de Estado: monitora a construção do workflow.

  • Raciocinador Ontológico: realiza inferências no repositório de conhecimento para auxiliar a composição, descoberta e configuração de serviços.

  • Editor de Configuração de Serviço: é um formulário baseado em ontologias criado dinamicamente que contém os atributos dos serviços e seus valores.

  • Editor de Composição de Serviço: um ambiente de trabalho gráfico para composição de serviço.

Durante os processos de construção de workflow, uma vez que o serviço é descoberto e adicionado a um workflow no Editor de Composição de Serviço, o Monitor de Estado irá coletar e manter informações sobre a entrada e saída do serviço. O estado atual do workflow será transmitido ao Orientador de Workflow, que irá fazer uso do Raciocinador Ontológico para realizar inferências sobre o repositório de conhecimento. Orientações relevantes tais como qual serviço deve ser o próximo ou como escolher um parâmetro para configuração do serviço serão retornadas para o WCE. Usuários podem selecionar um dos serviços sugeridos e configurá-los de acordo com as recomendações. Repetindo esse processo um workflow pode ser construído rapidamente. O poder do PSE vem da abordagem de resolução de problemas baseada em semântica, que extrai e explora o conhecimento do domínio incorporado nas descrições semânticas dos recursos para a composição e configuração dos mesmos.

Para o estabelecimento do GEODISE PSE, um estudo detalhado do domínio foi feito para a criação de ontologias e regras de produção. Os recursos no GEODISE geralmente são funções do MATLAB, cujas descrições semânticas são geradas ao relacionar meta-dados do recurso e sua interface com conceitos do domínio EDSO. Os serviços de ontologia consistem de um modelo de dados para a ontologia EDSO, um servidor de ontologia que permite aos outros módulos acesso aos conceitos e suas propriedades, um raciocinador (FaCT) e um conjunto de APIs do usuário que servem como interface entre as aplicações e a ontologia. Os serviços de anotação são acessados através de uma interface gráfica que permite ao usuário relacionar conceitos da ontologia com com os recursos. Um repositório de conhecimento foi definido de maneira centralizada, em vez de manter as descrições semânticas na mesma localização dos recursos. Tal escolha foi feita para facilitar o caráter dinâmico da criação de organização virtuais. A descoberta de serviços também é feita através de uma interface, procurando por instâncias baseadas na ontologia do domínio.

Comentário:

Um artigo bem legal, que mostra uma grade semântica em funcionamento onde os meta-dados não servem apenas para a descoberta, mas também para a composição de workflows. Na verdade a composição é um processo bem simples, onde para cada passo que o usuário acrescenta, são apresentadas sugestões para próximos passos além de formulários para personalização de parâmetros.

Algo mais interessante está na seção de trabalhos futuros. Há uma discussão sobre a diferença entre a grade de conhecimento e a grade semântica. A grade de conhecimento tem como objetivo fornecer um ambiente de aplicações sustentável e inteligente na Internet que permita a indivíduos e aplicações integrantes das organizações virtuais capturar, publicar, compartilhar e reusar recursos de conhecimento explícitos. Ela é construída agregando e sintetizando conhecimento de dados através de mineração e métodos de referências, permitindo a sistemas de busca fazerem referências, responder perguntas e tirar conclusões de grandes quantidades de dados. A diferença parecer ser que a grade semântica tem como alvo a criação e povoamento de semântica e conhecimento enquanto a grade de conhecimento está mais preocupada na extração, inferência e mineração de conhecimento oriundo da grade. Podemos dizer que a grade semântica é uma camada de suporte a grade de conhecimento, sendo essa última muito mais próxima do usuário em termos de abstração.



Post a Comment

Nenhum comentário: