Dissertação de MestradoType-aware XML Duplicate DetectionOrientadorPavel Pereira Calado Co-OrientadorHelena Isabel de Jesus Galhardas EnquadramentoMuitas empresas armazenam dados essenciais ao seu funcionamento em várias bases de dados independentes. É frequente este processo dar origem à existência de dados redundantes, o que pode implicar custos desnecessários no seu funcionamento. Por exemplo, uma empresa que guarde informação sobre o cliente em duas bases de dados separadas pode, inadvertidamente, enviar correspondência em duplicado. Para resolver este problema, foi proposto num mestrado anterior, com sucesso, um método eficaz de detecção de duplicados em BDs. No entanto, este método limitava-se a comparar todos os elementos no objecto XML como strings de texto. No entanto, é possível determinar o tipo destes elementos através do seu esquema (DSD ou XSD). Este trabalho consiste na implementação de um sistema de detecção de duplicados em XML capaz de usar o tipo dos elementos para escolher correctamente a melhor função de similaridade a usar. ObjectivosImplementar um método de detecção e eliminação de objectos duplicados em bases de dados XML, capaz de analisar cada elemento dos objectos XML de acordo com o seu tipo. DescriçãoEste trabalho consistirá em: * realizar uma pesquisa bibliográfica sobre detecção de duplicados * estudar o sistema existente de detecção de duplicados em XML * desenhar uma solução para a escolha de funções de similaridade de acordo com o tipo dos elementos implementar a solução desenhada * testar e avaliar a solução implementada- Resultado EsperadoSistema de detecção e eliminação de objectos duplicados em bases de dados XML, capaz de analisar cada elemento dos objectos XML de acordo com o seu tipo. URL da descrição detalhada da dissertaçãoObservaçõesReferências * Structure-based inference of xml similarity for fuzzy duplicate detection Localização da realização da dissertaçãoINESC-ID, Taguspark |
|||