Na UFSC eu fiz um trabalho um pouco mais simples. Os dados “básicos” fora mapeados para o banco de dados.
Produção Bibliográfica, Producao Técnica, Outras Produções.
Somente os elementos “DADOS-BASICOS-…”, foram inseridos no banco de dados e em uma mesma tabela. Eu usei XPath e um arquivo de configuração. Funcionou para as nossas necessidades. DW dos discentes.
Linha do arquivo de especificação
1,1,//PRODUCAO-BIBLIOGRAFICA//TRABALHOS-EM-EVENTOS//TRABALHO-EM-EVENTOS,DADOS-BASICOS-DO-TRABALHO,NATUREZA,TITULO-DO-TRABALHO,ANO-DO-TRABALHO,PAIS-DO-EVENTO,IDIOMA,MEIO-DE-DIVULGACAO,HOME-PAGE-DO-TRABALHO,FLAG-RELEVANCIA,DOI
Tabela
CREATE TABLE producao_lattes (
cpf varchar(15) NOT NULL,
id_tipo_producao int NOT NULL,
id_sub_tipo_producao int NOT NULL,
tipo_atividade varchar(100) NULL,
natureza varchar(100) NULL,
titulo varchar(255) NULL,
ano varchar(4) NULL,
pais varchar(100) NULL,
idioma varchar(100) NULL,
meio_divulgacao varchar(100) NULL,
home_page varchar(255) NULL,
flag_relevancia varchar(10) NULL,
doi varchar(100) NULL
)
go
Demora cerca de 3 horas para inserir todos os dados dos professores da UFSC. Estamos pegando o currículo on-line usando HttpUnit e os serviços do CNPq.
[]'s
Fred