O Projeto
Início
O projeto teve sua origem como uma tese de doutorado defendida na Universidade Federal de São Paulo – UNIFESP, cujo resultado prático foi um ambiente para mineração de dados disponível para uso, denominado MINERSUS.
Motivação
A Saúde Pública é garantida a todos os cidadãos brasileiros através do Sistema Único de Saúde (SUS) que se materializou, juridicamente, com a Constituição Federal de 1988 e pelas Leis Orgânicas da Saúde em 1990.
A operacionalização deste complexo Sistema de Saúde demanda um grande volume de informações para subsidiar mecanismos de controle, processos, procedimentos e, sobretudo, a tomada de decisão e a elaboração de políticas públicas de Saúde. A coleta, processamento e disseminação de informações para o SUS é de responsabilidade de um órgão subordinado ao Ministério da Saúde, denominado Departamento de Informática do SUS (DATASUS) que, para cumprir essa tarefa, desenvolveu vários sistemas de informação destinados à gestão do SUS, tais como, Sistema de Informações Ambulatoriais (SIA), Sistema de Informações Hospitalares (SIH), Cadastro Nacional de Estabelecimentos de Saúde (CNES), Sistema de Informações sobre Mortalidade (SIM) e Sistema de Informações de Nascidos Vivos (SINASC).
Embora os sistemas do DATASUS produzam um grande volume de informação, eles não estão integrados, cada sistema mantém seus dados em bases isoladas, e, conseqüentemente, o uso de técnicas e ferramentas computacionais destinadas à produção de informação gerencial torna-se muito difícil.
A dificuldade para mineração e extração de informação gerencial, a partir das bases de dados do SUS, evidenciou a necessidade da criação de um ambiente computacional adequado à produção de informações para apoio na gestão da Saúde Pública, contendo as bases dos diversos sistemas integradas e ferramentas adequadas à mineração e ao processamento analítico dos dados.
A criação de um ambiente computacional que permita a produção de informação gerencial a partir dos dados dos sistemas de informação do DATASUS pode representar um importante elemento de apoio à gestão da Saúde Pública, além de contribuir para os estudos epidemiológicos e os de vigilância sanitária.
A ciência da computação apresenta técnicas e ferramentas destinadas ao processamento analítico (OLAP - On-line Analytical Processing) e à descoberta de conhecimento em bases de dados (Mineração de Dados). A aplicação dessas técnicas aos dados dos sistemas de informação do DATASUS pode representar um importante elemento de apoio à gestão da Saúde Pública, além de contribuir para estudos epidemiológicos e de vigilância sanitária.
As técnicas OLAP e de mineração de dados vêm sendo aplicadas com êxito em diversos segmentos empresariais. Na área da Saúde, especificamente na Saúde Pública, há exemplos bem sucedidos da aplicação dessas técnicas, porém, há algumas particularidades no contexto brasileiro que dificultam a sua aplicação. Ajustes são necessários para que os resultados sejam tão eficazes como em outros segmentos do mercado. Alguns pontos, como falta padronização, tabelas versionadas, integridade referencial e outros contribuem para a dificuldade na aplicação de tais técnicas no contexto da Saúde Pública brasileira.
Apesar dos problemas e dificuldades, os benefícios que podem ser obtidos motivaram os esforços para o projeto e desenvolvimento de um ambiente computacional para extração de informações através da mineração das bases de dados do SUS.
Partindo da necessidade de criação deste ambiente surgiu uma pergunta: Quais são os componentes adequados para este ambiente? Esta questão foi adotada como objeto de pesquisa e sua resposta constitui o objetivo deste trabalho, que é a proposição e implementação de um ambiente computacional capaz de extrair informações analíticas através da mineração das bases de dados do SUS.
Características do Ambiente
O ponto de partida foi a investigação dos principais desafios e peculiaridades para implantação de uma solução analítica na área da Saúde Pública, e, com base nestes desafios, foram estabelecidas algumas premissas para o ambiente computacional:
As principais premissas estabelecidas para o ambiente foram:
- Produzir a informação a partir de um armazém de dados que integra os dados dos diversos sistemas do SUS;
- Prover um mecanismo para efetuar a carga dos dados, dotado de funcionalidades destinadas à solução dos problemas de qualidade dos dados;
- Prover um mecanismo que facilite a análise tempo-espacial de eventos, como, por exemplo, epidemias;
- Prover um mecanismo para tratar adequadamente o versionamento das tabelas;
- Integrar as técnicas OLAP e de Mineração de Dados de maneira transparente ao usuário, como parte do processo analítico num fluxo gradativo e contínuo;
- Prover uma interface simples para o usuário extrair a informação gerencial sem a necessidade de um especialista para preparar os dados ou criar relatórios.
O ambiente computacional proposto foi implementado integralmente, incluindo a análise e documentação das bases de dados dos sistemas do SUS, a modelagem do armazém de dados, a carga dos dados, a implementação dos componentes para carga e produção de informação.
Os componentes propostos para o ambiente são dotados de características adequadas ao contexto dos sistemas de informação do SUS, como por exemplo, downloads e extração de arquivos que, embora sejam tarefas simples, consumiriam aproximadamente três horas de trabalho em cada carga. Outros recursos, tais como análise de estrutura, análise de conteúdo e versionamento de tabelas, contribuem para garantir a qualidade da informação produzida.
O uso de assistentes com textos explicativos para conduzir as ações do usuário, mostrou-se uma estratégia decisiva para a facilidade de uso da ferramenta, além de reduzir a possibilidade de o usuário produzir informações inadequadas. Isto facilitaria a disseminação do ambiente para outros usuários, além de gestores da saúde pública, como pesquisadores, estudantes e até mesmo cidadãos comuns.
Uma das grandes contribuições proporcionadas pelo ambiente é a agilidade na elaboração de relatórios integrando dados dos diferentes sistemas da saúde pública. No contexto atual, a produção de um relatório contendo dados de diferentes sistemas do SUS demanda um esforço de cinco horas, em média, de um profissional com habilidade num conjunto de ferramentas necessárias à obtenção, extração e integração de dados. Com o ambiente, o próprio gestor da saúde consegue obter tais informações em alguns minutos.
A integração das tecnologias OLAP e de Mineração de Dados no ambiente proposto é bem mais abrangente do que a simples existência das duas tecnologias numa mesma plataforma; as atividades de mineração de dados complementam o processo analítico, dando ao gestor de saúde mais informação que a produzida pela tecnologia OLAP.
Um dos diferenciais entre o ambiente proposto e algumas ferramentas para mineração de dados existentes, é a abrangência. Tais ferramentas são destinadas exclusivamente para a mineração de dados, enquanto o ambiente proposto permite desde a emissão de um simples relatório até a descoberta de conhecimento (por exemplo, gastos abusivos) por meio das técnicas de mineração, e tudo isto num fluxo gradativo e contínuo, sem a necessidade de um profissional de informática para preparar os dados ou criar relatórios.
Nenhum comentário:
Postar um comentário