Modelagem de coortes com dados administrativos
19 de janeiro de 2020
1 Prefácio
<! —- –>
1.1 Por que coortes com dados administrativos?
A administração pública disponibiliza um volume crescente de dados abertos, cujo uso também aberto implica no fortalecimento da democracia. Boa parte do universo dos dados é operada pela Tecnologia da Informação em Saúde.
O Ministério da Saúde disponibiliza mais de 10 bilhões de registros que podem ser usados em estudos ecológicos e mais de 250 milhões de registros de medicamentos individualizados, isto é, há identificador que possibilita juntar registros do mesmo indivíduo a partir de diferentes bases.
Outros 3 bilhões de registros da assistência farmacêutica não são disseminados, mas podem ser acessados com dados individualizados via Lei de Acesso à Informação (LAI).
O acompanhamento de populações com dados abertos pode ser utilizado para monitorar políticas públicas e comparar a efetividade das tecnologias de saúde disponíveis.
<! —- –>
1.2 Estrutura do curso
- Ciência da Informação: modelagem do processo
 - Ciência da Computação: processamento de dados
 
Caption for the picture.
Caption for the picture.
- Apresentação de dados administrativos abertos de saúde e coleta por máquina.
 - Extração, Transformação e Carga para integração de dados administrativos com auxílio de linguagem estruturada de consulta (SQL).
 - Desambiguação de dados de usuários.
 - Extração de dados segundo diagnóstico ou procedimento e modelagem de coorte.
 
1.2.1 Período 1: Informática em Saúde e Dados Abertos em Saúde
- Apresentação
 - Mapa da Informática em Saúde
 - Digital literacy e Tecnologia da Informação em Saúde
 - Planejamento estratégico e Saúde Digital
 - O uso de dados administrativos
 - Atividade prática: Mapa dos dados administrativos
 - Linked data
 - Sistemas de suporte à decisão
 
1.2.2 Período 2: Modelagem de banco de dados estruturados
- Modelagem Relacional
 - Modelagem Analítica
 
1.2.3 Período 3: Sistema Gerenciador de Banco de Dados (SGBD)
- Consulta em Linguagem Estruturada (SQL)
 
1.2.4 Período 4: Relacionamento de registros
- Tabela Fato de pessoas
 - Tabela Fato de atendimentos
 - Tabelas dimensão
 
1.2.5 Período 5: Modelagem de coortes em SGBD
- Tabela fato agregada de eventos
 
<! —- –>
1.3 Onde estamos no mapa da Informática em Saúde?
Caption for the picture.
Caption for the picture.
Caption for the picture.
 [http://www.onlinejacc.org/content/70/21/2696]
Bhavnani et al. JACC VOL. 70, NO. 21, 2017 NOVEMBER 28, 2017:2696 – 718 Innovation Roadmap HPS
[Edward H. Shortliffe and Marsden S. Blois. Biomedical Informatics: The Science and the Pragmatics. Cimino (eds.), Biomedical Informatics, 2014]
A informática biomédica ou informática em saúde é uma área do conhecimento que agremia programas formais de treinamento em ciências da informação e ciências da computação nas ciências da vida, em especial, na saúde. A efetividade das decisões multiprofissionais centradas no paciente e nas populações, em meio à crescente especialização do conhecimento, tem como pressupostos:
- A gestão de informação e conhecimento é central na pesquisa e prática clínica.
 - Ambientes integrados de gestão de informação afetam a prática da medicina, promoção da saúde e pesquisa biomédica.
 - Conhecimento dos limiares da informática biomédica, ciências da computação médica, computação médica, informática clínica, bioinformática, informática em saúde pública e informática em saúde e relação com prática clínica, saúde pública, engenharia biomédica, biologia molecular, ciência da decisão, ciência da informação e ciência da computação.
 - Conhecimento dos conceitos de informática biomédica pelos estudantes e profissionais da saúde e cientistas da vida.
 
<! —- –>
1.3.1 Disciplinas da informática em saúde
- ciências da decisão (decision sciences),
 - estatística (statistics) e ciência de dados (data science)
 - ciências cognitivas (cognitive science),
 - ciências da informação (information science),
 - ciências administrativas (management science)
 
<! —- –>
1.3.2 Pesquisa em informática em saúde
- Armazenamento e modelagem de dados
 - Vocabulários, terminologias, padrões
 - Interface e usabilidade
 - Recuperação de dados, análise
 - Aquisição e representação do conhecimento
 - Alertas, apoio à decisão
 - Algoritmos, aprendizado de máquinas
 - Ensino
 - Guias de conduta, planos de cuidados, desfecho clínico
 - Interoperabilidade
 - Internet das Coisas (IoTs)
 - Avaliação de sistemas – adoção e maturidade
 
<! —- –>
1.4 Tecnologia da Informação em Saúde - TIS
*Health Information Technology - HIT
1.4.1 Registro Eletrônico de Saúde (RES)
electronic health records - EHRs
O RES, do inglês, electronic health records (EHRs), constitui importante insumo para análise institucional e planejamento estratégico superado pelo uso exclusivo de dados administrativos. O RES deve ser implantado com acesso integrado da informação clínica. O RES é a superação do prontuário tradicionalmente registrado em papel e de forma cronológica o que demanda uma leitura linear para a detecção de certa informação. É uma meta desejável às organizações tornarem-se paperless, isto é, com utilização virtualmente nula de papel. É outra meta desejável formar uma base nacional integrada constituindo Repositórios para uma Rede Nacional de Vigilância em Saúde (Regional and National Surveillance Databases), bem como Protocolos Clínicos e Diretrizes Terapêuticas (Protocols and Guidelines for Standards of Care) padrão.
<! —- –>
1.4.2 Ambiente de gestão da informação informatizado e integrado
integrated computer-based information-management environments
O ambiente informatizado auxilia no planejamento e resolução de problemas ao assegurar manejo integrado com o RES de forma acessível, com confidencialidade e segurança da informação:
- clínica
- resultados de laudos
 - registro clínico
 - telemedicina
 - apoio à decisão
 
 - administrativa e financeira
- rastreamento de pacientes
 - logística
 - recursos humanos
 
 - pesquisa
- avaliação de tecnologia em saúde -ATS
 - controle de qualidade com a avaliação de desfechos de procedimentos
 - ensaios clínicos
 - implementação de protocolos clínicos
 - vigilância em saúde
 
 - formação acadêmica
- acervo digital
 - apoio à busca bibliográfica
 - acesso a base de dados de tecnologias de saúde
 
 - automação do manejo de dados
- documentos e dados estruturados em Sistemas Gerenciadores de Bancos de Dados - SGBD.
 - ambientes de planilha de cálculo
 - ambientes estatísticos (R, STATA, SPSS)
 - ambientes de Inteligência de Negócios (Business Intelligence - BI)
 - ciência de dados (R, python).
 
 
A adoção das soluções técnicas existentes para integrar dados clínicos e administrativos requer, na prática, que sejam vencidas barreiras logísticas, políticas e financeiras. O ferramental inclui:
- criptografia de dados com chave integrada à certificação digital do emissor da informação e do indivíduo, com critérios de acesso em caso de emergência ou por questões de vigilância e pesquisa clínica.
 - marco regulatório para proteção de dados, atualmente consolidada na lei Geral de Proteção de Dados - LGPD, inspirada na Health Insurance Portability and Accountability Act - HIPAA.
 - Padrões de interoperabilidade (transmissão e compartilhamento de dados com padrão definido) como o padrão de mensageria Health Level 7 - HL7.
 - Controle de de qualidade e verificação de erros.
 - Bases de dados regionais e nacionais de dados clínicos e vigilância de teor significativo (meaningful use), como o Conjunto Mínimo de Dados - CMD e Base Nacional de Assistência Farmacêutica - BNAFAR, as quais alimentarão a Rede Nacional de Dados em Saúde (RNDS) pelo Departamento de Informática do SUS - DATASUS, o equivalente ao estadunidense Office of the National Coordinator for Health Information Technology - ONC.
 
<! —- –>
1.4.3 Ciência cognitiva
interação humano-máquina
- usabilidade
 - fatores humanos
 - aprendizagem
 - implantação
 - Atributos de Nielsen
- learnability
 - efficiency
 - memorability
 - erros
 - satisfaction
 
 
<! —- –>
1.4.4 Políticas Nacionais em Saúde Digital
Em 1990, foi publicada a Lei n° 8.080 que regulamentou o SUS mudando a ótica do sistema de saúde vigente e definindo entre as diretrizes do SUS: o direito à informação às pessoas assistidas, sobre sua saúde; a divulgação de informações quanto ao potencial dos serviços de saúde e sua utilização pelo usuário; e a utilização da epidemiologia para estabelecimento de prioridades, alocação de recursos e orientação programática.
Contudo, os sistemas de informação do SUS mantiveram a mesma fragmentação que tinham nas décadas anteriores. Ferreira (2000) cita, como exemplo disso, a publicação da portaria do Ministério da Saúde n° 130 em 1995, que definiu as competências dos órgãos do Ministério da Saúde na gestão dos Sistemas de Informação em Saúde.
A portaria estabeleceu que a Secretaria de Atenção à Saúde (SAS) fosse a gestora do SIH/SUS e do SIA/SUS, enquanto o Centro Nacional de Epidemiologia (Cenepi), subordinado à Fundação Nacional de Saúde e, posteriormente, substituído pela Secretaria de Vigilância em Saúde (SVS), fosse o gestor do SIM, Sinasc e Sinan. Portanto, o modelo instituído pela portaria manteve a mesma dualidade presente nas décadas de 1970 e 1980, separando os sistemas de informações assistenciais dos de informações epidemiológicas.
Em virtude da fragmentação dos sistemas de informação, a partir da metade da década de 1990, começaram a surgir iniciativas que procuravam maneiras de integrar esses sistemas, de modo a permitir o seguimento longitudinal dos pacientes e aumentar a sua aplicabilidade como fonte de informação em saúde. Em 1999, foi dado início ao projeto piloto que visava implantar o Cartão Nacional de Saúde. Mencionado pela primeira vez na Norma Operacional Básica do SUS de 1996, o projeto pretende criar uma identificação única para cada usuário do SUS, o que permitiria traçar sua trajetória pelos diversos sistemas.
Marcos da Saúde Digital no Brasil [http://www.saude.gov.br/acoes-e-programas/digisus/marcos-da-saude-digital-no-brasil]
- 1983 - Instituição da terminologia básica em saúde do Ministério da Saúde (MS).
 - 1986 - Criação da Sociedade Brasileira de Informática em Saúde (SBIS).
 - 1990 - Criação do SUS (Lei nº 8.080/90).
 - 1991 - Criação do Departamento de Informática do Sistema Único de Saúde (DATASUS).
 - 1997 - Regulação da proteção dos dados do cidadão em bancos de dados (Lei nº 9.507/97).
 - 1998
- Criação do Sistema de Informação da Atenção Básica do Ministério da Saúde.
 - Aprovação de padrões comuns a serem adotados pelos sistemas e bases de dados de informação em saúde (Portaria MS/GM n° 3.947/98).
 
 - 1999 - Criação do Programa Sociedade da Informação.
 - 2000 - Criação do Comitê Executivo de Governo Eletrônico para formulação de políticas, diretrizes e coordenação de ações de implantação do Governo Eletrônico.
 - 2002
- Criação do Conselho Brasileiro de Telemedicina e Telessaúde, atualmente Associação Brasileira de Telemedicina e Telessaúde.
 - Aprovação das normas técnicas, pelo Conselho Federal de Medicina (CFM), para o uso de sistemas informatizados para a guarda e manuseio do prontuário médico (Resolução CFM nº 1.639/02).
 - Aprovação do Programa de Pós-graduação em Informática em Saúde pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), para os níveis de mestrado e doutorado acadêmico, iniciando suas atividades formais em 2003, com a UNIFESP-SP.
 
 - 2003 Criação do primeiro curso de bacharelado em o Informática Biomédica do Brasil, na USP-RP.
 - 2004 Início do processo de Certificação de Sistemas de Registro Eletrônico em Saúde pela SBIS e CFM.
 - 2005
- Inicio da Troca de Informações em Saúde Suplementar (TISS).
 - Início do projeto de Telemática e Telemedicina em Apoio à Atenção Primária à Saúde no Brasil. - Atualmente conhecido como Programa Nacional Telessaúde Brasil Redes do Ministério da Saúde.
 
 - 2006
- Aprovação da Política de Promoção da Saúde (Portaria GM/MS nº 687/06).
 - Criação da Rede Universitária de Telemedicina (RUTE).
 
 - 2007 - Aprovação das normas técnicas, pelo CFM, de digitalização e uso dos sistemas informatizados para a guarda e manuseio dos documentos dos prontuários dos pacientes, autorizando a eliminação do papel e a troca de informação identificada em saúde (Resolução CFM nº 1.821/07).
 - 2008 - Instituição, pela Agência Nacional de Saúde Suplementar (ANS), da Terminologia Unificada da Saúde Suplementar (TUSS) do Padrão TISS (IN nº 30/08).
 - 2009 Instituição do Comitê de Informação e Informática em Saúde (CIINFO/MS) (Portaria GM/MS nº 2.466/09).
 - 2011
- Regulamentação do Sistema Cartão Nacional de Saúde (Portaria GM/MS nº 940/11), iniciado em 1999.
 - Regulamentação do uso de padrões de interoperabilidade e informação em saúde para sistemas de informação em saúde do SUS no âmbito do SUS, sistemas privados e saúde suplementar (Portaria GM/MS nº 2.073/11).
 - Redefinição e ampliação do Programa Telessaúde Brasil, que passa a ser denominado Programa Nacional Telessaúde Brasil Redes (Portaria GM/MS nº 2.546/11).
 
 - 2013
- Estabelecimento de regras para implantação de novos aplicativos, sistemas de informação em saúde ou novas versões de sistemas e aplicativos já existentes no âmbito do SUS (Resolução CIT nº 6/13).
 - Lançamento da Estratégia e-SUS Atenção Básica e instituição do Sistema de Informação em Saúde para a Atenção Básica (SISAB) (Portaria GM/MS nº 1.412/13).
 
 - 2014
- Estabelecimento de princípios, garantias, direitos e deveres para o uso da Internet no Brasil: o Marco Civil da Internet (Lei n° 12.965/14).
 - Aprovação do 1º Mestrado Profissional em Telemedicina e Tessaúde pela UERJ-RJ.
 
 - 2015
- Instituição da Política Nacional de Informação e Informática em Saúde (PNISS) (Portaria GM/MS nº 589/15).
 - Criação do 1º Mestrado Profissional em Informática em Saúde pela UNIFESP-SP.
 
 - 2016
- Instituição de regras para o compartilhamento de bases de dados na administração pública federal (Decreto nº 8.789/16).
 - Instituição do Comitê Gestor da Estratégia e-Saúde (Resolução CIT nº 5/16).
 - Instituição do Conjunto Mínimo de Dados da Atenção à Saúde (CMD) (Resolução CIT nº 6/16).
 - Definição do prontuário eletrônico como modelo de informação para registro das ações de saúde na atenção básica (Resolução CIT nº 7/16).
 
 - 2017
- Aprovação e Publicação do Documento de Visão da Estratégia e-Saúde (Resolução CIT nº 19/17).
 - Aprovação e adoção dos modelos de informação referentes aos documentos clínicos de Sumário de Alta Hospitalar e de Registro do Atendimento Clínico, com vistas à implementação do Registro Eletrônico em Saúde (Resolução CIT nº 24/17).
 - Instituição do Programa de Informatização das Unidades Básicas de Saúde (PIUBS) (Portaria GM/MS nº 2.920/17).
 - Disposições sobre o Conjunto Mínimo de Dados da Atenção à Saúde (Decreto nº 14.501/17).
 
 - 2018
- Início da subscrição do Brasil à SNOMED-CT
 - Alteração da redação do item III-a do Art. 2º da Resolução de Instituição do Comitê Gestor da Estratégia e-Saúde (Resolução CIT nº 38/18).
 - Instituição do Repositório de Terminologias em Saúde (RTS) (Resolução CIT nº 39/18).
 - Aprovação do Planejamento 2018-2021 do Centro Nacional de Terminologias em Saúde (CENTERMS) na 20ª Reunião Ordinária do Comitê Gestor da Estratégia e-Saúde (05/05/18).
 
 - 2019
- Conecte SUS
 - Rede Nacional de Dados em Saúde - RNDS
 
 
 
<! —- –>
1.4.5 Arquitetura
A arquitetura de negócios (business architecture) explica os processos usados por uma empresa para atingir objetivos, por exemplo, a arquitetura de negócios do sistema de informações de saúde consistem em serviços de saúde, como registros de pacientes, registros de saúde individuais, classificação de doenças, sintomas e procedimentos, relatórios diagnósticos, sugestões, prescrições e planos de tratamento, etc.
Arquitetura de aplicações ( applica:on architecture) lida com o desenvolvimento de diferentes aplicações e a interação entre eles. Esta arquitetura é essencial para o projeto e desenvolvimento de requisitos de software relevantes para interface com sistemas de saúde como instrumentos padronizados para coleta de dados, comunicação de dados serviços, análise e modelagem de dados, geração de relatórios e aplicação de reconhecimento de fala no idioma local.
A arquitetura de dados (data architecture) explica métodos de armazenamento e recuperação de dados, modelos de dados, dicionário de metadados, padrões
Arquitetura tecnológica (technical architecture) explica como a infra-estrutura e o hardware de software, aplicações de suporte à infraestrutura e suas interações.
 
 
<! —- –>
1.4.6 Categorias de Padrões em Informática em Saúde
- Recursos Semânticos
 - Modelos de Informação
 - Segurança
 - Interoperabilidade
 
Exemplos
- Recursos Semânticos
- Classificações (CID, CIAP, ATC, TUSS)
 - Terminologias Clínicas (LOINC)
 - Ontologias (SNOMED-CT, dm+d)
 
 - Conteúdo
- Modelos de Informação (HL7 v3, OpenEHR)
 - Repositório de artefatos clínicos (CID, ATC, KEEG, GO)
 
 - Transmissão / comunicação
- Padrões IHE (Integrating the Healthcare Enterprise, e.g., HL7, DICOM)
 
 - Segurança, privacidade
- Consentimentos
 - Assinatura digital (ICP-Brasil)
 - Legislação
 
 
<! —- –>
1.4.7 Dados de Saúde no Brasil
No Brasil, o Sistema Único de Saúde (SUS) possui sistemas de informação com grande potencial como fonte de informações que auxiliam na definição de prioridades e diretrizes para a gestão do sistema de saúde. No entanto, esses sistemas são fragmentados e desarticulados, tendo uma visão centrada nos procedimentos e não no indivíduo, o que dificulta o seguimento longitudinal dos pacientes. Queiroz, Odilon de. Relacionamento probabilístico de registros na integração de sistemas de informação do SUS. Dissertação (mestrado). UFMG, Belo Horizonte, 2009
- Sistema de Informações de Agravos de Notificação (SINAN),
 - Sistema de Informações de Nascidos Vivos (SINASC),
 - Sistema de Informações de Mortalidade (SIM),
 - Sistema de Informações Hospitalares do SUS (SIH/SUS),
 - Sistema de Informações Ambulatoriais do SUS (SIA/SUS),
 - Cadastro Nacional de Estabelecimentos de Saúde (CNES),
 - Sistema de Cadastramento de usuários do SUS (CADSUS),
 - Sistema de Avaliação do Programa de Imunização (PNI/API),
 - Sistema de Informação de Atenção Básica (SIAB),
 - Registro de Câncer de Base Populacional (RCBP),
 - Sistema de Informações sobre Orçamentos Públicos em Saúde (SIOPS),
 - Sistema de Informações de Beneficiários (SIB),
 - Sistema de Cadastro de Operadoras (CADOP),
 - Pesquisa Nacional sobre Demografia e Saúde (PNDS),
 - Inquérito domiciliar sobre comportamento de risco e morbidade referida de doenças e agravos não - transmissíveis), Vigilância de Doenças Crônicas por Inquérito Telefônico (VIGITEL);
 
Apresentação dos dados do DATASUS.
Caption for the picture.
<! —- –>
1.5 Informações acerca de software e convenções
Majoritariamente, os exemplos são adequados ao projeto R, adotando-se o RStudio.
O processamento ocorre, adicionalmente, em PostgreSQL.
<! —- –>
1.6 Agradecimentos
- Aos membros da Unidade de Avaliação de Tecnologias em Saúde – UATS, Centro Internacional de Pesquisa do Hospital Alemão Oswaldo Cruz - HAOC
 - Ao programa de Pós-graduação em Saúde pública e ao departamento de Medicina Social da Universidade Federal de Minas Gerais (UFMG)
 - Aos organizadores do curso de Especialização em Informática em Saúde, HSL
 - Ao Departamento de Gestão e Incorporação de Tecnologias e Inovação em Saúde (DGITIS) da Secretaria de Ciência, Tecnologia, Inovação e Insumos Estratégicos em Saúde (SCTIE) do Ministério da Saúde (MS)
 
<! —- –>
1.7 Autoria
Formação acadêmica dos interessados
Objetivos com o curso
Objetivos do autor.
Felipe Ferré trabalha como cientista de dados.
- Formação
- programador (CEFET-SP Uned Cubatão, 2000),
 - farmacêutico com habilitação em indústria (Universidade Federal de Alfenas UNIFAL-MG, 2007),
 - doutor em bioinformática (Universidade Federal de Minas Gerais - UFMG, 2013),
 - pós-doutor em medicamentos e assistência farmacêutica (UFMG, 2014)
 - em processo de conclusão de doutorado em saúde pública (UFMG, 2020).
 - em processo de conclusão do curso de Especialização em Informática em Saúde, (Hospital Sírio Libanês, 2020).
 
 - Experiência profissional
- desenvolvimento de software na área farmacêutica (drogaria, indústria, ATS),
 - P&D de medicamentos e gerência de controle e garantia da qualidade em indústria farmacêutica (2008-2012),
 - construção de sala de situação em saúde NESCON/UFMG.
 - Atualmente presta consultoria pela Organização Pan-Americana da Saúde (OPAS) ao Departamento de Gestão e Incorporação de Tecnologias e Inovação em Saúde - DGITIS, Ministério da Saúde, Brasil.
 - Contribui para a estratégia saúde digital na informatização da Assistência Farmacêutica no SUS.
 
 - Áreas de interesse
- big data e mineração de dados em saúde para apoio à decisão estratégica e clínica;
 - políticas, judicialização e economia política da saúde
 - estudos de utilização de medicamentos.
 
 
<! —- –>