Introdução

Dados abertos são aqueles publicados e disseminados em meio digital, na internet, seguindo alguns critérios que possibilitam sua utilização, consumo e cruzamento. A abertura de dados está, portanto, baseada na ideia de envolvimento de todos os setores da sociedade – cidadãos, iniciativa privada, academia e governo. Tal envolvimento possibilita, entre outros benefícios, mais participação social no desenvolvimento de políticas públicas, maior controle dos gastos públicos, maior transparência governamental e criação de serviços ou aplicativos que utilizam dados abertos para melhorar a vida dos cidadãos.

Especificamente em relação a dados escolares abertos, que são aqueles compartilhados como informações gerais de escolas, eles podem ser usados para ajudar alunos, pais, professores, comunidade escolar, sociedade civil, academia, gestores e profissionais da educação a monitorar os serviços prestados pela escola, a realizar pesquisas que contribuam para a melhoria do ensino, a desenvolver soluções para desafios educacionais, a planejar de modo mais eficiente metas educacionais a serem alcançadas, entre outros. Neste especial, que integra o projeto Ciência de Dados na Educação do Instituto Unibanco em parceria com o CRIE (Centro de Referência em Inteligência Empresarial, da COPPE/UFRJ), vamos explicar o que caracteriza um dado aberto e elencar os principais benefícios da abertura de dados escolares para o ensino-aprendizagem e para um governo aberto. Além disso, vamos apresentar casos práticos de como a sociedade e a academia podem contribuir com um ensino de mais qualidade a partir do acesso a esses dados.

Para uma experiência mais profunda sobre o tema, compartilhamos uma série de links para materiais do Observatório de Educação - Ensino Médio e Gestão ao longo do conteúdo. Utilize-os para uma leitura ainda mais rica e completa sobre dados abertos na educação e conheça inúmeras oportunidades para serem exploradas.

O que são dados abertos e o impacto da abertura de dados na educação

Para o Open Data Institute - ODI, os dados existem num espectro que varia de fechado a compartilhado e aberto. O ODI foi fundado por Tim Berners-Lee (um dos criadores da internet e diretor do World Wide Web Consortium - W3C, que supervisiona o desenvolvimento continuado da web) e Nigel Shadbolt (professor das universidades britânicas de Oxford e de Southampton) para promover a cultura de dados abertos por meio de uma rede de "nós" pelo mundo.

Fonte: ODI

De acordo com o decreto que institui a Política de Dados Abertos do Poder Executivo Federal e estabelece normas para a livre utilização das bases de dados, dados abertos

Os dados abertos são pautados por três leis, propostas pelo especialista em políticas públicas, ativista dos dados abertos e palestrante de políticas públicas na Harvard Kennedy David Eaves. Essas "leis" são um conjunto de testes para avaliar se um dado pode, de fato, ser considerado aberto.

  1. Se o dado não pode ser encontrado e indexado na web, ele não existe;
  2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado;
  3. Se algum dispositivo legal não permitir sua replicação, ele não é útil.

A fim de qualificar as publicações de dados abertos e indicar a maturidade da abertura dos dados, Tim Berners-Lee propôs um esquema de 5 estrelas para a publicação de dados abertos. O esquema (figura abaixo) vai desde a publicação sob uma licença aberta (1 estrela) a dados ligados/conectados - linked data (5 estrelas).

Fonte: Tim Berners-Lee. 5 Estrelas dos Dados Abertos. Disponível aqui.

Segundo o esquema, quanto mais estrelas, mais facilmente os dados poderão ser usados.

1 estrela: refere-se a um dado publicado na web em qualquer formato (imagem, tabela ou documento) e associado a uma licença que permita o seu uso e reúso sem restrições. Dados avaliados com 1 estrela precisam, ainda, ser manipulados manualmente.

2 estrelas: quando os dados são publicados em um formato que pode ser processado automaticamente por algum software (como, por exemplo, planilhas Excel em vez de uma imagem), são classificados como 2 estrelas.

3 estrelas: se os dados são publicados em formatos não proprietários (por exemplo, CSV ao invés de Excel) recebem a classificação de 3 estrelas. De acordo com as três leis apresentadas anteriormente e com a Lei de Acesso à Informação - LAI, os dados só serão considerados abertos se tiverem no mínimo três estrelas.

4 estrelas: ao receberem uma identificação única e passarem a ser conectados com outros dados, os dados podem ser classificados como 4 estrelas. A criação de links entre os dados permite que eles façam parte de uma rede maior de dados abertos e conectados, motivando o desenvolvimento de novos tipos de aplicações e ferramentas, como navegadores e motores de busca.

5 estrelas: a última classificação, de 5 estrelas, vai para os dados abertos conectados com dados já disponíveis na Web (linked open data). Ou seja, são dados publicados na web de tal forma que são legíveis por máquina, seu significado é explicitamente definido, está vinculado a outros conjuntos de dados externos e, por sua vez, podem ser vinculados a partir de conjuntos de dados externos.

Um exemplo de dado aberto na educação classificado como 3 estrelas: o Departamento de Educação na Inglaterra disponibiliza dados abertos sobre o desempenho das escolas no país. Os dados estão disponíveis como CSV e sob a Licença de Governo Aberto, que exige apenas que quem for reutilizar os dados diga que obteve os dados do Departamento de Educação. No Brasil, como já citamos no especial de aquisição de dados, o Ministério da Educação disponibiliza 52 conjuntos de dados no Portal Brasileiro de Dados Abertos e também tem um portal próprio, com 32 conjuntos de dados. Alguns Estados têm, ainda, sites específicos, como São Paulo, com números relacionados à matrícula, orçamento, infraestrutura e serviços, entre outros.

De acordo com os pesquisadores Williams Alcântara, Judson Bandeiras e outros da Universidade Federal de Alagoas (UFAL) e da Universidade de São Paulo (USP), um dos grandes desafios relacionados ao uso de dados educacionais é a diversidade de formatos e bases existentes na web, o que dificulta sua reutilização. A publicação de dados abertos conectados na educação possibilitaria o processamento automático de grande quantidade de dados, inclusive de diversas bases, por meio da integração e interoperabilidade de sistemas; promoveria o enriquecimento de dados educacionais por meio da utilização de vocabulários e de conexões com outros dados; facilitaria a descoberta de dados, através da exploração de conexões; e garantiria maior precisão dos dados, considerando que as anotações presentes em dados conectados são mais precisas que anotações presentes em documentos baseados em texto. Isso viabilizaria, ainda, a construção de bases de conhecimento que poderiam contribuir para a melhoria da gestão e o desenvolvimento educacional.

Em artigo publicado por eles, são mencionadas algumas iniciativas de dados abertos conectados no setor educacional, tais como o Linked Education, uma plataforma aberta que visa promover o uso de dados conectados educacionais por meio do incentivo ao compartilhamento de recursos e informações relacionadas à educação. O fórum do projeto permite a troca entre pesquisadores e profissionais que atuam no âmbito da web e tecnologias semânticas, o que estimula o compartilhamento de experiências, eventos e melhores práticas. É possível, ainda, acessar diversos catálogos de dados e projetos que ofertam dados conectados para a educação.

Impacto da abertura dos dados no contexto educacional

E qual o impacto de se abrir os dados da educação? Os dados escolares, quando abertos, podem gerar benefícios para o planejamento mais adequado das metas a serem alcançadas pela educação, para melhor avaliar a efetividade de medidas adotadas na educação e para orientar a tomada de decisões por parte dos estudantes.

De acordo com a Unesco, dados de escolas abertos são uma ferramenta poderosa. Quando usados adequadamente, podem promover o controle do cidadão sobre a transferência e o uso de recursos financeiros, materiais e humanos. Os dados abertos podem ser usados para cobrar ações das autoridades locais e escolares, melhorar a prestação de serviços e detectar más práticas nas escolas – e, mais importante, permitir que os cidadãos defendam seu direito a uma educação de qualidade.

Dados abertos podem contribuir, ainda, para a geração de soluções ou ferramentas para o setor educacional, por parte de cidadãos, pesquisadores e empreendedores. Destacamos algumas iniciativas neste sentido:

QEdu: portal que utiliza dados abertos educacionais, como a Prova Brasil, o Censo Escolar, o Ideb e o Enem, para prover a visualização de forma interativa. Todos eles obtidos de fontes oficiais do governo para ajudar educadores, pais e cidadãos em geral a usarem os dados de maneira mais intuitiva.

Educação em números: seção do Observatório da Educação, do Instituto Unibanco, com dados educacionais, sociais e demográficos de fontes confiáveis, muitos de bases abertas, apresentados de maneira visual.

Educação Inteligente: um dos vencedores do concurso INOVAPPS, promovido pelo Ministério das Comunicações e financiado pelo Governo Federal. Tem como objetivo principal auxiliar a melhoria da educação básica no Brasil, sendo uma plataforma de captura, análise, manipulação e publicação dos dados governamentais sobre a educação.

Prato aberto: uma espécie de "merendômetro" das escolas públicas municipais de São Paulo. A ferramenta permite a consulta dos cardápios por dia e por escola, com visualização no mapa. É a primeira vez que os cardápios são divulgados por unidade escolar – até hoje, modelos de cardápio por tipo de gestão eram publicados no Diário Oficial. Sobre o projeto, que contou com a participação da Open Knowledge Brasil (OKBR), que é o capítulo da Open Knowledge Internacional no Brasil, Fernanda Campagnucci, diretora-executiva da organização, comenta que ninguém acessava as informações dos cardápios nos Diários Oficiais e, com a visualização dos dados em um site, foi possível acompanhar não apenas com mais transparência o uso dos recursos, mas também a questão nutricional. A OKBR tem um projeto chamado “Querido Diário” que propõe utilizar Inteligência Artificial para classificar, contextualizar e expandir a informação contida nos diários oficiais municipais brasileiros, tornando-os disponíveis em uma plataforma que permite sua visualização em formato aberto e amigável. Saiba mais sobre o projeto aqui.

Dados abertos em um ecossistema educacional: ganha-ganha para todos os envolvidos

James Maddison, consultor sênior do Open Data Institute - ODI, afirma que os dados são uma parte central de qualquer ecossistema de educação moderno e eficaz. Eles ajudam, por exemplo, escolas e instituições de ensino a garantir que suas ofertas estejam alinhadas às demandas de mercado. Para exemplificar, ele comentou, em entrevista exclusiva a este especial, os resultados de um mapeamento do ecossistema de dados do setor educacional da região oeste de Londres, realizado em 2021 com a metodologia desenvolvida pelo ODI. "O objetivo inicial foi identificar quais dados estão sendo acessados, usados e compartilhados em todo o ecossistema educacional do oeste de Londres", explicou ele. "No caso do projeto, os dados abertos trouxeram benefícios para as pessoas engajadas com o sistema educacional, geralmente pessoas tentando aprender novas habilidades e que não tinham acesso a dados como oportunidades de carreira; para as organizações que oferecem cursos relacionados a estas habilidades; e para empregadores, interessados em contratar pessoas especializadas". O foco era no ensino superior e técnico, em especial cursos e empregos no setor da construção civil sustentável. "O mapeamento apresenta também a vantagem de reunir as pessoas e incentivar conversas sobre os desafios relacionados a dados e possíveis soluções", complementa. Antes de detalhar os resultados do mapeamento, vale explicar o que é um mapa do ecossistema de dados (veja mais informações sobre como mapear um ecossistema de dados abaixo). O mapa ilustra os diferentes atores – pessoas, comunidades e organizações – em um ecossistema de dados e como o valor é trocado nele. Também indica a infraestrutura de dados, que é composta por ativos de dados, padrões, tecnologias, políticas e organizações.

No caso estudado, foram identificadas as seguintes barreiras para acessar, usar e compartilhar dados, o que dificultava o casamento dos resultados de ocupação de cursos com os dados da demanda do mercado de trabalho: a) dados não existentes ou não acessíveis, especialmente em nível local; b) falta de padrões estabelecidos, tanto em torno das taxonomias usadas para descrever dados e na forma como os dados são capturados e identificados; c) falta de agilidade na atualização dos dados.

Como oportunidades, foram sugeridas as seguintes ações: a) identificar os principais softwares e bases de dados usados para melhor integração e interoperabilidade; b) melhorar a forma como os dados do lado da oferta de cursos se conectam aos dados do lado da demanda, ou seja, das habilidades necessárias para os empregadores do oeste de Londres; c) melhorar a padronização dos dados; d) se envolver com iniciativas e projetos de dados que foram identificados durante o mapeamento, que podem ter conjuntos de dados ou dados úteis que poderiam ser disponibilizados abertamente; e) identificar os provedores de dados-chave do mapeamento que não estavam envolvidos no estágios iniciais do projeto e trabalhar com eles para mapear seus dados no ecossistema.

Um dos resultados finais do mapeamento foi a criação do site SkillsWest.London, desenvolvido com o objetivo de divulgar as habilidades necessárias para ingressar na força de trabalho ambiental no oeste de Londres, direcionando-o para cursos oferecidos por instituições locais e fornecendo aconselhamento profissional. "Um dos pontos de dificuldade que todo jovem enfrenta é decidir que carreira escolher no momento de passar do ensino médio para o ensino superior ou um curso técnico/profissional. E ter dados disponíveis sobre o mercado e como as habilidades estão relacionadas às escolhas de carreira – e que geralmente não estão disponíveis – ajuda nessa decisão", explicou Maddison.

Como fazer um mapeamento do ecossistema de dados?

Segundo a metodologia do ODI, há diferentes maneiras de mapear um ecossistema de dados: sozinho ou com algumas pessoas; em um workshop com 3 a 10 pessoas envolvidas em diferentes áreas do ecossistema e facilitadores, com duração de 1 a 2 horas, com duas ou três rodadas seguintes para feedback do que foi inicialmente mapeado; ou online, similar ao workshop, quando não é possível se encontrar pessoalmente. Pode-se usar papel e canetas coloridas ou ferramentas online, como Miro, Google Jamboard e kumu. Antes de começar, é preciso identificar da maneira mais clara possível o objetivo de se realizar o mapeamento. Recomendam-se os seguintes passos:

1- Mapeie os atores

Comece com a parte do ecossistema que você conhece melhor. Use post-its ou desenhe círculos com as pessoas, organizações ou serviços que estão ligados de alguma forma aos dados. Podem ser fornecedores de dados, beneficiários, reguladores, entre outros. Se preferir, coloque cada grupo de atores com a mesma cor e use legendas.

2- Mapeie as trocas de valor “formais” ou tangíveis

Depois de mapear os atores, deve-se mapear os fluxos e trocas no ecossistema. Comece com os dados que são compartilhados ou usados por diferentes atores, desenhando linhas e adicionando legendas. Que tipos de valor esses fluxos de dados estão potencializando? Desenhe linhas semelhantes para trocas de serviços e dinheiro. Pense em outros tipos de troca. Os atores dentro do ecossistema fornecem documentos, serviços ou bens físicos? Coloque setas adicionais para cada uma delas para preencher seu mapa. Use legendas para explicar as diferentes trocas, lembrando que as trocas de valor "formais" incluem relatórios e documentos, bens físicos, dinheiro, certificados ou licenças, etc. Se não houver dados existentes, é possível indicar isso também.

3- Mapeie as trocas de valor "informais" ou intangíveis

As organizações podem apoiar umas às outras com conselhos ou feedbacks. Adicione esses tipos intangíveis de troca de valor ao mapa. Isso vai ajudar a entender mais sobre as conexões e relacionamentos entre as organizações. Sugerimos usar setas de outras cores ou pontilhadas para distingui-las.

4- Encontre oportunidades

Com o ecossistema mapeado, o que isso lhe diz? Como o valor flui no ecossistema? Existem potenciais oportunidades futuras para compartilhar valor em outras formas, como por exemplo tornar os dados mais abertos ou oferecer novos tipos de suporte? Desenhe as oportunidades no mapa em uma cor ou estilo diferente.

Maddison sugere, caso faça o mapeamento em grupo, convidar pessoas que já trabalham com dados abertos ou com o compartilhamento de dados no setor educacional e organizações e pessoas que são mais reticentes à abertura de dados, para proporcionar um debate com diversos pontos de vista. Ele alerta, ainda, que geralmente as respostas não serão resolvidas na primeira sessão. Serão necessárias mais duas ou três rodadas de feedback, para ter mais informações sobre o ecossistema. Ter o apoio do governo no setor educacional também pode ser de grande valia. Caso prefira, use este modelo (em inglês) para desenhar o mapa do ecossistema.

Como dados abertos podem ser usados no ensino-aprendizagem

Dados abertos são geralmente usados por professores em treinamentos relacionados à análise, ao processamento e à visualização de dados, possibilitando experiência prática com as técnicas e ferramentas que são comuns nessas temáticas. Embora o uso de dados abertos em sala de aula não tenha sido amplamente estudado, algumas pesquisas mostram que a utilização de dados abertos em outras disciplinas para além de ciência de dados tem efeito positivo na aquisição de outros tipos de competências relevantes para o profissional do futuro (como capacidade analítica e gestão de dados), assim como na motivação dos alunos.

A pesquisa "O uso de dados abertos como material de aprendizagem (tradução livre)", realizada por Tim Coughlan, do Instituto de Tecnologia Educacional da Open University, no Reino Unido, analisou qualitativamente a experiência de um grupo de educadores pioneiros em usar dados abertos em programas de ensino. De acordo com Coughlan, os dados abertos não parecem oferecer metodologias educacionais ou pedagógicas completamente novas, mas seu uso complementa os conceitos existentes de ensino e aprendizagem, como aprendizagem baseada em pesquisa ou em projetos, e personalização da aprendizagem. O estudo concluiu que o uso de dados abertos em projetos de aprendizagem desperta o interesse dos alunos, seja pelo fato de os dados descreverem questões relacionadas a seu ambiente geográfico ou social, a seus hobbies ou a questões atuais. Portanto, os alunos ficam motivados a se aprofundarem mais no assunto e também a trabalharem de maneira colaborativa com seus colegas em projetos.

O uso de dados abertos em sala de aula ainda é incipiente e isso se deve em parte devido à falta de capacitação dos professores e à dificuldade de adaptar os dados abertos existentes para uso pedagógico. Muitos professores e alunos não têm conhecimento ou recursos para usar os dados abertos. A Carta Internacional de Dados Abertos, uma colaboração entre mais de 150 governos e organizações que trabalham para abrir dados com base em um conjunto compartilhado de princípios, reforça a importância de engajar professores. Um dos princípios estabelece que os envolvidos estão comprometidos a "envolver-se com escolas e instituições de ensino superior para apoiar o aumento da pesquisa sobre dados abertos e a incorporar a alfabetização de dados nos currículos escolares".

Há iniciativas para mudar esta realidade e destacamos algumas voltadas para alunos, professores e profissionais da educação:

Use (open research) data in teaching:

projeto criado para incentivar e ajudar os professores do ensino superior a usar dados de pesquisa aberta em sala de aula, que disponibiliza publicações e um curso gratuito em inglês com orientações para educadores. As instituições parceiras do projeto são a Universidade Radboud, na Holanda, a Universidade de Tromsø (UiT The Arctic University of Norway), na Noruega, e a University of Amsterdam, na Holanda.

Pátio Digital:

iniciativa criada pela Secretaria Municipal de Educação de São Paulo, instituída por meio da Portaria nº 3.786 de 17 de abril de 2017. É estruturada em três eixos: transparência e dados abertos, com a publicação de bases de dados para a construção de aplicativos e pesquisas; colaboração governo-sociedade por meio de encontros abertos e de uma Rede de Cooperação Técnica; e inovação tecnológica, por meio de hackathons para desenvolvimento de apps e de um repositório de códigos abertos.

Dados Abertos da Educação (SP):

a seção "Aprenda", do portal de Dados Abertos da Secretaria da Educação do Estado de São Paulo, traz informações de como usar os dados do portal.

Análise de Dados Educacionais:

e-book com o conteúdo do curso “Análise de Dados Educacionais”, promovido pela Escola de Dados — programa educacional da Open Knowledge Brasil — com apoio da Fundação Lemann e do Interdisciplinaridade e Evidências no Debate Educacional (Iede). A formação — cujas aulas estão disponíveis no YouTube — buscou ampliar a capacidade de obtenção e análise de dados de gestores públicos da área de educação, competência essencial para a melhoria das políticas públicas educacionais, sobretudo aquelas de caráter pedagógico que podem ser desenvolvidas a partir dos dados de avaliação.

Hackathons:

hackathons são eventos que acontecem durante um curto período de tempo com desenvolvedores de software, designers, estudantes, etc. com o objetivo de desenvolver soluções inovadoras para algum problema específico. Muitos deles são promovidos com foco em desafios educacionais, tais como o realizado durante a 10ª Semana da Educação de Campinas. Durante 12h, um grupo de cerca de 32 pessoas se reuniu para elaborar ideias inovadoras relacionadas à educação.

Repositórios Abertos:

os Repositórios Abertos Educacionais (REA) auxiliam o professor na obtenção do material didático utilizado para preparar o seu plano de aulas, assim como oferecem ao aluno uma ampla fonte de materiais complementares. Escolha Livre, que funciona como um guia sobre software livre e recursos abertos para educadores e gestores.

Governo aberto e dados escolares abertos

Na administração pública, abrir os dados é uma obrigação legal. De acordo com a Lei de Acesso à Informação - LAI (Lei nº 12.527/2011), "é dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas" (Artigo 8, 2011, online).

Os dados abertos governamentais seguem oito princípios norteadores, resultado do consenso de um grupo de trabalho que se reuniu nos EUA em 2007 para definir os princípios dos Dados Abertos Governamentais. Os dados governamentais são considerados abertos se forem divulgados publicamente de acordo com os princípios a seguir:

Os dados abertos governamentais impactam a maneira como o governo opera, envolvendo mais indivíduos para fazer com que o governo seja mais acessível e atraente, por meio da transformação dos dados brutos em algo novo. A abertura dos dados abertos no governo traz diversos benefícios, tais como transparência e controle democrático, participação popular, aprimoramento do serviço público, quebra do monopólio de dados, fortalecimento da democracia e criação de novos negócios. Diversas iniciativas a nível global estão sendo desenvolvidas para estimular a abertura dos dados, em especial na esfera pública, a fim de promover gestões mais participativas. O Brasil segue algumas normas e compromissos internacionais para o avanço nesta temática. Uma delas é a Parceria para Governo Aberto (OGP, na sigla em inglês). Lançada em 2011, a OGP é uma iniciativa para difundir e incentivar práticas governamentais relacionadas à transparência dos governos, ao acesso à informação pública e à participação social.

Ainda há muito a ser feito, mas já foram dados passos significativos no Brasil, especificamente no que tange à abertura dos dados governamentais, que oferecem um grande potencial para cidadãos, empresas, instituições de pesquisa e ensino, organizações não governamentais, entre outros.

Atualmente 75% das bases de dados do governo federal estão abertas. A fim de centralizar a busca e o acesso aos dados e informações públicas, o governo desenvolveu o Portal Brasileiro de Dados Abertos. O objetivo da plataforma é oferecer um serviço simplificado que organiza e padroniza o acesso aos dados públicos. Ela reúne atualmente mais de 12 mil conjuntos de dados, divididos em grupos temáticos relacionados à administração pública, tais como governo e política, saúde, educação, meio ambiente, entre outros. Cada conjunto de dados possui uma descrição, um ou mais recursos, e uma série de outros metadados, como periodicidade de atualização e órgão responsável.

A diretora-executiva da OKBR, Fernanda Campagnucci, ressalta que não basta apenas disponibilizar os dados abertos; é preciso formação para usar esses dados, seja para fins de monitoramento ou para obter insights a partir dos dados. A OKBR possui um programa de formação, a Escola de Dados, que em seus cinco anos de atuação no Brasil, foi responsável pela formação de mais de 6 mil pessoas em atividades presenciais e online. Dentre eles, uma capacitação sobre como analisar dados educacionais. Além disso, Fernanda destaca a importância de um plano de dados abertos, que orienta as ações de implementação e promoção de abertura de dados de uma organização para manter a continuidade dos projetos governamentais.

Dados escolares abertos

O Instituto Internacional de Planejamento Educacional (IIPE) da Organização das Nações Unidas para a Educação, a Ciência e a Cultura (Unesco), criado para auxiliar Estados-membros no planejamento e gestão de seus sistemas educacionais, vem conduzindo um programa de pesquisa sobre o uso de dados escolares abertos – e em particular a planilha de divulgação de Notas Escolares nas Escolas (School Report Cards - SRCs) – para incentivar a transparência e a accountability nas escolas. Mais especificamente, o instituto vem examinando vários modelos de SRC e índices nacionais (como no caso do Brasil, o Ideb) e as condições em que tais iniciativas conseguiram envolver as partes interessadas e motivá-las a fazer mudanças e impactar positivamente o nível de transparência e accountability em seu sistema educacional.

De acordo com o instituto, dados abertos escolares são informações sobre insumos, processos e/ou produtos da escola que são compartilhados com o público em geral, de forma impressa e/ou online. Podem se referir, por exemplo, a orçamentos escolares; matrícula de alunos; número de professores, qualificações e frequência; condições das instalações escolares; disponibilidade de livros didáticos; e os resultados dos testes dos alunos. Para serem úteis, no entanto, os dados precisam ser relevantes, abrangentes, precisos, oportunos, acessíveis e livres de cobrança. Tenha em mente as seguintes perguntas, sugeridas pela Unesco, antes de lançar uma iniciativa de dados abertos na escola:

Quais categorias de partes interessadas serão beneficiadas com a abertura de dados de escolas?

Por que os diversos interessados vão acessar os dados?

Como as diferentes partes interessadas farão uso dos dados?

Diversos envolvidos na comunidade escolar podem se beneficiar dos dados abertos da escola, tais como:

A divulgação de dados escolares para o público está sendo implementada em um número crescente de países. Isso vem acontecendo, em grande parte, devido ao aumento exponencial da disponibilidade de dados por conta do desenvolvimento de novas tecnologias e da internet; do crescente reconhecimento do direito dos cidadãos à informação num contexto de democratização das sociedades; da crescente importância das medidas anticorrupção na agenda pública; e do surgimento de uma nova cultura administrativa caracterizada pela tomada de decisão baseada em dados e avaliação baseada no desempenho.

O IIPE-Unesco recomenda sete etapas para planejar e implementar iniciativas de dados abertos em escolas, de modo que os dados ganhem a atenção dos cidadãos. Confira:

  1. Planeje uma estrutura clara de política de dados abertos: revise as motivações para uma política de dados abertos na escola, esclareça funções e responsabilidades e defina expectativas com base em uma teoria de mudança.
  2. Priorize dados que possam levar a mudanças positivas: selecione dados significativos que destaquem a situação atual das escolas e considere indicadores que sejam comparáveis ao longo do tempo e entre escolas.
  3. Estabeleça um sistema de gestão de informação forte: lance iniciativas de dados escolares abertos como parte dos sistemas de informação de gestão educacional existentes, organize treinamento técnico para ensinar os funcionários da escola a monitorar dados e a divulgar informações em tempo hábil.
  4. Apresente os dados de forma atraente: certifique-se de que os dados estejam acessíveis online e offline em áreas públicas onde sejam fáceis de serem visualizados por todos. Forneça explicações para evitar interpretações errôneas, use linguagem simples e incorpore tabelas e gráficos.
  5. Certifique-se de que os dados sejam acessíveis a todos: envie a planilha com os boletins escolares a todos os diretores de escola, adote disposições legais sobre a divulgação de dados e realize campanhas de advocacy nos idiomas locais para alertar os cidadãos.
  6. Fortaleça as habilidades das partes interessadas para agir com base na informação: aumente a conscientização entre os administradores escolares e professores sobre os princípios fundamentais dos dados abertos da escola, informe os cidadãos sobre seus direitos e prerrogativas sobre a educação e organize sessões de informação para os alunos.
  7. Apoie os esforços para melhorar a prestação de contas e combater a corrupção: selecione dados que possam esclarecer as áreas mais vulneráveis a práticas de corrupção, esclareça as consequências dessas práticas e faça com que os objetivos de uma iniciativa de dados escolares abertos evoluam ao longo do tempo, de ferramentas de informação e comunicação à accountability

Aspectos éticos da abertura dos dados escolares

Para o IIPE-Unesco, uma grande variedade de dados sobre insumos escolares (por exemplo, financiamento), processos (por exemplo, frequência de professores) e resultados (por exemplo, desempenho dos alunos) podem ser compartilhados com o público em geral, mas devem ser selecionados com cuidado e em número limitado. Os dados devem ser apresentados principalmente em forma estatística, embora alguns possam ser de natureza qualitativa. O instituto recomenda seis categorias principais de dados que devem ser consideradas:

É preciso ter atenção com as comparações de dados a fim de evitar o risco de simplificação excessiva ou má interpretação. Por isso, as comparações entre escolas devem ser limitadas a escolas com características socioeducativas semelhantes. A fim de destacar o desenvolvimento das escolas ao longo do tempo, recomenda-se realizar séries temporais. A experiência das escolas de alto rendimento, cujo desempenho tem aumentado rapidamente ao longo do tempo, deve ser analisada e amplamente divulgada. Histórias de sucesso também devem ser compartilhadas como fonte de inspiração. Consultas regulares devem ser realizadas para coletar feedback dos usuários sobre a relevância, clareza e utilidade dos dados que foram compartilhados publicamente.

Além disso, se os dados abertos de escolas não forem acessados e corretamente interpretados, não há razão para torná-los públicos. Por isso, devem ser incentivadas campanhas para que todos percebam o potencial dos dados para promover educação inclusiva e equitativa de qualidade para todos, assim como treinamentos.

Embora os dados abertos de escolas sejam publicados em nível institucional e não individual, algumas questões éticas devem ser consideradas:

• Os dados de escolas abertas são construídos em grandes bancos de dados que reúnem dados individuais sobre alunos e professores. Para evitar quaisquer tentativas de rastrear ou comercializar tais informações, a privacidade de dados individuais deve ser cuidadosamente protegida por lei e protocolos de segurança adequados. Consulte edições anteriores sobre LGPD.

• Quando as escolas são muito pequenas – escolas com um professor, por exemplo – torna-se muito fácil vincular informações da escola para indivíduos específicos. Portanto, para evitar qualquer risco de divulgação de 'identificadores diretos', deve ser estabelecido um limite mínimo para relatar dados agregados.

• Alguns dados relacionados ao perfil de populações cujos filhos estão matriculados na escola, como religião, por exemplo, podem fomentar a estigmatização e o preconceito. Para evitar isso, esses dados não devem ser publicados.

A publicação "Good Practice Principles for Data Ethics in the Public Sector - Boas Práticas para Ética de Dados no Setor Público (tradução livre)", da Organização para a Cooperação e Desenvolvimento Econômico - OCDE, traz recomendações sobre o uso ético de dados em projetos, produtos e serviços de governo digital. O documento apresenta 10 princípios de boas práticas para a ética de dados no setor público, incluindo um conjunto de ações específicas que podem apoiar a sua implementação:

Recomendamos, ainda, ler o que já publicamos sobre ética de dados.

GLOSSÁRIO DE TERMOS DA CIÊNCIA DE DADOS

solução de código aberto para catalogar dados, adotado por diversos governos no mundo inteiro, como EUA, Canadá e México.

coleção organizada de dados. A representação mais básica de um conjunto de dados é uma tabela. Cada coluna da tabela representa uma variável específica. Cada linha corresponde a um determinado valor da variável dessa coluna.

o formato de arquivo CSV (Comma Separated Values) é um arquivo de texto não proprietário que armazena planilhas ou informações básicas de tabela.

são dados que obedecem a quatro princípios: (1) Devem ser usados Identificadores Universais de Recursos (Universal Resource Identifier - URIs) como nomes para as coisas a serem publicadas; (2) Devem ser usadas URIs HTTP para que os usuários possam localizar estes nomes; (3) Quando a URI for encontrada, ela deve prover informação útil, usando padrões como o RDF (Resource Description Framework) ou o SPARQL (SPARQL Protocol and RDF Query Language); (4) As URIs devem incluir hiperlinks para outras URIs para que os usuários possam descobrir novos recursos que se relacionem à URI que estejam buscando.

de acordo com o ODI, consiste em ativos de dados, padrões e tecnologias, orientação e políticas, organizações e comunidades. Precisamos de uma infraestrutura de dados forte para poder coletar, acessar, usar e compartilhar dados, o que nos ajuda a criar valor e minimizar os impactos nocivos.

metadados são dados que descrevem dados. Os metadados podem descrever como os dados são representados, os intervalos de valores aceitáveis e seu relacionamento com outros dados. Os metadados também podem fornecer outras informações relevantes, como a pessoa responsável por ele, leis e regulamentos associados e a política de gerenciamento de acesso.

resource Description Framework é uma família de especificações da World Wide Web Consortium originalmente planejada como um modelo de dados para metadados.

SPARQL é um acrónimo recursivo do inglês SPARQL Protocol and RDF Query Language. Trata-se de uma linguagem padronizada para a consulta de grafos RDF, padrão pelo RDF Data Access Working Group do World Wide Web Consortium.

SQL, do inglês Structured Query Language, é a linguagem de pesquisa padrão para bancos de dados relacionais responsável por consultar e editar informações armazenadas em um determinado sistema de gerenciamento de banco de dados.

Uniform Resource Identifier é um termo técnico que foi traduzido para a língua portuguesa como um "identificador uniforme de recurso", é uma cadeia de caracteres compacta usada para identificar ou denominar um recurso na internet.

o World Wide Web Consortium - W3C é uma comunidade internacional que inclui uma equipe em tempo integral, composta por especialistas do setor e várias organizações membros. Esses grupos trabalham juntos para desenvolver padrões para a World Wide Web.

Aprofunde seus conhecimentos sobre dados abertos

Ao longo deste especial, apresentamos várias definições, casos e reflexões sobre dados abertos e sua relevância no processo maior de uso de dados escolares. Se você quer adquirir um conhecimento ainda mais profundo sobre o tema para aplicá-lo em seu trabalho, deixamos abaixo uma série de referências importantes que estão disponíveis aqui no Observatório de Educação. Confira:

Análise de dados educacionais: aplicando evidências na gestão pública

E-book com conteúdo do curso “Análise de Dados Educacionais”, da Escola de Dados. A formação buscou ampliar a capacidade de obtenção e análise de dados de gestores públicos da área de educação, competência essencial para a melhoria das políticas públicas educacionais, sobretudo aquelas de caráter pedagógico que podem ser desenvolvidas a partir dos dados de avaliação.

Acesse aqui

 

Carta Internacional de Dados Abertos

Publicação com seis princípios desenvolvidos em 2015 por governos, sociedade civil e especialistas de todo o mundo como um conjunto de regras globalmente acordado sobre como publicar dados abertos.

Acesse aqui

 

Comunidade de Dados Abertos BR

Fórum aberto da Comunidade Dados Abertos BR, que faz parte da comunidade que se iniciou no grupo do Telegram “Dados Abertos BR”, acessível pelo endereço t.me/dadosabertos. O grupo existe há mais de 3 anos e congrega pessoas com interesses e especialidades diversas, como desenvolvedores, servidores públicos, jornalistas, pesquisadores, empreendedores, hackerativistas, etc.

Acesse aqui

 

Dados abertos conectados

Publicação com conteúdo do curso online avançado sobre publicação de dados em formato aberto. Elaborado pelos professores Seiji Isotani e Ig Ibert Bittencourt. Este livro mostra a importância dos dados abertos conectados, que podem contribuir para o uso da web como principal meio para inovação social.

Acesse aqui

 

Fluxo do trabalho com dados: do zero à prática

Publicação da Escola de Dados destinada a profissionais e estudantes interessados em trabalhar com dados no campo da comunicação, em especial no jornalismo e na produção de conteúdos para organizações da sociedade civil. O guia é baseado no fluxo de trabalho com dados (data pipeline), uma metodologia desenvolvida pela rede da Escola de Dados internacionalmente, que aborda todas as etapas do trabalho, da definição das questões à visualização dos dados.

Acesse aqui

 

Fundamentos para publicação de dados na web

Apostila do Centro Web, do NIC.BR, que discute os fundamentos relacionados à publicação de dados na web, abordando aspectos relevantes, incluindo: os conceitos de dados abertos, dados conectados (do inglês Linked Data), o ciclo de vida dos dados na web e as boas práticas para dados na web.

Acesse aqui

 

Good Practice Principles for Data Ethics in the Public Sector

A publicação "Boas Práticas para Ética de Dados no Setor Público (tradução livre)", da OCDE, traz recomendações sobre o uso ético de dados em projetos, produtos e serviços de governo digital. Em inglês.

Acesse aqui

 

Manual de Elaboração de Planos de Dados Abertos (PDA)

Publicação da Secretaria de Transparência e Prevenção da Corrupção - CGU para orientar como elaborar um Plano de Dados Aberto (PDA).

Acesse aqui

 

Mapeando um ecossistema de dados - ODI

Metodologia para "Mapeamento do ecossistema de dados - Ferramentas para documentar e mapear ecossistemas de dados". Em inglês.

Acesse aqui

 

Mapping data ecosystems in the education sector – a foundation for green skills and jobs [report]

Relatório do mapeamento no ecossistema de dados do setor educacional da região de West London, em Londres, realizado em 2021, usando a metodologia desenvolvida pelo ODI. Em inglês.

Acesse aqui

 

Open school data: what planners need to know

A publicação "Dados Escolares Abertos: O que os planejadores precisam saber (tradução livre)", da Unesco, aborda cinco questões-chave: desde como escolher o conteúdo e o formato dos dados até como vinculá-los à accountability, além de entender os riscos inerentes. Da Austrália à Zâmbia, essas questões ganham vida com exemplos e lições do mundo real de 50 países e várias centenas de entrevistas com atores de nível escolar. Em inglês.

Acesse aqui

 

Tutorial sobre como usar diários oficiais municipais

Tutorial escrito por Fernanda Campagnucci, diretora-executiva da OKBR, sobre como fazer uma 'super busca' em diários oficiais municipais para encontrar resultados precisos nos 27 municípios já incluídos na plataforma.

Acesse aqui

 

Webinar sobre como realizar o mapeamento de ecossistema de dados do ODI

Tutorial em vídeo "Mapeamento do ecossistema de dados: traçando a jornada dos dados ao valor para o seu negócio". Em inglês. É preciso realizar um cadastro para assistir.

Acesse aqui

Desigualdade racial na educação brasileira

De caráter estrutural e sistêmico, a desigualdade racial no Brasil é inquestionável e persiste devido a fragilidade de políticas públicas para o seu enfrentamento. De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE) ...

Saiba maisAbre em uma nova guia

Combate à Discriminação Racial na escola é tema de coleção

A coleção Combate à Discriminação na Escola tem como objetivo problematizar as implicações da discriminação racial no ambiente escolar, bem como compartilhar experiências pedagógicas positivas para a construção de uma educação antirracista ...

Saiba maisAbre em uma nova guia