Big Data na Educação: o que é e como pode ajudar na gestão educacional

Entenda como o Big Data pode ser aplicado na educação para contribuir com o avanço contínuo da educação pública

Introdução

Big Data refere-se geralmente a uma gigantesca quantidade de dados, gerados em uma velocidade vertiginosa, de diferentes origens e formatos (estruturados ou não). Mas se há tanto tempo temos essa grande quantidade de dados, por que estamos ouvindo mais sobre Big Data recentemente?

O especialista Tim Smith acredita que isso vem acontecendo porque outras áreas, para além da ciência, perceberam que podemos obter mais conhecimento quando reunimos informações que se relacionam e utilizamos suas correlações para a tomada de decisão. A animação da TEDEd, ”Tim Smith: Big Data”, disponível neste link, explica esse conceito.

Uma das áreas que vislumbrou que se pode obter mais conhecimento a partir dos dados é a educação. Este especial - que integra o projeto Ciência de Dados na Educação do Instituto Unibanco em parceria com o CRIE (Centro de Referência em Inteligência Empresarial, da COPPE/UFRJ) - é dedicado a explicar como os dados educacionais contribuem para o avanço contínuo da educação pública. Nele, você vai entender como a análise de um grande volume de dados educacionais pode trazer benefícios e oportunidades – assim como desafios - para estudantes, professores, gestores e legisladores.

Para uma experiência ainda mais profunda sobre o tema, distribuímos uma série de links para materiais do Observatório de Educação - Ensino Médio e Gestão ao longo do conteúdo. Utilize-os para uma melhor compreensão sobre como o uso de Big Data pode ser estratégico para a educação

Aspectos conceituais do ecossistema Big Data

Big Data é comumente caracterizado por 3 Vs: volume, variedade e velocidade. O professor da Universidade de Amsterdam Yuri Demchenko considera mais duas dimensões - veracidade, relacionado à confiabilidade, segurança e origem, e valor - e é seguido por outros pesquisadores.

Emmanuel Letouzé, diretor e cofundador da Data-Pop Alliance, grupo de reflexão (think tank) que estuda Big Data e desenvolvimento, alega que Big Data não deve se limitar a uma mudança quantitativa, pois é mais do que uma "grande quantidade de dados". Ele propõe, assim, que os 3Vs (ou 5 Vs) sejam substituídos pelos 3 Cs: crumbs (migalhas), capacities (capacidades) e communities (comunidades), o que será mais detalhado posteriormente.

Para ele, o Big Data deve ser considerado um novo ecossistema que é parte integrante de um fenômeno social mais amplo, impulsionado pelas tecnologias digitais. Três Cs caracterizam esse ecossistema: crumbs (migalhas digitais, que seriam traduções digitais de ações humanas e interações captadas por aparelhos digitais), capacities (capacidades poderosas para coletar, agregar e analisar dados, que incluem computadores, softwares, técnicas de machine learning, por exemplo), e communities (comunidades envolvidas na geração, governança e uso dos dados, incluindo geradores de dados, usuários finais, legisladores, dentre outros). Ou seja, trata-se de um sistema complexo que deve ser usado para atingir determinados objetivos.

Segundo Lev Manovich , professor e pesquisador da City University of New York Graduate Center, o ecossistema Big Data é formado por “aqueles que geram os dados (de modo consciente ou não), aqueles que têm a capacidade de coletá-los e aqueles que têm a expertise de analisá-los”. A partir dessa visão, a coordenadora de conteúdo e professora do WIDA, MBA em Big Data Estratégico do CRIE, Luciana Sodré , criou uma proposta de ecossistema Big Data formado pelos stakeholders descritos na figura a seguir , que ajudam a conceber projetos bem estruturados para decisão data-driven. Luciana acredita que a relevância dos projetos Big Data fica evidente quando diminuímos o zoom que nos faz ver apenas dados digitais e passamos a ver bem mais – tanto o que antecede quanto o que sucede a eles. Esse ambiente, para além dos dados digitais, é chamado de ecossistema Big Data.

Confira uma explicação visual desse conceito no link Framework Big Data, disponível através deste link.

Framework Big Data

O Big Data Estratégico - uma ferramenta para diagnóstico, projeto e comunicação de um ecossistema Big Data apresentada acima - consiste em três partes: 1. framework (representado acima); 2. quadro descritivo das equivalências agentes/stakeholders; 3. check list com perguntas e considerações para guiar o uso da ferramenta.

Segundo a pesquisadora, reconhecer e incorporar cada um desses stakeholders em um projeto Big Data nos obriga a estudar e considerar todo o ambiente complexo que envolve uma decisão data-driven. Além de evitar que aspectos relevantes sejam negligenciados, oportunidades sejam perdidas e recursos sejam desperdiçados. Isso para não falar da frustração de não atingir o objetivo pretendido que é, ao final das contas, o empoderamento do tomador de decisão.

Versão editada de artigo publicado originalmente no número 39 da revista Inteligência Empresarial do CRIE. Confira artigo sobre o framework aqui. A íntegra da ferramenta encontra-se publicada na dissertação de mestrado intitulada “Big Data Estratégico: um framework para a gestão sistêmica do ecossistema big data” e pode ser acessada neste link.

Confira outros conceitos chave sobre o uso da tecnologia da informação para mapear informações e a Ciência de Dados no glossário abaixo e também no nosso especial sobre o tema, disponível neste link.

GLOSSÁRIO DE TERMOS DA CIÊNCIA DE DADOS

Atividade específica dentro do campo da Ciência de Dados que usa geralmente softwares, ferramentas de BI e dashboards para organizar e visualizar os dados, permitindo assim análises e insights.

Segundo definição da Gartner, big data são dados com maior variedade que chegam em volumes crescentes e com velocidade cada vez maior – o que é conhecido como os três Vs. Há autores que acrescentaram duas dimensões: veracidade e valor. Os desafios impostos pelo Big Data são, assim, lidar com o gigantesco volume de dados, produzidos (e desatualizados) em uma velocidade vertiginosa, das mais variadas fontes. Além disso, avaliar quais são verídicos e agregam valor. Chris Dede, professor da Universidade de Harvard e um dos principais pesquisadores da atualidade do tema na área de educação, acrescenta: o big data permite a descoberta de novas informações, fatos, relacionamentos e indicadores que não poderiam ter sido percebidos anteriormente.

Dado relativo a titular que não possa ser identificado, considerando a utilização de meios técnicos razoáveis e disponíveis na ocasião de seu tratamento.

Informação relacionada à pessoa natural identificada ou identificável. Ou seja, pode ser nome, telefone, idade, e-mail, dentre outros muito comuns em fichas cadastrais.

Dado pessoal sobre origem racial ou étnica, convicção religiosa, opinião política, filiação a sindicato ou à organização de caráter religioso, filosófico ou político, dado referente à saúde ou à vida sexual, dado genético ou biométrico, quando vinculado a uma pessoa natural.

Também conhecido como armazém de dados ou DW, é um sistema de armazenamento e gerenciamento de dados. Dá suporte às atividades de Business Intelligence (BI).

Processo sistemático de extração e tabulação de dados dispersos e aparentemente irrelevantes, segundo Viktor Mayer-Schönberger e Kenneth Cukier, autores do livro "Big Data: Como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana". Em outras palavras, dataficar um fenômeno é colocá-lo num formato quantificado de modo que possa ser tabulado e analisado. Ainda segundo os autores, a dataficação não é sinônimo de digitalização. Este último é apenas um processo de representação numérica por meio de codificação binária.

Dados abertos são aqueles que podem ser acessados, usados, modificados e compartilhados livremente - restrito, no máximo, a medidas que preservem a proveniência e abertura - , por qualquer pessoa para qualquer propósito, segundo a definição de aberto (open definition, em inglês) da Open Knowledge, organização sem fins lucrativos que promove o conhecimento livre.

Segundo o artigo 5º, X da LGPD, refere-se a toda operação realizada com dados pessoais, como as que se referem a coleta, produção, recepção, classificação, utilização, acesso, reprodução, transmissão, distribuição, processamento, arquivamento, armazenamento, eliminação, avaliação ou controle da informação, modificação, comunicação, transferência, difusão ou extração.

Segundo o artigo 5º da LGPD, "comunicação, difusão, transferência internacional, interconexão de dados pessoais ou tratamento compartilhado de bancos de dados pessoais por órgãos e entidades públicas no cumprimento de suas competências legais, ou entre esses e entes privados, reciprocamente, com autorização específica, para uma ou mais modalidades de tratamento permitidas por esses entes públicos, ou entre entes privados". Dado pessoal de criança e de adolescente: o Estatuto da Criança e do Adolescente (ECA) considera criança a pessoa até 12 anos de idade incompletos e adolescente aquela entre 12 e 18 anos de idade. Em especial, a LGPD determina que as informações sobre o tratamento de dados pessoais de crianças e de adolescentes deverão ser fornecidas de maneira simples, clara e acessível de forma a proporcionar a informação necessária aos pais ou ao responsável legal e adequada ao entendimento da criança.

Segundo Alberto Cairo, especialista em infográficos e professor de infografia e visualização na Universidade de Miami, antes de definir visualização de dados é importante definir o que são dados. Para ele, dados são registros de nossas observações, representadas por símbolos (números ou palavras) que podem descrever a realidade, em um "primeiro nível de codificação”. Antes dos dados teriam ainda informações desestruturadas. Depois de dados, viriam as informações estruturadas ("segundo nível de codificação", já dotados de sentido), em seguida conhecimento (com experiência e memória), e, por fim, a sabedoria. Assim, a visualização de dados pode ajudar o público a analisar e a interpretar os dados.

Para Lev Manovich, infovis é um “mapeamento entre dados distintos e representação visual”. Tem o objetivo de produzir informação por meio de diagramas, gráficos e textos explicativos. Ou seja, o designer já interpreta um determinado grupo de dados coletados, com o propósito de oferecer informação ao leitor. Muitas vezes permite interatividade, para que o leitor acesse diferentes granularidades do conteúdo.

A importância das tecnologias da informação e da análise de dados educacionais para a melhoria do ensino

Uma maior quantidade de dados traz uma oportunidade de igual grandeza, como aponta o pesquisador e professor da Universidade de Harvard Chris Dede : descobrir novas informações, fatos, relacionamentos e indicadores que não eram percebidos anteriormente. De acordo com relatório do Dresner Advisory Services (2017), os setores mais ativos na produção de uma grande quantidade de dados são tecnologia (14%), saúde (12%), serviços financeiros (12%), telecomunicações (7%), educação (5%) e consultoria (5%).

Para saber mais sobre as oportunidades do Big Data, assista à TED Talks com Kenneth Cukier, jornalista e autor do livro "Big Data: Como extrair volume, variedade, velocidade e valor de informação cotidiana".

Conforme descreve Kenneth Cukier, no vídeo disponível neste link:

Kenneth Cukier

Dados educacionais em grande escala, coletados e analisados rapidamente, podem trazer insumos e insights para personalização do ensino, estratégias para maior engajamento, planejamento de ações de combate à evasão e/ou abandono escolar, para mencionar alguns relacionados a ensino-aprendizagem. Esses dados podem vir de plataformas de ensino (como interações, conteúdo, dentre outros), de avaliações (como notas, feedback de professores, frequência, etc.) e de sistemas de monitoramento a nível de uma escola ou distrito escolar.”

De acordo com o relatório "Big Data for monitoring educational systems " (Big Data para monitorar sistemas educacionais, na tradução livre), publicado pela Comissão Europeia em 2017, "os avanços em big data podem transformar o contexto e a metodologia de monitoramento de sistemas educacionais em uma perspectiva de longo prazo (10-30 anos) e impactar o desenvolvimento de políticas baseadas em evidências no setor". Para a Comissão Europeia, um sistema educacional é composto por quatro elementos: professores, estudantes, um contexto e conteúdo.

O relatório aponta que a maior parte das fontes de dados usadas atualmente para monitoramento – como as do Programa Internacional de Avaliação de Alunos - PISA, da OCDE (Organização para Cooperação e Desenvolvimento Econômico) - fornecem percepções longitudinais limitadas. Quando os resultados são publicados, os dados referem-se ao passado e muitas vezes são usados como referências. No entanto, os dados considerados "Big Data" - que são produzidos em tempo real, muitas vezes constantemente, com serviços de localização em celulares, por exemplo, e em níveis individuais, como por meio de plataformas de aprendizagem – podem ser agregados para monitoramento de sistemas educacionais e contribuir, assim, para eliminar o problema de atraso entre a coleta de dados e a publicação das análises. Dessa forma, tem o potencial de promover um monitoramento mais eficiente e eficaz, utilizando das tecnologias da informação para análise de dados.

Todavia, as oportunidades vêm acompanhadas de desafios também, tais como: privacidade, tema que ainda será abordado neste especial; interoperabilidade de sistemas; integração de dados; qualidade dos dados e competências para análise dos mesmos; acesso a tecnologias para coleta, armazenamento e análise; riscos de algoritmos discriminatórios; necessidade de "perguntas certas" a serem feitas durante o monitoramento eficiência e equidade, uma vez que estes irão determinar os dados a serem coletados.

Mais dados não significa necessariamente melhores dados. Em 2019, 38 organizações fizeram um pedido coletivo para maior financiamento de dados educacionais, o que permitirá ao mundo alcançar a Meta 4 do Objetivo de Desenvolvimento Sustentável - ODS (educação de qualidade e inclusiva para todos e todas). São necessários dados mais precisos e atualizados para saber quais crianças, jovens e adultos estão progredindo e quais não estão, e por quê, a fim de desenvolver políticas públicas mais adequadas. Hoje, muitos países estão trabalhando no escuro, sem os dados de que precisam para direcionar políticas e recursos - muitos não têm sequer os dados básicos. Para acompanhar o progresso em relação ao ODS 4, é preciso acesso a uma maior variedade de dados educacionais, assim como indicadores mais complexos.

De acordo com o Instituto de Estatísticas da Unesco (UIS), custaria em média cerca de US$ 1,4 milhão por ano por país para produzir todos os indicadores do ODS 4 (ou um investimento global geral de US$ 280 milhões por ano). Trata-se de um pequeno valor quando comparado aos diversos benefícios de uma educação de qualidade. Em um cenário conservador, melhores dados levariam a um ganho de 10% na eficiência. Ou seja, ao investir US$ 1,4 milhão por ano em dados de educação, um país economizaria US$ 143 milhões por ano nos custos de funcionamento de seu sistema educacional.

O que tem sido pesquisado sobre Big Data e educação?

As pesquisadoras e professoras da Universidade de Malaya, na Malásia, Maria Ijaz Baig, Liyana Shuib e Elaheh Yadegaridehkordi realizaram uma revisão sistemática de literatura sobre estudos que abordaram Big Data e educação nas bases Science Direct e SAGE. Após a análise de 40 estudos primários publicados entre 2014 e 2019, elas concluíram que houve um aumento em 2018 e 2019 do número de estudos que abordam a temática.

Além disso, os estudos atuais cobrem quatro grandes temas principais:

1. Comportamento e desempenho do aluno : análise de aprendizagem, framework Big Data, atitude e comportamento do usuário, estratégias de aprendizagem, aprendizagem adaptativa, satisfação do aluno.

2. Modelagem e data warehouse / sistema de gerenciamento de dados para educação : ambiente em nuvem, modelagem Big Data, análise de cluster, data warehouse, que são elementos importantes para coleta, armazenagem e análise de dados.

3. Melhoria no sistema educacional : indicadores e ferramentas estatísticas, implicações de pesquisa educacional, sistemas de ranking, uso de sites, capacitação em Big Data, desafios e eficácia da ciência de dados.

4. Integração de Big Data ao currículo: agregar ensino de Big Data (conceitos, ferramentas, etc.) aos cursos.

Mais da metade dos estudos (53%) abordaram a temática de comportamento e desempenho dos alunos; 23% sobre a melhoria do sistema educacional; 15% foram sobre modelagem e data warehouse; e 10% sobre a integração de Big Data no currículo.

Aplicações práticas de ferramentas voltadas para data driven na educação

Existem diversas iniciativas de estudos da ciência de dados, na educação, que apresentaram um impacto positivo no ensino e na aprendizagem. Selecionamos três que podem trazer inspiração para desafios mencionados anteriormente.

A primeira iniciativa foi adotada pela Christopher House , instituição educacional sem fins lucrativos com sede em Chicago, fundada em 1906 para ajudar as famílias de imigrantes a se adaptarem à vida nos Estados Unidos. Consiste em uma rede de escolas que trabalha para fechar a lacuna de oportunidades para crianças de baixa renda e suas famílias, desde o nascimento até o ensino médio, com o objetivo de se obter sucesso na escola, no trabalho e na vida.

Nos últimos 15 anos, a CEO Lori Baas vem desenvolvendo ações para que o modelo de gestão da organização seja orientado por dados. Em entrevista à MIT Sloan Management Review , Lori conta que esse foco foi instigado por uma demanda do conselho de diretores. Um diretor lhe perguntou em quais dados ela estava se baseando para afirmar que a Christopher House era o melhor programa de educação infantil de Chicago ou que estava contribuindo para melhorar as notas dos estudantes no ensino fundamental.

Primeiramente, foram identificadas e criadas ferramentas de ciência de dados para avaliar os programas da instituição e sugerir melhorias. Depois, surgiu a ideia de se comparar com outras organizações na cidade. Ao longo deste processo, também foi sendo realizada uma mudança cultural significativa. Com isso, os docentes passaram a querer analisar os dados e pensar em ações, motivados pelo impacto que isso pode ter na vida das pessoas.

A equipe da organização usa um software centralizado e customizável para inserção dos dados. Todos têm a responsabilidade de extrair os resultados dos dados, procurar tendências e compartilhar seus insights. Esses processos organizacionais orientados por dados são chamados de data driven. Após essa organização, são realizadas frequentemente reuniões nas quais são feitas as seguintes perguntas: Quando você olha para esses dados, o que pensa sobre as notas que estão aumentando ou diminuindo? O que você acha que está contribuindo para esses resultados? A diretoria de Qualidade faz uma síntese dessas reflexões e apresenta-a para o Conselho.

Em organizações sem fins lucrativos, as medidas de sucesso variam muito e os processos não são padronizados. A fim de proporcionar maneiras de comparação entre instituições, foi desenvolvida uma colaboração de dados, composta por seis organizações do terceiro setor que trabalham juntas para criar os dados comparativos – o Chicago Benchmarking Collaborative (CBC). Foram desenvolvidos programas com públicos e conjuntos de resultados semelhantes. Assim, todos aprendem uns com os outros com o intuito de ter sugestões de melhorias, com base nos dados, nos seus respectivos programas.

Quanto mais parceiros, mais dados para se analisar tendências históricas, por exemplo. Entre as organizações parceiras, 73% viram um aumento nos resultados por meio do compartilhamento de dados e melhores práticas. Além disso, 77% das metas baseadas em dados definidos pelas organizações do CBC foram alcançadas ou excedidas. A Christopher House atua como gerente de projeto do CBC. O CBC rendeu à Lori a indicação à finalista da edição de 2020 da premiação Ed Tech Leadership Awards, na categoria CEO / Fundador. O Ed Tech Awards é o maior programa de reconhecimento do setor de edtech nos EUA.

A segunda iniciativa vem da Estônia. O país europeu com pouco mais de 1 milhão de habitantes é um dos maiores exemplos de governo digital do mundo, com soluções digitalmente integradas no portal E-Estonia . O país é o primeiro da Europa no teste PISA da OECD, 100% das suas escolas usam soluções online, seja material de ensino digital ou softwares de gestão – as mais usadas são ekool (290 mil usuários ativos) e stuudium. As duas permitem que pais, professores e alunos colaborem e organizem facilmente todas as informações necessárias para o ensino e a aprendizagem, como notas, frequência, tarefas de casa, mensagens, relatórios estatísticos, dentre outros. Já o e-koolikot reúne material didático digital em um único portal, organizado por palavras-chave, com base no currículo.

O Sistema de Informação Educacional da Estônia (Eesti hariduse infosüsteem, EHIS) reúne todas as informações relacionadas à educação no país. O banco de dados armazena detalhes sobre instituições de ensino, alunos, professores, documentos, materiais de estudo e ementas. O EHIS combina dados que vêm diretamente de todas as escolas da Estônia (em torno de 2.000). Todas as escolas são obrigadas, por lei, a inserir os dados e mantê-los atualizados. Caso não o façam, não recebem financiamento. Os diretores das escolas devem nomear pelo menos dois funcionários para serem responsáveis pelos dados do EHIS. Depois de inseridos os dados, são feitas verificações de consistências, para checar, por exemplo, se um aluno está matriculado em apenas uma escola.

O EHIS pode ser acessado com um número de identificação pessoal por qualquer pessoa na área da educação, sejam alunos, professores ou funcionários. Além disso, em torno de 50 organizações têm acordos para acessar os dados – como as de transporte público, para verificar o status do estudante que usou o transporte com desconto. A plataforma online HaridusSilm (Olho Educacional, na tradução) disponibiliza os dados agregados ao público.

E, por fim, a terceira iniciativa é o projeto Connect , da Unicef, agência da ONU criada para promover os direitos e o bem-estar de crianças e adolescentes, que usa a ciência de dados para mapear a conectividade das escolas em todo o mundo. Os dados gerados e visualizados por meio de uma plataforma online mostram as escolas e o status de sua conexão com a internet. Os dados ajudarão a identificar onde estão as lacunas digitais das escolas, servirão como evidência na defesa da conectividade e ajudarão os governos nacionais a otimizar seus sistemas educacionais. A plataforma também contribuirá para medir vulnerabilidades e melhorar a resposta a emergências e resiliência contra desastres naturais e crises. Das mais de 920 mil escolas mapeadas até agora em 40 países, 44% não estão conectadas. No Brasil, foram mapeadas 138 mil escolas, das quais 20% não têm acesso à internet. Confira abaixo o mapeamento do Brasil e acesse a versão completa dele através deste link.

Mapa da disponibilidade de internet nas escolas do Brasil

Neste projeto, estão sendo usadas técnicas de machine learning para identificar características de escolas com base em imagens de satélite de alta resolução, o que permite mapear novas escolas, validar a precisão dos dados de localização de escolas existentes e atualizar mapas automaticamente quando a localização das escolas mudar no futuro. Na Colômbia, foi aplicada inteligência artificial para mapear automaticamente escolas a partir de imagens de satélites. O projeto forneceu ao governo a localização de 7 mil escolas que não estavam nas suas bases de dados. Existem diversas parcerias, como com Ministérios da Educação e Ministérios de Tecnologia da Informação e Comunicação, assim como operadoras de telefonia móvel, provedores de serviços de internet e outras empresas de tecnologia, para desenvolver um conjunto de dados de código aberto para escolas e infraestrutura de telecomunicações.

Aspectos éticos do uso dos dados da educação

O ensino remoto imposto pela pandemia forçou a adoção de tecnologia da informação para os meios educacionais sem tempo adequado para planejamento ou capacitação de professores e estudantes, expondo desigualdades tecnológicas e sociais no país. A digitalização - quando possível - trouxe ainda novas questões referentes à privacidade: câmeras, telas e microfones captam dados antes restritos às paredes das salas de aula.

Como realizar a coleta desses dados protegendo-os do uso indevido por terceiros? Como usar ferramentas de Big Data para analisá-los de maneira responsável? O Big Data traz oportunidades, mas também desafios – e um deles está relacionado à privacidade. A Lei Geral de Proteção de Dados Pessoais ( LGPD -Lei nº 13.709/2018 ), que foi publicada em agosto de 2018 e entrou em vigor em setembro de 2020, traz orientações que impactam nas instituições de ensino.

Para Alessandra Borelli, advogada especialista em direito digital, a LGPD e o Estatuto da Criança e do Adolescente se complementam. Os artigos 16 e 17 do Estatuto destacam, respectivamente, o direito à liberdade em toda a sua extensão, o que está relacionado ao princípio de seu melhor interesse, e o direito ao respeito, que consiste na inviolabilidade da integridade física, psíquica e moral da criança e do adolescente, abrangendo a preservação da imagem, da identidade, da autonomia, dos valores, ideias e crenças, dos espaços e objetos pessoais. No entanto, agora as instituições de ensino têm a obrigação legal de dar o correto tratamento aos dados pessoais dos estudantes – em termos não previstos no ECA, que foi promulgado há 30 anos.

Destacamos 10 recomendações das cartilhas "Os impactos da LGPD nas instituições de ensino" e "É pra já! A proteção de dados de crianças e adolescentes não pode esperar":

1. Criar uma política de tratamento de dados pessoais de seus estudantes, com apoio de profissionais especializados. Com a nova lei, é preciso ter o consentimento específico e em destaque dado por pelo menos um dos pais ou responsável legal para tratamento de dados dos estudantes. A política deve prever, ainda, o que fazer em caso de suspeita de vazamento.

2. Capacitar colaboradores que lidam com dados pessoais de estudantes e informações sensíveis ou pessoais em segurança da informação e proteção de dados pessoais.

3. Conscientizar todos os envolvidos no ecossistema educacional sobre a importância da segurança da informação e da proteção dos dados pessoais: colaboradores, estudantes, familiares, prestadores de serviço, etc

4. Fazer uma revisão da infraestrutura tecnológica e certificar-se que os provedores das tecnologias usadas estão tendo os devidos cuidados em relação aos dados que coletam.

5. Os contratos que envolvem algum compartilhamento de dados – como por exemplo com empresas de transporte escolar - devem ter cláusulas atualizadas relacionadas à LGPD.

6. Não divulgar imagens de crianças e adolescentes nem seus trabalhos em redes sociais sem autorização dos responsáveis.

7. Realizar um mapeamento dos dados (Data Mapping), ou seja, analisar todas as atividades e verificar quais envolvem dados pessoais. Em seguida, classificar estes dados e respectivas finalidades.

8. Usar perfis e e-mails institucionais nas relações entre corpo discente e docente.

9. Exigir identificação para acesso às redes Wi-Fi.

10. Não desviar da finalidade para a qual o dado está sendo coletado. De acordo com a LGPD, essa finalidade deve ser informada ao titular dos dados – que deve ter, ainda, consulta facilitada e gratuita sobre a forma e a duração do tratamento, bem como sobre a integralidade de seus dados pessoais.

Dados pessoais de crianças só poderão ser eventualmente tratados sem o consentimento exigido pela lei quando necessário para contatar os pais ou responsáveis legais, a fim de garantir a proteção da criança. Devem, entretanto, ser usados uma única vez, sem armazenamento e sem repassar a terceiros. No caso de compartilhamento dos dados da educação com MEC ou secretarias de educação, também não é necessário o consentimento, pois se trata de cumprimento de obrigação legal ou regulatória. Outra exceção é para fins de estudos por órgãos de pesquisas (com anonimização dos dados sempre que possível).

Vale lembrar que a LGPD protege não apenas os dados de crianças e adolescentes, mas de qualquer pessoa que tenha seu dado coletado. Assim, as instituições de ensino devem também estar atentos para dados coletados também de pais, professores e funcionários. O descumprimento da lei - seja por violação dos seus princípios (ver no destaque abaixo) ou vazamento de dados - pode gerar advertências, multas, publicização da infração e bloqueio dos dados.

Princípios da LGPD, segundo o artigo 6.

I - finalidade: realização do tratamento para propósitos legítimos, específicos, explícitos e informados ao titular, sem possibilidade de tratamento posterior de forma incompatível com essas finalidades;

II - adequação: compatibilidade do tratamento com as finalidades informadas ao titular, de acordo com o contexto do tratamento;

III - necessidade: limitação do tratamento ao mínimo necessário para a realização de suas finalidades, com abrangência dos dados pertinentes, proporcionais e não excessivos em relação às finalidades do tratamento de dados;

IV - livre acesso: garantia, aos titulares, de consulta facilitada e gratuita sobre a forma e a duração do tratamento, bem como sobre a integralidade de seus dados pessoais;

V - qualidade dos dados: garantia, aos titulares, de exatidão, clareza, relevância e atualização dos dados, de acordo com a necessidade e para o cumprimento da finalidade de seu tratamento;

VI - transparência: garantia, aos titulares, de informações claras, precisas e facilmente acessíveis sobre a realização do tratamento e os respectivos agentes de tratamento, observados os segredos comercial e industrial;

VII - segurança: utilização de medidas técnicas e administrativas aptas a proteger os dados pessoais de acessos não autorizados e de situações acidentais ou ilícitas de destruição, perda, alteração, comunicação ou difusão;

VIII - prevenção: adoção de medidas para prevenir a ocorrência de danos em virtude do tratamento de dados pessoais;

IX - não discriminação: impossibilidade de realização do tratamento para fins discriminatórios ilícitos ou abusivos;

X - responsabilização e prestação de contas: demonstração, pelo agente, da adoção de medidas eficazes e capazes de comprovar a observância e o cumprimento das normas de proteção de dados pessoais e, inclusive, da eficácia dessas medidas.

Aprofunde seus conhecimentos sobre Big Data na educação

Ao longo deste especial, apresentamos várias definições, conceitos e razões para utilizar data science como meio de explorar os dados da educação e extrair ações concretas por meio deles. Se você quer adquirir um conhecimento ainda mais profundo sobre o tema para aplicá-lo em seu trabalho, deixamos abaixo uma série de referências importantes que estão disponíveis aqui no Observatório de Educação. Confira:

Big Data para o desenvolvimento

Versão traduzida e reduzida pelo Cetic.br do artigo em inglês de Emmanuel Letouzé é diretor e cofundador da Data-Pop Alliance e pesquisador visitante no MIT Media Lab, pesquisador afiliado no Harvard Humanitarian Initiative e pesquisador associado no Overseas Development Institute

Acesse aqui

Acesse a versão em inglês aqui

Big Data para monitorar sistemas educacionais

Relatório da Comissão Europeia sobre o impacto a longo prazo do Big Data no monitoramento de sistemas educacionais (em inglês).

Acesse aqui

Big Data Estratégico: um framework para a gestão sistêmica do ecossistema Big Data

Dissertação de mestrado de Luciana Sodré apresentada ao Programa de Pós-graduação em Engenharia de Produção, COPPE, da Universidade Federal do Rio de Janeiro.

Acesse aqui

Revista Inteligência Empresarial sobre Big Data

Edição especial da Revista Inteligência Empresarial, do CRIE/COPPE/UFRJ, dedicada ao Big Data, o fenômeno da digitalização do mundo.

Acesse aqui

Cartilha "É pra já! A proteção de dados de crianças e adolescentes não pode esperar"

Cartilha escrita por Alessandra Borelli para explicar a importância da proteção dos dados pessoais de crianças e adolescentes.

Acesse aqui

Cartilha "Os impactos da LGPD nas instituições de ensino"

Alessandra Borelli e Juliana Abrusio desenvolveram a cartilha para ajudar as instituições de ensino a compreender melhor a Lei Geral de Proteção de Dados e, então, se organizarem para elaboração de um planejamento eficaz de conformidade.

Acesse aqui

Revisão sistemática sobre Big Data na educação

As pesquisadoras Maria Ijaz Baig, Liyana Shuib e Elaheh Yadegaridehkordi analisaram o estado da arte, limitações e direções para futuras pesquisas sobre Big Data na educação (em inglês).

Acesse aqui

Gostou? Veja mais

Explorando os Dados da Educação

Nosso mundo está ficando cada dia mais conectado e, mesmo que essa transformação não ocorra de maneira democrática, a cada dia são gerados volumes astronômicos de dados sobre tudo que fazemos, gostamos, consumimos e temos interesse. Neste contexto, a ciência de dados tem como objetivo transformar essas...

Saiba mais

Ensino híbrido

A necessidade sanitária de suspender as atividades presenciais nas escolas durante a pandemia de Coronavírus provocou uma série de mudanças emergenciais em todas as redes de ensino do Brasil, de modo a construir modelos de ensino remoto. Enfrentando desafios que vão desde as desigualdades quanto ao acesso à internet até a formação de professores, os gestores agora caminham...

Saiba mais