Aquisição de Dados na Educação: como identificar e obter dados de maneira eficiente nas escolas para gerenciar os desafios educacionais
Saiba mais sobre esta etapa relevante para o tratamento e análise de dados
Introdução
O processo de aquisição de dados envolve métodos de identificação, classificação, filtragem e coleta de dados e, quando executado de maneira estratégica e eficiente por meio de diversas ferramentas e técnicas, é uma etapa extremamente relevante para o tratamento e análise de dados que contribuem com a tomada de decisão. No caso dos dados educacionais, podem ser usados também para subsidiar políticas públicas e pesquisas educacionais, assim como melhor direcionar recursos.
Nesse especial, que integra o projeto Ciência de Dados na Educação do Instituto Unibanco em parceria com o CRIE (Centro de Referência em Inteligência Empresarial, da COPPE/UFRJ), abordaremos a relevância da qualidade e da confiabilidade dos dados coletados, explicaremos o que é dataficação e digitalização, debateremos sobre como dar sentido aos dados coletados de estudantes e escolas, apresentaremos casos práticos que podem contribuir com soluções para desafios enfrentados na gestão escolar e discutiremos questões éticas envolvidas.
Para uma experiência ainda mais profunda sobre o tema, compartilhamos uma série de links para materiais do Observatório de Educação - Ensino Médio e Gestão ao longo do conteúdo. Utilize-os para uma leitura ainda mais rica e completa sobre aquisição e análise de dados na educação e conheça inúmeras oportunidades para serem exploradas.
A relevância da qualidade no processo de aquisição dos dados
Você conhece a expressão "lixo entra, lixo sai" (garbage in, garbage out em inglês ou a sigla GIGO)? Supostamente criada por George Fuechsel, técnico da IBM, ela significa que é preciso atentarmos para a qualidade e confiabilidade dos dados (entradas) para que resultem em análises precisas e corretas (saídas). Por isso, é relevante identificarmos e avaliarmos as principais origens dos dados e os canais por meio dos quais eles são capturados. Esse processo contribui também para o mapeamento ou inventário de dados, como foi mencionado no especial de governança de dados.
Falar de aquisição de dados implica, portanto, em abordarmos também a qualidade dos dados. A gestão da qualidade dos dados é inclusive uma das funções que compõem o DAMA-DMBOK®V2, framework de boas práticas de gestão de dados publicado pela associação independente e sem fins lucrativos Data Management Association (DAMA). Vale lembrar que todas as funções têm impacto na qualidade dos dados - e não apenas essa função específica.
De acordo com o framework, a função de gerenciamento da qualidade dos dados refere-se ao planejamento, implementação e controle de atividades que aplicam técnicas de gestão da qualidade para medir, avaliar, melhorar e garantir a adequação de dados para uso. A qualidade dos dados vai variar de acordo com o contexto em que os dados são usados e as necessidades das pessoas que estão consumindo aqueles dados. O capítulo britânico do DAMA Internacional elencou seis dimensões da qualidade dos dados, destacadas na figura abaixo:
Saiba mais sobre a qualidade dos dados e o DAMA DMBOK em webinar com Donna Burbank (em inglês).
Qualidade de Dados e o DAMA DMBOK por DAMA BRASIL - Eventials
Os processos de melhoria da qualidade dos dados abrangem todo o ciclo de vida dos dados e são contínuos e iterativos. O DAMA DMBOK recomenda o ciclo Deming, conhecido também como PDCA, pelas iniciais em inglês para "planejar-fazer-verificar-agir". Por ser um ciclo, quando as quatro etapas são finalizadas, inicia-se outro ciclo, conforme figura abaixo.
Especificamente sobre o ponto de vista de aquisição, André Filipe Batista, coordenador técnico do Centro de Ciência de Dados do Insper, aponta que há duas frentes a serem trabalhadas. Uma delas é a melhoria do processo de geração de dados, ou seja, gerar dados com maior qualidade, estabelecer processos e procedimentos para a melhoria dos dados, etc. A outra é facilitar e padronizar formas de acesso aos mais diversos dados. "Além disso, ao obter dados é importante verificar a origem dos dados e o processo sob o qual ele foi criado ou disponibilizado. É preciso ter a capacidade de avaliar a adequabilidade dos dados para nosso propósito de análise. Essa avaliação é decorrente de um processo de formação em análise de dados", comenta: "Falta, para a maioria das organizações e das pessoas, o que chamamos de data literacy ou, como gosto de traduzir, proficiência em dados. Boa parte dos profissionais hoje atuantes não receberam formação analítica para se trabalhar com dados, desde sua aquisição, seu entendimento, processamento, análise e comunicação".
Quais dados de qualidade selecionar e como obtê-los?
Não há dúvidas da relevância da qualidade no processo de tomada de decisão com base em dados e evidências. Mas como identificar quais dados usar e como obtê-los? Ou, em outras palavras, como dataficar? Para o Centro de Referência em Inteligência Empresarial (CRIE), dataficação é o processo de identificação de quais dados são necessários para resolver um problema, e como obtê-los.
Em entrevista para este especial, Pedro Figueiredo, professor da disciplina de Aquisição de Dados do WIDA - pós em Big Data Estratégico do CRIE, explica as diferenças entre digitalização (que é o processo de traduzir algo do ambiente físico para o digital) e dataficação, a partir de um exemplo de uma aula de matemática. "Imagine uma sala de aula tradicional, onde esteja ocorrendo uma aula de matemática para o ensino médio, na qual o professor deve explicar funções. O professor entra em sala, e dá a aula conforme o planejamento que tiver elaborado. Esse é o nosso modelo tradicional, analógico. Agora vamos pensar em digitalizar essa experiência. Ou seja, como levar a aula analógica para o digital, de forma que outros alunos, em outros lugares, possam ter a mesma experiência. Uma solução possível é colocar uma câmera e filmar a aula. Com isso, ao final, teremos um arquivo de computador com o vídeo dessa gravação. A esse processo chamamos de digitalização. Em termos de experiência, o processo de digitalização não consegue, ainda, levar toda a aula para o digital. Além dos estímulos sensoriais (auditivos, visuais, térmicos etc.), existem diversos outros que a digitalização ainda não consegue captar na mesma intensidade. Um olhar que escapou à câmera, uma careta de um aluno, e por aí vai", comenta. Dataficar, por sua vez, é mais abrangente do que digitalizar. "Dataficar é traduzir algo do ambiente (físico, digital ou ambos), em dados. E como traduzimos uma aula de matemática em dados? É um exercício teórico e livre. Não há regras. Normalmente dataficamos para responder a uma pergunta ou problema. No caso da nossa aula, podemos pensar nos seguintes dados: data da aula, hora de início da aula, hora de fim da aula, nome do professor, quantidade de alunos presentes, disciplina lecionada, matéria, quantidade de perguntas feitas pelos alunos etc. Como visto, um problema, ou questão, podem ser dataficados por meio de uma infinidade de dados. É a reflexão sobre dado problema que indicará quais dados o representam; e uma vez que saibamos quais dados melhor representam um problema, o passo seguinte é ' como adquiri-los?'", explica Pedro.
Recomendações para aquisição de dados
Pedro elenca três passos para um processo eficiente de aquisição de dados para se chegar ao momento em que os dados possam ser trabalhados.
1. Estabelecer um inventário de dados: também chamado de mapeamento de dados ou data mapping, o inventário de dados refere-se ao registro completo dos recursos de informação mantidos por uma organização. Um inventário de dados adequado detalha não apenas a coleta de informações, mas também o local de armazenamento e a análise. "É muito parecido com o que chamamos em informática de dicionário de dados, mas o inventário atua no contexto do problema e não da base de dados. Um inventário de dados diz, para um determinado problema ou questão, quais são os dados que o dataficam", afirma. Segundo Pedro, um bom inventário deve ter, para cada dado: nome do dado, formato em que deve ser trabalhado (número, texto, data, link etc.), fontes (de onde ele sai, ou como é coletado), confiabilidade (alta, média ou baixa), frequência de coleta (tempo real, de hora em hora, a cada duas horas etc.), volume (alto, médio ou baixo), importância para o problema (alta, média ou baixa).
2. Identificar a confiabilidade da fonte: "Muitas vezes trabalhamos com dados defasados, que não foram atualizados no tempo devido. Ou então somos induzidos a trabalhar com dados de fontes duvidosas. É uma armadilha da qual deve-se buscar fugir sempre", comenta. Pedro recomenda, ainda, priorizar as diversas fontes de dados, da fonte mais confiável à fonte menos confiável.
3. Realizar o tratamento ou "higienização" dos dados: "Quem trabalha com dados está sujeito a receber uma grande quantidade de 'lixo' das fontes", afirma Pedro sobre dados incompletos ou defasados, com grande potencial de interferir nas análises que serão realizadas posteriormente. "Imagine o cadastro de alunos de uma rede de ensino. É muito provável que ali tenha alunos sem dados-chave ou com dados-chave incompletos (falo aqui de nome, CPF, endereço etc.)".
Dependendo da natureza dos problemas e da abordagem para solução, é possível mais de uma solução. Por isso Pedro sugere que o cientista busque sempre indicar qual o referencial teórico usado para suas análises, qual linha de pesquisa seguiu, de forma que outras pessoas possam repetir o percurso e chegar às mesmas conclusões.
Principais fontes para extrair dados sobre educação
Como mencionado anteriormente, a coleta, captura ou extração – seja de dados estruturados e não estruturados – deve ser oriunda de fontes confiáveis e relevantes. A qualidade da coleta, do armazenamento, do processamento ou pré-processamento dos dados vai impactar na capacidade de produzir análises significativas a partir desses dados.
Pode-se capturar dados por meio de diversas estratégias, de maneira ativa, por meio de solicitações, ou automática. Alguns exemplos: pesquisas, entrevistas e grupos focais; cadastros; log de atividades de clientes e usuários; sensores; rastros digitais; bots; APIs de redes sociais; crawlers e robôs; etc. A inserção desses dados em sistemas também pode ser manual ou automática a partir de equipamentos em tempo real.
Com a pandemia e a migração das aulas para ambientes digitais, intensificaram-se o volume e o fluxo de dados gerados por alunos e professores, ampliando, assim, as possibilidades de aquisição de dados. Além dos dados primários que secretarias e escolas podem capturar de seus alunos, professores, gestores e outros atores do ecossistema educacional, de modo físico ou digital, como de testes, frequência e permanência nas aulas, dados cadastrais, de tecnologias educacionais, dentre outros, existe a possibilidade de ter acesso a dados de terceiros, ou seja, de outras instituições.
Especificamente sobre dados educacionais, a Escola de Dados fez uma curadoria das principais fontes para extrair dados sobre educação e destacamos algumas a seguir. Confira.
Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP):
A página de dados abertos do INEP traz os principais levantamentos da área da educação no Brasil, incluindo microdados, tais como estatísticas do Censo Escolar e desempenho do Exame Nacional do Ensino Médio (Enem). O INEP também mantém o Índice de Desenvolvimento da Educação Básica (IDEB), que mede o fluxo escolar e o desempenho dos alunos da educação básica do Brasil.
Instituto Brasileiro de Geografia e Estatística (IBGE):
a Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua) traz dados do percentual de pessoas alfabetizadas no Brasil.
Observatório do Plano Educacional de Educação:
O Plano Nacional de Educação (PNE) é uma lei em vigência desde 2014 na qual foram estabelecidas 20 metas para a Educação Brasileira que devem ser cumpridas até 2024. O Observatório, criado pela organização Todos Pela Educação, acompanha o cumprimento das metas estabelecidas pelo PNE.
Programme for International Student Assessment (Pisa):
Projeto administrado pela Organização para a Cooperação e Desenvolvimento Econômico (OCDE), que mede o rendimento dos alunos em cinco diferentes áreas: ciências, matemática, leitura, resolução colaborativa de problemas e educação financeira.
Além desses, há plataformas que agregam dados educacionais em painéis interativos, tais como o QEdu e o Educação em Números do Instituto Unibanco.
Acrescentamos à curadoria da Escola de Dados as seguintes fontes:
A agência da ONU reúne dados sobre evasão escolar, uso de tecnologias educacionais, entre outros, em formato de tabelas, visualizações interativas ou publicações. Em inglês.
Dados educacionais do Banco Mundial:
O site EdStats traz estatísticas sobre educação que podem ser exploradas por temas, como políticas, equidade etc. Em inglês.
O site tem uma parte dedicada à educação global, com números mundiais referentes a alfabetização, frequência escolar, dentre outros. Em inglês.
Painel de Desigualdades Educacionais no Brasil:
Iniciativa do Cenpec que apresenta um painel interativo com dados e análises sobre as desigualdades educacionais, análises sobre o contexto histórico das desigualdades educacionais, além de informações sobre políticas públicas comprometidas com a reversão desse cenário.
Confira também plataformas mencionadas no especial sobre visualização de dados. Visualização de Dados na Educação: vantagens da representação visual para a gestão escolar (institutounibanco.org.br)
Destacamos ainda os portais governamentais de dados abertos, nos diversos níveis administrativos (municipal, estadual e federal). O Ministério da Educação disponibilizada 52 conjuntos de dados no Portal Brasileiro de Dados Abertos e também tem um portal próprio, com 32 conjuntos de dados. Alguns estados têm, ainda, sites específicos, como São Paulo, com números relacionados à matrícula, orçamento, infraestrutura e serviços, dentre outros. Por fim, é possível também solicitar dados de interesse público que não estejam disponíveis publicamente diretamente ao órgão público, por meio da Lei de Acesso à Informação (LAI).
Como dar sentido aos dados coletados de estudantes e escolas?
O potencial de acesso a dados de estudantes e escolas está cada vez maior - seja de fontes de dados mais tradicionais, como notas de disciplinas, exames nacionais, frequência em aula, ou ainda oriundos de tecnologias educacionais, como sistemas tutores inteligentes, log de dados, ambientes digitais, entre outros. Mas como os líderes educacionais podem dar sentido a esses dados, tanto no dia a dia de trabalho quanto para fornecer insumos para políticas públicas? Como os dados podem ser usados para ajudar a responder questões educacionais relevantes para diretores, professores, pais e alunos? Como técnicas e ferramentas de big data, mineração de dados, ciência de dados, podem contribuir na aquisição, coleta, tratamento e análise dos dados? É o que pretende responder um grupo de pesquisa do Teachers College, escola de pós-graduação em educação, psicologia e saúde da Universidade de Columbia, em Nova Iorque, nos Estados Unidos, que pesquisa Análise de Dados de Liderança Educacional (ou ELDA, em inglês, sigla para Education Leadership Data Analytics).
A ELDA seria, segundo a definição de Alex Bowers, professor de Liderança Educacional do Teachers College, e colegas, a “interseção da liderança educacional, o uso de ciclos de melhoria baseados em evidências nas escolas para promover a melhoria instrucional e a ciência de dados educacionais” (ver figura abaixo). Segundo os pesquisadores, educadores em todo o mundo estão sendo continuamente incentivados a usar dados para contribuir com a melhoria no ensino-aprendizagem nas escolas, mas raramente são chamados a colaborar com a construção dos painéis de dados. Para muitos educadores, os relatórios que recebem nos “painéis de dados” da escola e do distrito são incompreensíveis, ou ainda, no momento em que os recebem, seus alunos já passaram para a próxima série.
O grupo propõe, assim, para que a construção de visualizações, painéis e códigos contemplem as questões e os desafios mais relevantes enfrentados pelos educadores e que os dados possam contribuir com ciclos de melhoria baseados em evidências para aprimoramento do ensino nas escolas. Por meio da colaboração contínua, a ELDA fornece uma estrutura para apoiar o uso de dados e os ciclos de melhoria baseados em evidências nas escolas. "Em vez de termos gestores e formuladores de políticas dizendo aos professores o que fazer, treinamos profissionais da escola para terem conversas colaborativas e confiáveis em torno de evidências. A ideia com a Análise de Dados de Liderança Educacional é tentar reunir a liderança educacional, os ciclos de melhoria baseados em evidências - nos quais não estamos fornecendo dados para professores, mas estamos ajudando a aumentar sua capacidade em ter essas conversas -, e as ferramentas que temos de big data, análise de dados, ciência de dados, aprendizado de máquina e pesquisa de interação humano-computador que mostram como podemos ajudar a apoiar decisões demonstradas por análises que nos ajudam a visualizar os padrões que nem sabíamos que existiam", explica Bowers em entrevista exclusiva para esse especial.
De acordo com Bowers, nos últimos 20 anos nos Estados Unidos, professores, escolas e distritos escolares vêm sendo incentivados a usar continuamente dados e evidências para tomar decisões e aprimorar o ensino e a aprendizagem. Foram desenvolvidos diversos sistemas de dados, incluindo os chamados data warehouses instrucionais, que fornecem insumos para um ciclo de melhoria contínua que, no modelo lógico de tomada de decisão baseada em dados e ciclos de melhorias baseados em evidências, funciona de acordo com o modelo apresentado na figura abaixo. Ou seja, primeiramente os dados são coletados, para então serem organizados, filtrados e analisados de modo a gerar informações. Essas informações combinadas com a experiência do professor e do gestor geram conhecimento aplicado a uma resposta e ação. Isso leva a resultados, que com novos dados seguem em iterações subsequentes do ciclo PDSA (sigla em inglês para “plan-do-study-act”, ou em português "planejar-fazer-estudar-agir"), uma adaptação do PDCA.
Grande parte da pesquisa sobre o uso de dados na educação se concentra na seção cinza da figura abaixo, que detalha como os educadores podem se envolver no trabalho colaborativo em ciclos de melhoria baseados em evidências para transformar dados e visualizações em informação, conhecimento e ação por meio de colaboração e iteração.
No entanto, Bowers alega que menos atenção tem sido dada na pesquisa às questões de captura e coleta de dados, organização e uso de banco de dados e visualização de dados e construção de painéis. Isso é problemático, pois sem visualizações de dados e painéis informativos e úteis é difícil entender como professores e administradores poderiam usar essas análises em suas discussões de dados. Muitas vezes, dados e evidências pulam a fase de coleta e captura de dados, não são representados no banco de dados ou nos painéis de dados e talvez recebam apenas organização e resumo mínimos. O professor relembra que normalmente os seguintes tipos de dados são usados para decisões com base em dados e evidências em escolas:
Por que os painéis de dados não são usados com mais frequência pelos educadores?
Segundo Bowers, as empresas de sistemas de dados e sistemas de alerta antecipado de abandono estão criando, sem falar previamente com professores, sistemas e painéis que são vendidos para países ou escolas. Gasta-se uma quantia enorme de dinheiro e ninguém usa os sistemas. Citando diversos estudos mencionados na nossa seção de aprofundamento, o professor enumera cinco razões para a não utilização dos painéis de dados pelos professores.
1. As discussões sobre os dados instrucionais relacionados às práticas individuais dos professores e aos resultados dos alunos continuam a ser raros.
2. Os professores relatam continuamente nas pesquisas de uso de dados que os dados disponíveis em bancos de dados e painéis se concentram principalmente em pontuações de testes padronizados, frequência e dados demográficos, que são os dados relatados para conformidade com as políticas públicas.
3. Os professores relatam continuamente que os dados mais relevantes para sua prática são os dados que estão mais próximos de seu trabalho diário em sala de aula, incluindo avaliações formativas, tarefas em sala de aula e trabalhos de casa e avaliações intermediárias periódicas.
4. Pouca atenção tem sido dada no primeiro passo do processo de inserção de dados em bancos de dados e rotinas de coleta de dados, para gerar visualizações que possam ser efetivamente úteis no dia a dia de trabalho.
5. Inovações recentes em análises e visualizações de dados começaram a chegar às escolas por meio dos inúmeros conjuntos de painéis de dados conectados a esses sistemas de banco de dados. No entanto, há poucas evidências até o momento de que professores e gestores não apenas usem esses painéis, mas que sejam eficazes em informar a melhoria instrucional e o trabalho de professores e diretores nas escolas. Em grande parte desse trabalho, falta a inclusão de professores e diretores no co-design dessas importantes visualizações e painéis que se destinam a ajudar em seu trabalho nas escolas.
"Um ponto de partida é começar conversando com os professores primeiro, porque o que estamos descobrindo é que os dados coletados não são os dados com os quais os professores estão mais preocupados", aconselha.
Tecnologias como aliadas na aquisição de dados para gestão de desafios educacionais
A digitalização ou o registro e medição dos fenômenos físicos trouxe diversas possibilidades para análise de dados de estudantes. Elencamos três casos que usam tecnologias distintas – reconhecimento facial, rastreamento ocular e log de dados – para gerenciar desafios na educação, tais como evasão escolar, redução de custos, resolução de problemas de leitura e melhores estratégias de aprendizado online. Confira abaixo.
Reconhecimento facial gera resultados positivos na Rede Municipal de Ensino de Mata de São João (BA)
De acordo com a Prefeitura de Mata de São João, na Bahia, a análise dos dados obtidos por meio do sistema de monitoramento facial adotado em 2021 nas unidades de ensino fundamental do município já está rendendo resultados positivos. Funciona da seguinte maneira: ao entrar na escola, um equipamento registra os dados faciais dos alunos e afere sua temperatura. Após o horário de chegada, um boletim é gerado com a frequência escolar, dispensando a realização de chamada em sala de aula – o que otimiza o tempo de aprendizado. Quando um aluno falta, é enviada uma mensagem para o celular dos pais ou responsáveis, o que contribui para combater a evasão escolar. O número de alunos presentes naquele dia também é enviado para a cantina, que prepara a quantidade adequada de alimentação e evita desperdício, o que vem gerando redução de custos.
Rastreamento ocular contribui com resolução de problemas de leitura em crianças
A startup Okimo está realizando estudos-piloto em parceria com organizações, governos e escolas a fim de acompanhar o desempenho visual e de leitura das crianças por meio de biomarcadores e dados biométricos. Até o momento, 400 crianças do Paraguai participaram dos estudos. A fundadora da Okimo, Gabriela Galilea, ressalta que a Organização Mundial da Saúde estima que faltam 65 mil oftalmologistas no mundo para detectar e tratar problemas de visão, o que tem um custo de US$ 28 bilhões ao ano. O software e os sensores desenvolvidos por eles contribuíram para preencher de algum modo essa lacuna, pois muitas crianças nunca fizeram um exame de vista. Além disso, poderiam identificar problemas tratáveis que geralmente não são detectáveis em exames de vista. Confira como funciona o software no vídeo abaixo.
Uso de log de dados para investigar estratégias de aprendizado online
Os pesquisadores Maria Theobald, Henrik Bellhäuser e Margarete Imhof, da Johannes Gutenberg-University Mainz, na Alemanha, usaram dados longitudinais de arquivos de log para examinar as estratégias de aprendizagem de universitários em aulas online. Arquivos de log registram o que aconteceu, quando e por quem, em sistemas computacionais. Em geral, armazenam login, data e hora, por exemplo. Maria, Henrik e Margarete analisaram, primeiramente, a prática distribuída de estudos ou aprendizagem espaçada (quando o aluno estuda determinada temática por pequenos períodos de tempo várias vezes ao longo de um prazo maior de tempo) e o uso de autotestes (que simulam uma prova) com as notas dos testes em um curso online. Eles concluíram uma associação positiva de prática distribuída de estudos e autotestes (assim como de um melhor histórico acadêmico no ensino médio, ou seja, um GPA mais alto, que significa a média geral de todas as matérias do ensino médio nos Estados Unidos) com uma aprendizagem online bem-sucedida. Os resultados da pesquisa evidenciaram que alunos que tinham mais consciência das suas notas por meio dos autotestes usavam a aprendizagem espaçada (distribuindo os estudos ao longo do semestre) e, com isso, melhoraram suas notas.
Questões éticas sobre dados obtidos por tecnologias educacionais
O uso de dados educacionais de maneira ética e responsável implica em um letramento ou proficiência de dados, avaliam os pesquisadores Ellen B. Mandinach, Brennan M. Parton, Edith S. Gummer e Rachel Anderson. Em matéria na Phi Delta Kappan, eles definem que o letramento em dados voltado para a educação seria "a capacidade de transformar informações em conhecimento e práticas instrucionais acionáveis coletando, analisando e interpretando todos os tipos de dados. Ele combina uma compreensão de dados com padrões, conhecimento e práticas disciplinares, conhecimento curricular, conhecimento de conteúdo pedagógico e uma compreensão de como as crianças aprendem".
A fim de obter um panorama sobre a ética do uso de dados obtidos por meio de tecnologias digitais na educação, as pesquisadoras Laura Hakimi, Rebecca Eynon e Victoria A. Murphy, da Universidade de Oxford, realizaram uma análise sistemática qualitativa da literatura acadêmica sobre o tema. De acordo com a pesquisa, há princípios éticos bem estabelecidos e diretrizes para o uso de dados digitais (como legislações, por exemplo). No entanto, ainda há poucos recursos disponíveis para profissionais da educação que orientem a escolha ética de como usar estes tipos de dados no contexto da aprendizagem e ensino.
A busca por estudos sobre ética digital, dados obtidos por rastreamento digital e educação nas bases de dados EBSCOHost, ProQuest e Google Acadêmico, publicados desde os anos 2000, resultou em 77 estudos revisados por pares. A partir da análise desses artigos selecionados, foram mapeadas as características da pesquisa por tipo de estudo (a grande maioria de artigos conceituais), comunidade acadêmica (a maior parte do campo de learning analytics - analítica de aprendizagem, seguida por governança/dataficação), cenário institucional (a maior parte do ensino superior) e países (Reino Unido, seguido por Estados Unidos e Austrália).
Quatro áreas de foco foram identificadas nesta área emergente, detalhadas a seguir: (1) privacidade, consentimento informado e propriedade dos dados; (2) validade e integridade/completude/precisão dos dados digitais; (3) tomada de decisão ética; e (4) governança e accountability (responsabilidade).
Privacidade, consentimento informado e propriedade dos dados: as noções de privacidade, consentimento informado e até que ponto os dados digitais podem e/ou devem ser anonimizados representam as questões éticas mais comuns e amplamente discutidas nos artigos selecionados. Um número significativo de autores reconheceu que a privacidade das informações dos alunos é importante para a educação devido ao impacto adverso que usos ou divulgações inadequados podem ter sobre o aprendizado ou desenvolvimento social. Foram levantadas ainda questões sobre quem tem o direito de usar e/ou lucrar com os dados. Diversos estudos destacam também que o processo de agregação de dados pode significar que os dados são combinados de muitas fontes diferentes, usados e/ou compartilhados por muitos atores e para uma ampla gama de propósitos. Além disso, vários estudos reconhecem a possibilidade de que novas informações pessoais possam ser deduzidas ou inferidas pelo emprego de análise de dados em dados já coletados. Ainda relacionado à privacidade, vários estudos vincularam a privacidade de dados ao conceito de “vigilância de dados”.
Algumas respostas identificadas nos estudos para gerenciar tais questões foram desidentificação dos dados, privacidade por design ou desde a concepção, consentimento como um processo contínuo, conselhos ou grupos de trabalho de revisão da privacidade, dentre outros.
Validade e integridade/completude/precisão: uma grande proporção dos estudos identificou preocupações éticas relacionadas com a natureza dos próprios dados de rastreamento digital e as várias suposições que estão entrelaçadas com os processos de análise de dados, tais como a natureza reducionista dos dados, a necessidade de filtragem extensiva, classificação e padronização para transformar os dados de rastreamento digital em bancos de dados, e a preocupação em aumentar os vieses e a discriminação em relação a determinados grupos de alunos.
Algumas respostas identificadas nos estudos para gerenciar tais questões foram um maior monitoramento e questionamento sobre a captura dos dados, ética por design ou desde a concepção, inclusão de mais informação contextual no processo de analítica de dados, maior transparência, mais treinamento em dados, e estabelecimento de uma data de expiração para apagar os dados.
Tomada de decisão ética: a obrigação de agir foi discutida mais no contexto do ensino superior. Os estudos trouxeram reflexões sobre questões como "que obrigação tem a instituição de intervir quando há evidência de que um aluno poderia se beneficiar de apoio adicional? Que obrigação os alunos têm quando a análise sugere ações para melhorar seu progresso acadêmico? Como são decididas as intervenções apropriadas?".
Algumas respostas identificadas nos estudos para gerenciar tais questões foram explicitar as circunstâncias para uma possível intervenção, considerando seus impactos, e usar dados qualitativos adicionais como parte do processo decisório.
Governança e accountability: um número significativo de estudiosos levantam questões importantes sobre o crescente poder das empresas de software, atores não governamentais e centros de análise de dados no âmbito da educação. Notou-se, ainda, que as instituições de ensino estão conduzindo suas práticas de trabalho neste contexto de “governança algorítmica” muitas vezes sem perceber completamente como os dados que eles geram são captados e usados por terceiros.
Algumas respostas identificadas nos estudos para gerenciar tais questões foram entender como funcionam as redes de dados, examinar responsabilidades de instituições públicas e privadas, maior transparência nos processos.
GLOSSÁRIO DE TERMOS DA CIÊNCIA DE DADOS
Aprofunde seus conhecimentos sobre aquisição de dados
Ao longo deste especial, apresentamos várias definições, casos e reflexões sobre aquisição de dados e sua relevância no processo maior de uso de dados educacionais. Se você quer adquirir um conhecimento ainda mais profundo sobre o tema para aplicá-lo em seu trabalho, deixamos abaixo uma série de referências importantes que estão disponíveis aqui no Observatório de Educação. Confira:
Artigos relacionados:
- Apagão de dados educacionais é preocupante
- Entrevista: Uso da ciência de dados nas escolas traz benefícios para a educação
- Mineração de Dados Educacionais: oportunidades para o Brasil
Data Visualization, Dashboards, and Evidence Use in Schools:
Data Collaborative Workshop Perspectives of Educators, Researchers, and Data Scientists [Visualização de dados, painéis e uso de evidências nas escolas: perspectivas de educadores, pesquisadores e cientistas de dados em workshop colaborativo de dados, tradução livre]
Publicação com conteúdo apresentado e debatido no Workshop Colaborativo sobre Análise de Dados da Educação, realizado em 2019 no Teachers College, pós-graduação em educação, psicologia e saúde da Universidade Columbia, em Nova Iorque, com aproximadamente 80 participantes. O livro é composto por 28 capítulos de autores que participaram do evento, incluindo educadores, cientistas de dados e pesquisadores. Em inglês.
Grupo de pesquisa sobre Análise de Dados de Liderança Educacional (ELDA, na sigla em inglês)
Página do grupo de pesquisa sobre Análise de Dados de Liderança Educacional, do Teachers College, da Universidade Columbia, em Nova Iorque, nos Estados Unidos, com informações sobre pesquisadores, pesquisas em andamento e artigos. Em inglês.
Learning Theater Spotlight: Education Leadership Data Analytics Summit
Vídeo resumo do evento Education Leadership Data Analytics Summit, realizado em 2018, nos Estados Unidos. Em inglês.
Education Leadership Data Analytics (ELDA):
A White Paper Report on the 2018 ELDA Summit [Education Leadership Data Analytics (ELDA): um relatório o encontro de 208, tradução livre]
Relatório do evento Education Leadership Data Analytics Summit, realizado em 2018, nos Estados Unidos. Em inglês.
Data Analytics and Decision-Making in Education:
Towards the Educational Data Scientist as a Key Actor in Schools and Higher Education Institutions [Analítica de Dados e Tomada de Decisão na Educação: Rumo ao Cientista de Dados Educacional como Ator-Chave nas Escolas e Instituições de Ensino Superior, tradução livre]
Neste capítulo, Alex Bowers e Tommaso Agasisti destacam a importância do uso de dados para melhorar a formulação de políticas (no nível do sistema), gestão de instituições educacionais e abordagens pedagógicas em sala de aula. Em inglês.
Ferramenta para mapear as consequências de tecnologias
De acordo com o Open Data Institute (ODI), organização criada por Tim Berners-Lee e Nigel Shadbolt para promover a cultura de dados abertos, são necessários tempo e processo para considerar as implicações da tecnologia e do desenvolvimento de produtos – um dos principais aspectos das práticas de dados éticos. O ODI desenvolveu uma ferramenta que auxilia neste processo, com questões a serem refletidas sobre o tema. Em inglês.
Fluxo do trabalho com dados: do zero à prática
Publicação da Escola de Dados destinada a profissionais e estudantes interessados em trabalhar com dados no campo da comunicação, em especial no jornalismo e na produção de conteúdos para organizações da sociedade civil. O guia é baseado no fluxo de trabalho com dados (data pipeline), uma metodologia desenvolvida pela rede da Escola de Dados internacionalmente, que aborda todas etapas do trabalho, da definição das questões à visualização dos dados.
Análise de dados educacionais: aplicando evidências na gestão pública
E-book com conteúdo do curso “Análise de Dados Educacionais”, da Escola de Dados. A formação buscou ampliar a capacidade de obtenção e análise de dados de gestores públicos da área de educação, competência essencial para a melhoria das políticas públicas educacionais, sobretudo aquelas de caráter pedagógico que podem ser desenvolvidas a partir dos dados de avaliação.
Gostou? Veja mais
Desigualdade racial na educação brasileira
De caráter estrutural e sistêmico, a desigualdade racial no Brasil é inquestionável e persiste devido a fragilidade de políticas públicas para o seu enfrentamento. De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE) ...
Saiba maisAbre em uma nova guiaCombate à Discriminação Racial na escola é tema de coleção
A coleção Combate à Discriminação na Escola tem como objetivo problematizar as implicações da discriminação racial no ambiente escolar, bem como compartilhar experiências pedagógicas positivas para a construção de uma educação antirracista ...
Saiba maisAbre em uma nova guia