Visualização de Dados na Educação: vantagens da representação visual para a gestão escolar
Saiba como a visualização de dados contribui para a análise de informações e a tomada de decisões qualificada na elaboração de planejamentos e políticas públicas para a educação
Introdução
A visualização de dados pode ser definida como a representação visual de dados por meio de elementos como gráficos, diagramas, mapas, entre outros. Certamente, você já deve ter percebido que quando há esses elementos visuais em algum texto, a leitura é mais leve e a compreensão dos dados mais direta e clara. Mas a visualização de dados é muito mais do que uma ferramenta para contar histórias de maneira mais atraente e eficiente. Ela possibilita ver mais facilmente relações, tendências e exceções, e proporciona, assim, diagnósticos mais precisos e um processo decisório mais assertivo, baseado em dados e evidências.
A análise de dados educacionais é extremamente relevante para oferecer subsídios para gestores, professores e formuladores de políticas públicas, contribuindo assim para o avanço contínuo da gestão educacional e para uma melhor aprendizagem. A visualização de Dados e Educação é o tema deste especial - que integra o projeto Ciência de Dados na Educação do Instituto Unibanco em parceria com o CRIE (Centro de Referência em Inteligência Empresarial, da COPPE/UFRJ).
Para uma experiência ainda mais profunda sobre o tema, compartilhamos uma série de links para materiais do Observatório de Educação - Ensino Médio e Gestão ao longo do conteúdo. Utilize-os para uma leitura mais rica e completa sobre o uso de visualização de dados na educação e saiba como ela pode orientar ações para a administração escolar, ensino e gestão pública.
Aspectos conceituais da visualização de dados
No especial sobre Big Data na educação, destacamos os desafios de se analisar grandes quantidades de dados. A visualização de dados é uma grande aliada nesse processo. Trata-se de um vasto campo de conhecimento que reúne áreas como comunicação, ciência da informação, ciência da computação, estatística e design. Neste especial, o foco é abordá-la como uma etapa
Na definição de Alberto Cairo , jornalista, designer e diretor do programa de visualização no Centro de Ciência da Computação da Universidade de Miami, nos Estados Unidos, visualização de dados é uma forma de exibir informação “desenhada para permitir análises, explorações e descobertas”, pois aumenta a capacidade de compreensão humana, especialmente de fenômenos complexos. Quando bem feita, pode ajudar na identificação de padrões e tendências que não seriam percebidos de outro modo.
De acordo com a publicação The Encyclopedia of Human-Computer Interaction, da Interaction Design Foundation, escola online de design, a visualização de dados é a exibição gráfica de informações abstratas para criar sentido (sense-making ou também chamada de análise de dados) e comunicar. David McCandless, jornalista de dados e designer britânico, resume no TED 2010, “The beauty of data visualization”,da seguinte forma: "a visualização de dados é uma forma de compressão do conhecimento".
Stephen Few , consultor e autor de livros sobre visualização de dados, cita a parábola dos três cegos e um elefante para representar a dificuldade de dar sentido aos dados, especialmente quando estão fragmentados. Segundo a parábola, um grupo de homens cegos, ao encontrarem um elefante pela primeira vez, tentam descobrir que animal é. Como cada um toca uma parte diferente do corpo do elefante, sem examiná-lo inteiro, as descrições sobre o animal são divergentes. Few alerta que, sem a possibilidade de examinar os dados a partir de múltiplas perspectivas ao mesmo tempo, muitas das relações significativas que existem entre os dados permanecem desconhecidas. Ferramentas de visualização de dados que possibilitam o que ele chama de "display analítico facetado" contribuem para essa visão sistêmica e para análises e descobertas dessas relações.
A metodologia de Data Thinking do CRIE (Centro de Referência em Inteligência Empresarial, da COPPE/UFRJ) propõe cinco etapas para se pensar os dados, baseadas na Ciência de Dados e no design thinking. Todas as etapas pressupõem fases de divergência, na qual são exploradas opções e abre-se o leque para diferentes pontos de vista, e convergência, quando refletimos sobre a fase anterior e fazemos escolhas.
Diante de um desafio, propõe-se inicialmente compreender o problema e formular as perguntas ( etapa 1: perguntar ). Depois, sugere-se obter, refinar e explorar os dados capturados em diversas fontes ( etapa 2: pesquisar ), usando o pensamento divergente, para depois convergir analisando e interpretando esses dados ( etapa 3: analisar/combinar ). A linha pontilhada representa a divisão entre o entendimento do problema/desafio (divergência) e a proposição da solução/oportunidade (convergência). A etapa seguinte é a de visualizar e comunicar os resultados (etapa 4: visualizar/comunicar ), finalizando com a tomada de decisão e a implementação de solução e oportunidades ( etapa 5: decidir/implementar ), em um processo iterativo, que pode passar por ajustes.
A visualização de dados está contemplada nas etapas 3 e 4,representadas na figura abaixo, sendo aliada para analisar e combinar, assim como para visualizar e comunicar os dados.
De acordo com o fluxo de trabalho com dados (data pipeline) da Escola de Dados , programa da Open Knowledge Brasil , rede para difundir o conhecimento livre, são sete as etapas do fluxo de trabalho com dados. Elas estão elencadas na figura abaixo e não são necessariamente lineares e podem ser intercaladas. A visualização de dados está presente nas etapas “analise” e “apresente”.
Breve histórico da visualização de dados
A visualização de dados tem origem no século XVIII. Em 1786, o engenheiro e economista escocês William Playfair produziu os primeiros gráficos de barras e de linhas para representar tendências políticas e econômicas.
Desde então, muitos outros foram criados para representar visualmente informações sobre diversos temas, tais como a saúde e a guerra. Na área da saúde, em 1854 o médico John Snow usou um mapa de cólera com dados geolocalizados da doença que ajudou a confirmar sua hipótese de que a transmissão se dava pela água. No caso das guerras, um diagrama de área polar foi criado em 1858 pela enfermeira Florence Nightingale para evidenciar as mortes durante a Guerra da Crimeia. Nesse diagrama, observou-se que a proporção das mortes de soldados por causas evitáveis era menor do que as mortes em combate. Outro caso emblemático foi a visualização do exército de Napoleão concebida por Charles Minard em 1861.
Você pode conferir mais detalhes sobre esses exemplos por meio da TED Talk com o designer de informação Tommy McCall, que resume esse histórico e reforça como dados complexos podem ser representados visualmente.
Você também pode conferir mais detalhes de cada uma das visualizações mencionadas anteriormente, nos vídeos disponíveis no YouTube:
William Playfair (1min27, em inglês, com legendas geradas automaticamente em português ajustadas em configurações);
John Snow (7min, em inglês, com legendas geradas automaticamente em português);
Florence Nightingale (22min, em português);
Charles Minard (6min, em inglês com legendas em português).
A partir da metade do século XX, as pesquisas sobre teorias, métodos e a efetividade dos gráficos evoluíram. Em 1967, o cartógrafo Jacques Bertin lançou o livro Semiologie graphique (A semiologia dos gráficos, na tradução livre), no qual classifica as características das representações gráficas (forma, tamanho, valor, textura, cor, orientação e posição) e analisa a relação desses elementos com a expressividade e a efetividade. Uma década depois, o professor de estatística de Princeton John Tukey escreveu o livro Exploratory Data Analysis, inaugurando uma nova abordagem sobre os dados quantitativos, com uso de computadores: a análise exploratória de dados. Para Tukey, por meio de métodos, estatísticas e gráficos pode-se descobrir padrões, tendências, pontos fora da curva, etc. e, assim, formular hipóteses. Em 1983, Edward Tufte publicou seu livro The Visual Display of Quantitative Information (A Informação Visual de Informações Quantitativas, tradução livre), com exemplos de melhores e piores usos de design gráfico de dados.
Softwares foram desenvolvidos e hoje temos uma infinidade de opções disponíveis, popularizando o uso da visualização de dados. Além disso, existem diversas linguagens de programação, tais como SQL, JavaScript, Python e R, com bibliotecas e pacotes, como Matplotlib e Seaborn, para capturar, organizar, limpar, analisar e visualizar os dados. Dashboards ou painéis de indicadores mostram dados em tempo real com recursos interativos.
O estatístico que "fazia os dados cantarem"
Não poderíamos deixar de mencionar, em um especial de visualização de dados, o estatístico, médico de formação, pesquisador e professor universitário Hans Rosling (1948-2017), referência em contar histórias por meio de dados. Ele chegou a ser chamado de "Guru dos Números" ou "Mago das Estatísticas" por conta de suas animações e gráficos interativos que ajudavam a explicar temas complexos, como desenvolvimento global e pobreza. Foi um dos fundadores, em 2005, da Fundação Gapminder, cuja missão é combater conceitos errôneos e equívocos sistemáticos a partir de uma visão de mundo baseada em fatos que todos possam entender. A Gapminder oferece material didático gratuito e ferramentas para trabalhar com dados estatísticos. Em seu livro Factfulness: o hábito libertador de só ter opiniões baseadas em fatos, Rosling apresenta fatos e estatísticas de forma clara e divertida. Você pode conhecer um pouco mais dos trabalhos de Rosling com diversas palestras TED Talks, que estão disponíveis neste link ou ainda assistir ao documentário da BBC (em inglês, em torno de 1 hora). Confira abaixo um pequeno trecho em que Rosling resume o que aconteceu a 200 países em 200 anos. As legendas em português disponíveis por meio da tradução automática, em configurações.
GLOSSÁRIO DE TERMOS DA CIÊNCIA DE DADOS
-
Prática iterativa a ser feita depois da coleta de dados. Segunda a Escola de Dados, o objetivo é utilizar síntese estatística e técnicas de visualização para entender melhor os dados e identificar insights sobre tendências e a qualidade dos dados, bem como para formular hipóteses e fazer suposições nas análises.
-
A coleta de dados envolve as etapas de escolher as bases de dados, baixar/importar os dados, entendê-los, configurá-los (definir cabeçalhos, etc.), filtrá-los, ordená-los e limpá-los. Há um ditado em Ciência de Computação que diz: Garbage in, Garbage Out (algo como Entra lixo, sai lixo). Ou seja, é preciso atentar para a qualidade e a necessidade dos dados coletados. A Escola de Dados recomenda ter uma postura cética diante dos dados e refletir: Quem produziu e disponibilizou os dados? A fonte é confiável ou possui algum interesse em particular? Qual a metodologia utilizada para registrá-los? Houve alguma mudança ao longo da série histórica dos dados? Quando eles foram coletados? Qual o período que ele abrange? O que os dados significam? Qual o significado das linhas e colunas? Estas perguntas devem ser respondidas antes de dar o próximo passo.
-
Segundo artigo da Forbes , data storytelling ou narrativa de dados é uma abordagem estruturada para comunicar percepções de dados e envolve uma combinação de três elementos principais: dados, recursos visuais e narrativa. Quando a narrativa é combinada com dados, ajuda a explicar ao seu público o que está acontecendo nos dados e porque um determinado insight é importante. Quando os recursos visuais são aplicados aos dados, eles podem chamar a atenção do público para insights que as pessoas não veriam sem tabelas ou gráficos. Quando a narrativa e os recursos visuais são mesclados, podem envolver ou mesmo entreter o público. Ao combinar o visual e a narrativa corretos com os dados corretos, você tem uma história de dados que pode influenciar e impulsionar a mudança. A empresa de consultoria Gartner prevê que até 2025, data storytelling será a forma mais difundida de consumir análise de dados.
-
Na tradução livre, seria algo como "pensar como um designer". Designers tentam entender o desafio primeiro antes de chegar a uma solução. É uma abordagem ou conjunto de técnicas e ferramentas aliados ao modo de ver o mundo com o objetivo de elaborar soluções para problemas complexos com foco no ser humano. Geralmente, consiste em quatro etapas que não são necessariamente lineares: imersão, análise, ideação e prototipagem, e fases de divergência e convergência (também chamado de diamante duplo).
Princípios e ferramentas para visualização de dados educacionais
Stephen Few elencou oito princípios-chave, para uma boa visualização de dados. São eles:
1. Simplifique: uma boa visualização de dados captura a essência dos dados, sem deixar muito superficial.
2. Compare: as visualizações nos ajudam a fazer análises e, portanto, as comparações são relevantes – em especial se forem visuais e se pudermos vê-las lado a lado.
3. Chame a atenção: a visualização deve facilitar o acesso aos dados que são realmente importantes. Nossos cérebros são facilmente encorajados a prestar atenção a detalhes – relevantes e também os irrelevantes.
4. Explore: as ferramentas de visualização de dados devem permitir tanto uma análise dirigida como também uma análise exploratória.
5. Tenha diversos pontos de vista: diferentes visões dos mesmos dados fornecem diferentes percepções.
6. Pergunte por quê :mais do que saber "o que está acontecendo", precisamos saber "por que está acontecendo". É daí que vêm os dados que podem ser transformados em resultados e ações.
7. Seja cético: raramente questionamos as respostas que obtemos dos dados. É importante termos uma ferramenta que permita explorarmos os dados mais a fundo.
8. Compartilhe suas respostas: simplesmente responder às perguntas para você mesmo tem benefícios limitados. É a capacidade de compartilhar nossos dados que leva benefícios em escala global.
Para Julie Steele , editora da O'Reilly Media e autora de diversos livros sobre ciência de dados, três elementos devem estar sempre presentes na elaboração de uma visualização: o designer – o que ele quer dizer e comunicar; o leitor – que é diferente do designer e tem seus próprios vieses e interpretações; e os dados – o que dizem e como informam a verdade.
Saber interpretar – e se possível elaborar – análises de dados visuais tornou-se uma habilidade extremamente relevante no século XXI e hoje existem diversos softwares que tornaram esse processo mais simplificado e a compreensão dos símbolos, convenções e a gramática dos gráficos mais clara. De acordo com Danilo Vasconcelos, professor da disciplina de Visualização de Dados do Web Intelligence and Digital Ambience (WIDA) – MBA em Big Data Estratégico do CRIE as ferramentas de visualização possuem atualmente módulos de preparação dos dados de forma automatizada e funcionam no modelo self-service. Isso significa que um professor ou diretor que sabe o problema que quer investigar – como por exemplo absenteísmo – pode escolher as características que quer analisar e comparar, como renda ou localização, de maneira muito mais facilitada do que antes, quando era necessário fazer tudo manualmente.
Em alguns casos, as próprias ferramentas possuem dados abertos para análise ou permitem o upload de arquivos. Além disso, elas apresentam qual a melhor forma de visualização e possibilitam que se compartilhe ou torne públicos os gráficos, como num painel interativo para tomada de decisão. Há ainda sugestões de insights automáticos. "Por exemplo, antes, se eu cruzasse as notas dos alunos em uma determinada disciplina com a outra e quisesse criar um cluster de bons alunos, um de alunos que eu tenho que reforçar mais a leitura, outro que eu tenho que reforçar mais a escrita, eu tinha que fazer um código na minha cabeça. Agora, as ferramentas já estão fazendo isso automaticamente, elas pegam os dados e criam o que chamamos de grupos ou clusters", afirma.
O professor explica que existem dois tipos de análises de dados: a exploratória e a explanatória. "Normalmente, a exploratória acontece quando se tem uma tese ou hipótese, a pessoa vai checar e faz uns gráficos, que podem vir a confirmar a tese ou não. E aí você vai pensar na história que quer contar e então vai para a explanatória, que é o que você quer dar foco, como por exemplo, um determinado perfil de aluno que se forma, mas não consegue emprego. A explanatória busca explicar um fato que você descobriu na exploratória", detalha.
Vasconcelos dá algumas dicas de softwares - reforçando que muitos têm licenças para educadores, assim como tutoriais e treinamentos para usá-los – e de comunidades de compartilhamento de informações sobre esses softwares. Alguns, inclusive, têm os chamados data hubs ou centrais de dados, que reúnem dados confiáveis, já tratados. Segundo ele, mais de 60% do tempo é investido no preparo dos dados, o que pode acabar sendo um empecilho para usar dados. Confira a seleção de softwares – e seus respectivos treinamentos e comunidades - feita por Vasconcelos, que também recomenda as linguagens Python e SQL.
1. Tableau: plataforma de análise visual de dados. | Treinamentos da Tableau: vídeos gratuitos que ensinam como usar o software Tableau. | Comunidade da Tableau: espaço para troca de conhecimento, dúvidas, soluções, etc. | Análise da Educação da Tableau: ferramentas de análise do setor de educação.
2. Microsoft Power BI: plataforma para BI (business intelligence) corporativo e por self-service, que colabora para se obter insights mais aprofundados sobre os dados. | Treinamentos do Microsoft Power BI: canal de treinamento do Microsoft Power BI. | Comunidade da Microsoft Power BI: espaço para troca de conhecimento, dúvidas, soluções, etc.
3. SPSS da IBM: plataforma de software que oferece análise estatística, biblioteca de algoritmos de machine learning, análise de texto, extensibilidade de software livre, integração com big data e implementação dentro dos aplicativos. | IBM SPSS Statistics GradPack e Faculty Pack: software de análise preditiva para estudantes, professores e investigadores. | Comunidade do IBM Analytics: espaço para troca de conhecimento, dúvidas, soluções, etc.
4. Qlick Sense: ferramenta que permite a criação de modelos e painéis self-service para visualização e análise de dados. | Comunidade da Qlick: espaço para troca de conhecimento, dúvidas, soluções, etc.
5. SAS Visual Analytics: ferramenta que possibilita a obtenção de insights analíticos que ajudam a identificar novos padrões, tendências e relacionamentos dos dados. | Treinamentos da SAS: cursos online, alguns gratuitos ou com desconto para profissionais da educação. | Comunidade da SAS Visual Analytics: espaço para troca de conhecimento, dúvidas, soluções, etc.
6. IBM Cognos Analytics: plataforma de business intelligence desenvolvida com IA que suporta todo o ciclo de análise, da descoberta à operacionalização dos dados. | Knowledge Center do IBM Cognos Analytics: documentação técnica e suporte do IBM Cognos Analytics. | Comunidade do IBM Cognos Analytics: espaço para troca de conhecimento, dúvidas, soluções, etc.
Acrescentamos à lista do professor Danilo Vasconcelos mais alguns softwares, sites e guias para auxiliar na decisão de que gráfico escolher, retirados do livro Fluxo de Trabalho com Dados, da Escola de Dados, de webinars do professor Alberto Cairo, e de nossa curadoria.
1. Gapminder: a Fundação Gapminder, mencionada anteriormente, apresenta uma série de ferramentas que permitem a animação de gráficos a partir de dados já disponíveis na plataforma.
2. Google Motion Charts: gráfico interativo gratuito disponível no Google Spreadsheet (uma planilha on-line semelhante ao Excel). Necessário conta gratuita do Google.
3. High Charts: biblioteca de software para gráficos escrita em JavaScript. Gratuita para uso pessoal e não comercial.
4. Flourish: permite a criação de gráficos interativos, que podem ser unidos em histórias.
5. Datawrapper: produz gráficos facilmente, com atualização em tempo real e edição colaborativa.
6. Raw Graphs: é baseado em D3 (JavaScript) e tem código aberto, recomendado para fazer gráficos pouco convencionais.
7. The Data Visualization Catalogue: projeto desenvolvido por Severino Ribecca para criar uma biblioteca (não baseada em código) de diferentes tipos de visualização. O site serve como um recurso de aprendizado e inspiração para quem trabalha com visualização de dados.
8. D3.js Data Driven Documents: D3.js é uma biblioteca javascript para a visualização de informação criada por Mike Bostock.
9. Draw my Data: ferramenta para ensinar estatística e ciência de dados.
10. Visual Vocabulary: guia com categorias de design com sugestões de uso de gráficos.
11. Visualization Universe: guia que mostra quais visualizações despertam mais interesse ao longo do tempo.
12. ChartMaker: lista que tipo de visualizações são suportadas em cada ferramenta.
13. ArcGIS Insights: software que une análise de localização com ciência de dados abertos e fluxos de trabalho da inteligência de negócios. | Treinamento do ArcGIS: plataforma de treinamento para o software. | Comunidade do ArcGIS: espaço para troca de conhecimento, dúvidas, soluções, etc.
Aplicações práticas para professores e profissionais da gestão educacional
Destacamos a seguir alguns casos e plataformas de dados educacionais, com diferentes visualizações e possibilidades de análises e comparações, que podem ajudar (ou inspirar) professores e escolas no planejamento de ações para uma melhoria contínua do ensino a partir de dados e evidências.
a. Teachers Supporting Teachers (TST): uma parceria dessa organização americana, que tem a missão de mobilizar e apoiar líderes em educação para ter um impacto duradouro em suas escolas, com a empresa de tecnologia Narrative Science ajudou a lidar com o seguinte desafio: os professores estavam deixando as escolas nas áreas urbanas por falta de oportunidades significativas de liderança, o que afetava o desempenho dos alunos e custava US$ 7 bilhões ao ano aos cofres públicos. Em torno de 50% dos professores nos EUA deixam as escolas nos cinco primeiros anos de trabalho. Primeiramente, a Narrative Science reuniu-se com Pallavi Abraham, diretor-executivo da TST, para entender as métricas, o processo de tomada de decisão e como os dados são geralmente coletados, analisados e comunicados. Os dados evidenciaram que a retenção de professores nas escolas públicas de Chicago era maior em locais que tinham "equipes" de professores com um líder com a missão de fazer com que os professores optassem pela continuidade das aulas nas áreas urbanas.
Duas vezes ao ano, os professores respondem às pesquisas com base em cinco fundamentos essenciais (ambiente de apoio, ensino arrojado, famílias envolvidas, líderes efetivos e professores colaborativos). Os resultados alimentam um framework de melhorias desenvolvido pelo Instituto de Educação Urbana da Universidade de Chicago, em parceria com as Escolas Públicas de Chicago. Pesquisas anteriores mostraram que escolas fortes em pelo menos três dos cinco fundamentos essenciais têm 10 vezes mais probabilidade de melhorar o aprendizado dos alunos do que escolas fracas em três ou mais dos cinco fundamentos. A TST baseia-se nas pontuações gerais para medir o desempenho escolar em cada uma das cinco áreas e usa o Tableau para visualizar os dados da pesquisa. Adicionalmente realiza um processo manual para compilar os relatórios individuais enviados pelos líderes das equipes de professores. Com a parceria com a Narrative Science, foi adotado o software Quill for Tableau para transformar automaticamente dados e dashboards em histórias e narrativas (data storytelling). Além disso, a coleta de dados foi automatizada com uso de Python, economizando horas valiosas. Por fim, foram criadas novas visualizações para destacar as métricas mais importantes e comparações para benchmarking, assim como foram aplicados novos métodos de personalização de layouts de painel para agilizar os relatórios por equipe. Como resultado, a TST está mais preparada para tomar decisões e subsidiar seus líderes para identificar tendências e engajar os professores possibilitando mudanças viáveis para os alunos.
b. Qedu Gestão: ferramenta customizável para apoio à gestão e uma plataforma de disseminação de dados e evidências lançada em maio de 2021 pelo Interdisciplinaridade e Evidências no Debate Educacional (Iede) e a Fundação Lemann com apoio do Instituto de Estudos Avançados da USP de Ribeirão Preto (IEA-RP/USP), do Itaú Educação e Trabalho, e a B3 Social. Gestores educacionais podem inserir, visualizar de forma amigável e analisar indicadores de seu interesse. Podem ainda utilizar indicadores disponibilizados na ferramenta, como distorção idade-série, abandono escolar, evasão, clima escolar, aprendizado, perfil docente, contexto escolar, infraestrutura, entre outros pertencentes a bases de dados externas como como Censo Escolar e Sistema de Avaliação da Educação Básica (Saeb). Avaliações e questionários próprios podem ser incorporados à ferramenta. As informações ficam centralizadas em um só local, permitindo análises e comparações. Além disso, existem diversos filtros para facilitar a visualização. Esses dados podem subsidiar tomadas de decisão relacionadas a políticas públicas em educação, que impactem, principalmente, a aprendizagem dos estudantes. Seu uso é gratuito mediante preenchimento de formulário para criação de login e senha e para optar por deixar os dados públicos ou privados.
c. Plataforma de Dados Educacionais: desenvolvida pelo Laboratório de Dados Educacionais (LDE) , com dados da Educação Básica e do Ensino Superior em série histórica, com diferentes níveis de desagregação, tais como número de matrículas, de escolas, de docentes, de população fora da escola, taxa de atendimento, taxa de matrícula, etc. O LDE organiza-se de forma interinstitucional com professores, técnicos e discentes da Universidade Federal do Paraná (UFPR) e da Universidade Federal de Goiás (UFG). É responsável por outras duas plataformas: o Simulador de Custo-Aluno Qualidade (SimCAQ), que estima o custo da oferta de ensino em condições de qualidade nas escolas públicas de educação básica, ou seja, o Custo-Aluno Qualidade (CAQ) e atualmente encontra-se em manutenção; e o Painel de Indicadores, que está em construção.
d. Trajetórias de Sucesso Escolar: iniciativa do UNICEF, o site disponibiliza indicadores de fluxo escolar nacionais, estaduais, municipais e por escola retirados do Censo Escolar. Além das taxas de distorção e índices de abandono e reprovação, o site disponibiliza recortes por gênero, raça e localidade que mostram as relações entre o atraso escolar e as desigualdades brasileiras.
e. Índice de Oportunidades da Educação Brasileira - IOEB: com informações referentes à qualidade da oferta para alunos que frequentam as redes públicas e privadas, incluindo informações das crianças e jovens que não frequentam a escola. Na aba "dados e análise", é possível fazer análises por municípios (verificando a posição atual do município em relação à média do estado, à média nacional e à série histórica do IOEB do município em relação a do estado e a nacional, ou ainda análise comparativas entre municípios) ou estados (verificando a posição atual do estado em relação à média nacional e à série histórica do IOEB do estado em relação à média nacional).
f. Indicador de Desigualdades e Aprendizagens - IDeA: apresenta o nível de aprendizagem e, ao mesmo tempo, a desigualdade de aprendizagem entre grupos sociais, definidos por nível socioeconômico, raça ou gênero para cada município brasileiro. É possível gerar gráficos por municípios de nível de aprendizagem em português e matemática e desigualdades por raça, gênero e nível socioeconômico, e série (5º e 9º anos do Ensino Fundamental).
g. Educação em Números: é uma seção do Observatório da Educação, do Instituto Unibanco, que reúne indicadores educacionais, sociais e demográficos de diversas fontes, como Índice de Desenvolvimento da Educação Básica (Ideb) e Inep, apresentados de maneira visual. Por meio de uma ferramenta de busca e roteiros temáticos é possível navegar facilmente por análises integradas dos desafios da rede de ensino, tais como desempenho dos alunos, desigualdade de raça e gênero, educação inclusiva e abandono e evasão escolar. Também é possível usar filtros para cada análise, orientando as visualizações, e realizar comparações, que podem ser exportadas em vários formatos. Ao selecionar local, indicador e ano, por exemplo, os usuários têm acesso a gráficos, tabelas e mapas que apoiam análises e reflexões. As análises integradas trazem ainda roteiros para guiar o leitor em uma análise orientada, com a estrutura baseada em temas e situações-problema com breves explicações conceituais sobre os indicadores educacionais selecionados e caminhos onde o leitor encontrará os indicadores apontados. O objetivo dos roteiros é fazer com que a cultura de análise de dados seja despertada e que o profissional da educação consiga utilizá-la em seu dia a dia, por meio da realização de diagnósticos educacionais. Confira mais no vídeo abaixo.
Conhecimentos para identificar boas representações visuais para análise de dados
Alguns mitos sobre a visualização de dados elencados por Alberto Cairo, jornalista, designer e diretor do programa de visualização no Centro de Ciência da Computação da Universidade de Miami, nos Estados Unidos, nos ajudam a refletir sobre o uso ético da representação visual de dados e sobre a desinformação. São eles:
a) "uma imagem vale mais do que mil palavras",
b) "visualizações são intuitivas",
c) "dados falam por si só", e
d) "mostre, não fale".
Para ele, gráficos não são meras ilustrações ou fotografias. Assim como textos, devem ser lidos e interpretados, não apenas o seu conteúdo e o que dá apoio a ele (como títulos, legendas, fontes, anotações, etc.), como também o modo como os dados estão representados. Ao elaborarmos as visualizações, não devemos ter medo da redundância, devemos "mostrar e falar", considerando que uma imagem só vale mais do que mil palavras se soubermos ler as representações, que as visualizações não são intuitivas e que os dados não falam por si só. Como consumidores dessas visualizações, devemos desenvolver nossas habilidades para ler e interpretar as representações visuais - a chamada "graficacia", termo cunhado pelo geógrafo William G. V. Balchin nos anos de 1950 para se referir ao letramento em gráficos e usado em muitas publicações desde então.
Em seu mais recente livro, How Charts Lie: Getting Smarter about Visual Information (Como os gráficos mentem: ficando mais esperto sobre informação visual, na tradução livre), Cairo comenta sobre como os gráficos podem passar desinformação. Em entrevista exclusiva para este especial, ele elencou as seguintes recomendações para reconhecer bons gráficos, interpretá-los corretamente e usá-los para tomar decisões:
1. Preste muita atenção na leitura e interpretação: analise a camada de interpretação ou de anotações (termo usado para explicar a gramática e os símbolos usados nas visualizações); avalie se o gráfico está realmente medindo o que diz medir e se há falhas nos dados ou no modo como eles são representados; verifique se as fontes são confiáveis; avalie se não há argumentos enviesados; prefira visualizações mais simples do que ambíguas.
2. Tenha consciência de seus próprios vieses: costumamos identificar padrões e quando vemos padrões em gráficos que nos parecem significativos, tendemos a não questionar as visualizações. "Ao longo dos anos, lendo muito sobre vieses cognitivos e ciência da percepção, assim como media literacy ou alfabetização midiática (como aprender a ser crítico com a mídia), descobri que é muito mais fácil para uma pessoa descobrir os vieses cognitivos de outros antes dos seus. O que eu explico no How Charts Lie é que precisamos ter muito mais atenção para exemplos de vieses internos do que para os externos. É preciso fazer uma análise crítica dos próprios vieses cognitivos e ideológicos e tentar ajustar. Somos humanos e é impossível controlar todos os vieses, mas é possível controlar até certo nível", afirma. "Devemos sempre nos expor a opiniões de outras pessoas, que não necessariamente batem com nossas percepções. Fazer um exercício de mindfulness, olhar para dentro, como reagimos ao que vemos. O modelo tradicional para entendermos o cérebro humano vê o cérebro como um computador, que absorve inputs do mundo externo, processa as informações e cria opiniões e ideias. Na verdade, é o contrário. Primeiro criamos opiniões e procuramos dados e evidências que confirmam essas opiniões, é preciso estar atento a isso. Antes do ensinar pensamento crítico, temos que ensinar pensamento autocrítico."
3.Seja um agente transformador: quando estamos rodeados de fake news ou desinformação, é muito fácil perder a esperança, alega Cairo. "Se é um problema estrutural, as medidas devem ser coletivas. Antes de escrever How Charts Lie, fiz uma série de 50 palestras para testar o conteúdo do livro no mundo todo. Sei que mudei as cabeças de pessoas, uma a uma. Sei que algumas pessoas aprenderam a ler um tipo de visualização, que um mapa que pensavam ler corretamente não era lido do jeito certo, que aprenderam a ler gráficos de linhas, etc. Essa mudança é uma gota no oceano. Mas quando juntamos milhões de gotas, essas gotas viram o oceano. Então, quanto mais pessoas com conhecimento em pedagogia, em ensino, continuarem a trabalhar nessas áreas de dados, mais evangelização vamos fazer. Quem aprende pode virar educador também, criando um círculo virtuoso que pode levar a uma mudança social".
4. Adquira um conhecimento elementar sobre estatística - e inclua isso no currículo escolar: para Cairo, é impossível separar a interpretação correta de um gráfico estatístico do entendimento da própria estatística. Isso não quer dizer que toda pessoa tenha que virar um estatístico profissional, mas é importante desenvolver um pouco de conhecimento elementar básico de noções estatísticas simples – o que pode ser feito através da educação básica. "Não sei como é no Brasil, mas nos Estados Unidos [onde vive] e na Espanha [de onde é], por exemplo, o ensino estatístico não existe praticamente nas escolas primárias e secundárias. Existe apenas como disciplina optativa. O ensino de matemática e ciência inclui aritmética, trigonometria, cálculo, mas não inclui estatística. O que é um absurdo. A estatística é a combinação perfeita de lógica, epistemologia, pensamento científico e matemática. Devia ser prioritário. Estatística não é matemática. A matemática é um instrumento que pode ser usado na estatística. A estatística é um pensamento científico, racional, lógico, que pode ou não estar baseado no tratamento dos números. Só fui aprender estatística na faculdade", comenta. "Aprender estatística não é algo complexo. Precisamos entender o que é média, desvio padrão e desenvolver noções básicas de pensamento probabilístico. Não é preciso memorizar fórmulas, é algo mais conceitual, de entender para que servem. Isso deveria começar na escola. Em vez de ensinar as crianças como fazer cálculos matemáticos à mão, ensinar primeiro a aplicação prática. A visualização é essencial para isso, para representar o abstrato graficamente."
Confira a palestra de Alberto Cairo sobre como tomar boas decisões no design de visualização de dados (em português).
Confira as dicas de Alberto Cairo para ensinar estatística
O ensino de visualização de dados é muito parecido com o de ler e escrever, comenta Cairo. Primeiro, devem ser explicadas as noções básicas e então deve-se colocar as crianças para praticar. A visualização de dados está baseada em um sistema simbólico, que consiste na representação de dados através de objetos - símbolos, retângulos, triângulos, etc. - e numa gramática visual, que consiste na representação dessas quantidades através da variação de propriedade desses objetos. Por exemplo, um gráfico de barras é uma série de retângulos cuja altura ou comprimento varia em função do número que estão representando – isso é o que chamamos de encoding ou codificação visual. A transformação de propriedades de objetos em proporção às quantidades que eles estão representando – que é a gramática da visualização - pode ser ensinada. É aprender uma série de princípios, símbolos, como aplicar estes símbolos, a gramática, como se escolhe e através de prática.
Uma sugestão é começar sempre com exercícios simples. Um exemplo: veja as alturas de todas as crianças na sala e crie um histograma, que é uma espécie de gráfico de barras, representando a distribuição das alturas – quem é mais baixo, quem é mais alto. Mostre às crianças como calcular a média, para ver quem está acima e quem está abaixo. Isso introduz as crianças ao mundo da ciência de dados com estatística descritiva. Desenhe, para elas entenderem as realidades numérica e quantitativas. Depois, comece a fazer exercícios mais complexos, como análises com duas variáveis, correlacional, de regressão. Outro exemplo: faça a correlação entre consumo de sorvete e temperatura. Quanto maior a temperatura, mais consumo de sorvete. Uma correlação positiva. Para explicar as diferenças entre correlação e causalidade e como a correlação pode levar à causalidade (ou não).
Uma dica muito importante: procure exemplos e dados que sejam adaptados ao tipo de estudante que você tem. Ensinar para especialistas não é o mesmo que ensinar para adolescentes. Para adolescentes, eu pegaria, por exemplo, banco de dados sobre música rap. Existe um estudo que analisa a variedade de vocabulário nas canções de rappers nos Estados Unidos, para medir a riqueza do vocabulário. E você consegue medir num gráfico quais são os artistas que têm vocabulário mais amplo e mais pobre. O jeito de apresentar essa temática aos alunos não é mostrar os dados, é perguntar "quem você acha que tem o vocabulário mais rico?". Então, eles dão suas respostas e fazem um gráfico com os palpites. Depois, trabalha-se com os dados e os palpites são comparados com a realidade. Esse exercício é útil para ensinar a relevância de verificar os dados, checar as informações, confirmar as hipóteses. Isso ensina o método científico e desperta a curiosidade por meio da emoção e da proximidade com a realidade dos alunos.
Aprofunde seus conhecimentos sobre visualização de dados
Ao longo deste especial, apresentamos várias definições, conceitos e razões para utilizar a visualização de dados nas etapas de análises de dados educacionais e divulgação das mesmas. Se você quer adquirir um conhecimento ainda mais profundo sobre o tema para aplicá-lo em seu trabalho, deixamos abaixo uma série de referências importantes que estão disponíveis aqui no Observatório de Educação. Confira:
Fluxo de trabalho com dados: do zero à prática
Esta publicação da Escola de Dados e Open Knowledge Brasil é um guia prático destinado a profissionais e estudantes interessados em trabalhar com dados no campo da comunicação, em especial no jornalismo e na produção de conteúdo para organizações da sociedade civil. O guia é baseado no fluxo de trabalho com dados (data pipeline), uma metodologia desenvolvida pela rede da Escola de Dados internacionalmente, que aborda todas etapas do trabalho, da definição das questões à visualização dos dados.
Storytelling With Data: A Data Visualization Guide for Business Professionals [Contando histórias com dados: um guia de visualização de dados para profissionais de negócios, na tradução livre]
Escrito por Cole Nussbaumer Knaflic, o livro ensina os fundamentos da visualização de dados e como se comunicar de maneira eficaz com os dados, enfatizando o poder da narrativa. Em inglês.
The Functional Art [Arte funcional, na tradução livre]
Escrito pelo jornalista, designer e professor Alberto Cairo, o livro é uma introdução à visualização e gráficos de informação, a comunicação de fatos e dados por meio de gráficos, mapas e diagramas. Em inglês. Os três primeiros capítulos estão disponíveis para download gratuito.
Flowing data
Blog mantido por Nathan Yau, PhD em estatística pela UCLA e autor de livros sobre o tema, para explorar como usamos a analítica e a visualização para entender dados e a nós próprios. Em inglês.
Escola de Dados
Programa da Open Knowledge Brasil, é parte de uma rede global comprometida com o avanço do uso de dados para resolver problemas reais em prol de sociedades mais conscientes, sustentáveis e justas. Oferece cursos e conteúdo (webinars, tutoriais, ebooks) sobre a temática. Em português.
Tutorial "Introdução aos dados educacionais no Brasil"
Tutorial da Escola de Dados que revisa as principais fontes de dados educacionais brasileiras.
Onde encontrar dados educacionais da JEDUCA
Indicações da Associação dos Jornalistas de Educação - Jeduca de bases de dados que podem ajudar a encontrar informações sobre a educação brasileira.
Gostou? Veja mais
Big Data na Educação
Big Data refere-se geralmente a uma gigantesca quantidade de dados, gerados em uma velocidade vertiginosa, de diferentes origens e formatos (estruturados ou não). Mas se há tanto tempo temos...
Saiba maisAbre em uma nova guiaExplorando os Dados da Educação
essa transformação não ocorra de maneira democrática, a cada dia são gerados volumes astronômicos de dados sobre tudo que fazemos, gostamos, consumimos e temos interesse. Neste contexto, a ciência de dados ...
Saiba maisAbre em uma nova guia