Trabalhos de alunos do Bacharelado de Ciências da Computação investigaram bases públicas e mostram, entre outros aspectos, que as escolas de São Carlos possuem desempenho médio superior ao do estado de São Paulo
Entre 2005 e 2019, a concessão de bolsas para o ensino superior privado cresceu no país. Nos resultados do Exame Nacional do Ensino Médio (Enem), escolas privadas continuam apresentando desempenho superior às públicas e, em São Carlos, as melhores médias concentram-se em instituições particulares. Na infraestrutura escolar, o retrato também é desigual: Sul, Sudeste e Centro-Oeste registram índices mais elevados que Norte e Nordeste, enquanto escolas urbanas superam as rurais.
Esses foram alguns dos achados de três projetos desenvolvidos por alunos do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, no âmbito da disciplina Introdução à Ciência de Dados. Ministrada pela professora Roseli Aparecida Francelin Romero, a matéria forneceu ferramentas para que os alunos aplicassem métodos analíticos transformando grandes volumes de dados públicos em evidências concretas.
De acordo com Roseli, os trabalhos se debruçaram sobre os dados do Enem, do Programa Universidade para Todos (Prouni) e por indicadores relacionados à infraestrutura escolar do Instituto Nacional de Estudo e Pesquisas Educacionais (Inep). “A orientação era para que os alunos escolhessem um tema que dialogasse com desafios do país e, que eles buscassem assuntos em que pudessem se aprofundar, tentando descobrir o que ainda não foi dito ou explorado”, explica a docente.
Os trabalhos foram apresentados no evento Portas Abertas, realizado de 24 a 28 de novembro de 2025, no salão da biblioteca do ICMC. Na oportunidade, os alunos usaram cartazes e tiveram que traduzir conteúdos técnicos para um público formado, em grande parte, por estudantes do ensino médio. Para o estudante de Ciência de Dados, Matheus Paiva Angarola, a experiência foi enriquecedora. “A gente sai da teoria e percebe, de fato, como organizar, interpretar e questionar os dados faz diferença. É algo que pretendo levar para a minha trajetória profissional e que hoje já me sinto mais preparado para desenvolver de forma autônoma”, afirma.
Análise dos Microdados do Enem – Desenvolvido por Fernando Valentim Torres e João Gabriel Pieroli da Silva, o estudo analisou principalmente os microdados de 2024 do Enem, usando também as bases de 2022 e 2023 para comparações históricas. De acordo com os estudantes do curso Ciência da Computação, escolheram o tema por motivações pessoais e técnicas. “Eu ingressei na USP pelo Enem, mas nunca tinha até então desbravado essa base de dados, porque embora ela fosse pública, ela contém realmente muitos dados, que exigem dominar ferramentas de computação”, destaca João Gabriel.
Na análise, o grupo investigou hipóteses relacionadas a desigualdades regionais e à influência da escolaridade dos pais no desempenho dos participantes, além de observar a evolução do perfil demográfico dos inscritos ao longo do tempo. Segundo os estudantes, os resultados evidenciaram disparidades importantes, incluindo diferenças por região e por tipo de escola, se era pública ou privada, além de tendências associadas à escolaridade parental. “Não há diferença significativa entre a escolaridade do pai ou da mãe nesse impacto. A correlação é equivalente, ou seja, ter ensino superior por parte de qualquer um dos dois está relacionada a um aumento semelhante no desempenho do aluno”, explica João Gabriel.
Uma das surpresas, segundo os estudantes, foi constatar a predominância feminina entre os participantes do exame. “A maior parte dos inscritos no Enem é composta por mulheres, ano após ano, e essa participação só vem aumentando. Além disso, o número total de inscritos também cresce ao longo do tempo”, sinaliza Fernando.
Apesar de já esperarem por esses resultados, os alunos ficaram ainda mais impactados quando fizeram análises com dados de São Carlos. “A gente viu que entre as 10 escolas com o maior desempenho de São Carlos, todas eram particulares e estavam em um bairro um pouco mais nobre da cidade. Ou seja, elas estão restritas a um grupo muito pequeno da população”, afirma Fernando.
Por outro lado, as escolas de São Carlos, como um todo, possuem um desempenho médio superior ao do estado de São Paulo. O destaque foi a nota da redação, que na cidade foi cerca de 57 a 61 pontos maior do que a média estadual.
Análise de dados do Prouni: transparência e inclusão no acesso ao ensino superior – Neste projeto, os alunos Antônio Carlos de A. M. Neto e Matheus Paiva Angarola analisaram dados do programa, que concede bolsas de estudo integrais e parciais em instituições privadas, entre 2005 e 2019. A partir desse recorte, eles exploraram o perfil socioeconômico e demográfico dos beneficiários, a distribuição geográfica das bolsas e tendências de cursos e modalidades de ensino.
O estudo testou hipóteses sobre a evolução do programa e sua eficácia na inclusão social, incluindo a predominância do turno noturno, o peso de bolsas integrais e a representatividade racial entre os bolsistas. Os resultados apontam um crescimento não linear na oferta de bolsas e reforçam a concentração no ensino noturno, o que dialoga com a realidade de estudantes que conciliam trabalho e estudo.
Um dos achados que contrariou a expectativa inicial dos estudantes foi a hipótese de que os cursos da área da saúde concentrariam a maior parte das bolsas. “Imaginávamos que, por serem cursos muito concorridos, como Medicina, eles teriam a maior porcentagem de concessão. Mas os dados mostraram o contrário. Uma possível explicação é que, por serem cursos mais caros, acabam tendo menos bolsas ofertadas no geral”, afirma Antônio.
Por outro lado, cursos como Administração, Direito e Pedagogia aparecem na liderança do número de concessões.
O trabalho também destaca o caráter inclusivo do programa no recorte racial, indicando a presença significativa de estudantes pardos e pretos, ainda que permaneçam desafios para alcançar equivalência com a composição racial da população de baixa renda. “Descobrimos que o Prouni já previa políticas de inclusão desde sua criação, antes mesmo da implementação de cotas nas universidades públicas. Ainda assim, ao comparar os dados, percebemos que a participação de determinados grupos atendidos pelo programa ainda é ligeiramente inferior à proporção que esses grupos representam na população brasileira”, explica Matheus.
Os estudantes avaliam que a análise poderia ter sido ainda mais aprofundada caso a base de dados trouxesse informações mais detalhadas sobre a condição socioeconômica dos beneficiários. “Não sabemos até que ponto isso esbarra em questões de confidencialidade, mas, se houvesse dados mais completos sobre a situação financeira dos estudantes, seria possível fazer uma investigação ainda mais robusta”, comentam.
Segundo eles, houve a tentativa de cruzar o Prouni com outras bases públicas disponíveis, para ampliar o escopo da análise e identificar padrões mais consistentes, mas o processo se mostrou tecnicamente complexo e pouco viável dentro do tempo da disciplina. A base consultada disponibiliza informações como tipo de bolsa, curso, modalidade de ensino, sexo, data de nascimento e município do beneficiário, mas não inclui variáveis mais detalhadas que expliquem, por exemplo, os critérios socioeconômicos que fundamentaram a concessão da bolsa. “Com dados mais completos, seria possível propor análises mais profundas sobre os critérios e os impactos do programa”, avaliam.
Outro desafio identificado por Antônio e Matheus foi a ausência de dados mais recentes. A base pública do Prouni disponibiliza informações até 2019. “De lá para cá, ocorreram mudanças importantes no cenário econômico e social, inclusive durante a pandemia de covid-19. Trabalhar sem dados atualizados limita a análise e dificulta compreender o impacto dessas transformações”, avaliam.
Os estudantes relatam que buscaram explicações para a interrupção da divulgação, mas não encontraram justificativas oficiais.
Um estudo sobre a infraestrutura escolar no Brasil – De autoria de João Pedro Viguini Tolentino Taufner Correa e Pietra Gullo Salgado Chaves, o trabalho analisou microdados do Censo Escolar do Inep, buscando por fatores que moldam a qualidade estrutural das instituições de ensino no Brasil. Entre eles: diferenças regionais, contraste entre ambientes urbanos e rurais, tipo de escola, dentre outros fatores. Para quantificar o nível de infraestrutura, os estudantes criaram uma métrica, levando em conta atributos como: presença de biblioteca, laboratórios, quadra de esportes, acesso à internet, entre outros. A partir dessa métrica, foi possível identificar padrões e desigualdades que, isoladamente, ficariam dispersos em centenas de variáveis.
Segundo os estudantes, trabalhar com uma base dessa dimensão foi, por si só, um desafio. “Eu nunca tinha mexido com uma base de dados tão grande como a do Inep. Foi bem interessante, principalmente por termos que lidar com dados faltantes, incoerentes e até mesmo pensar na capacidade de processamento dos nossos computadores”, relata Pietra.
Os resultados revelaram diferenças marcantes entre as regiões com Sul, Sudeste e Centro-Oeste apresentando, em média, melhores índices de infraestrutura em comparação ao Norte e Nordeste. Também ficou evidente a distância entre escolas urbanas e rurais, com vantagem consistente para as instituições localizadas em centros urbanos.
Alguns achados surpreenderam os estudantes, ainda que refletissem desigualdades já conhecidas. “No fundo, os resultados acabam sendo um retrato da nossa sociedade. Às vezes é uma realidade chocante e triste pelas desigualdades fortes que ainda temos no país”, afirma Pietra.
Texto: Gabriele Maciel, da Fontes Comunicação Científica
Saiba mais
Veja como foi o evento Portas Abertas 2025: https://bit.ly/4rR97na
