library(zip)
Introdução
Na internet há muitos dados públicos que podem render boas análises.
Conforme o site do Inep,“O Índice de Desenvolvimento da Educação Básica (IDEB) foi criado em 2007 e reúne, em um só indicador, os resultados de dois conceitos igualmente importantes para a qualidade da educação: o fluxo escolar e as médias de desempenho nas avaliações.”
Estes indicadores são importantes para quem trabalha com educação. Os dados da edição 2021 do IDEB estão disponíveis aqui
Neste post vou mostrar o caminho para baixar diretamente do R o arquivo que contém os resultados do Ideb por escola dos anos iniciais do ensino fundamental regular.
Você pode usar esse passo a passo para baixar qualquer outro arquivo que queira analisar.
Pacotes utilizados
Inicialmente vamos utilizar o pacote Zip. Esse pacote lida melhor com caracteres especiais, que são comuns em português, do que a função nativa do R.
Para mais informações sobre esse pacote, clique aqui
Download do banco de dados
Na primeira linha do código estamos dizendo para o R que, se a pasta “./data” não existir, ele deve criá-la.
Em seguida, para o código ficar mais organizado, salvamos em dois objetos, “url” e “destfile”, as informações que devem ser fornecidas para a função download.file.
Assim, estamos dizendo para o R de qual link ele deve baixar o arquivo e em qual pasta ele deve salvá-lo.
Além disso, especificamos o modo como o arquivo deve ser escrito: “wb”. Este modo é adequado para windows, que é o sistema operacional que estamos usando.
Um pequeno truque para a definição do destfile: usamos a função basename para extrair o nome do arquivo do link e mandamos o R colá-lo (paste) com nossa pasta de destino (“./data”) sepadados pela “/”.
if(!file.exists("./data")){dir.create("./data")}
<- "https://download.inep.gov.br/educacao_basica/portal_ideb/planilhas_para_download/2021/divulgacao_anos_iniciais_escolas_2021.zip"
url
<- paste("./data",basename(url), sep = "/")
destfile
download.file(url = url,
destfile = destfile,
mode = "wb")
Descompactando o arquivo
Agora que o arquivo está em nosso computador, vamos descompactá-lo.
Na função unzip estamos utilizando três argumentos: “zipfile”, que indica o arquivo que queremos descompactar, “exdir”, que aponta a pasta onde o arquivo descompactado deve ficar, e “overwrite”, que está sinalizado como verdadeiro (T), de modo que ele vai sobrescrever arquivos existentes com o mesmo nome.
unzip(zipfile = "./data/divulgacao_anos_iniciais_escolas_2021.zip",
exdir = "./data",
overwrite = T)
Conclusões
Neste post aprendemos usar o R para baixar arquivos diretamente da internet e a descompactar arquivos zipados.
Se estiver precisando de ajuda para analisar dados quantitativos ou outras atividades acadêmicas, você pode contatar a Beta Consultoria e Assessoria através do e-mail beta.consultac@gmail.com