Baixar e Descompactar Arquivos no R

Tutoriais de R
Autora

Esthela Sá

Data de Publicação

29 de março de 2023

Introdução

Na internet há muitos dados públicos que podem render boas análises.

Conforme o site do Inep,“O Índice de Desenvolvimento da Educação Básica (IDEB) foi criado em 2007 e reúne, em um só indicador, os resultados de dois conceitos igualmente importantes para a qualidade da educação: o fluxo escolar e as médias de desempenho nas avaliações.”

Estes indicadores são importantes para quem trabalha com educação. Os dados da edição 2021 do IDEB estão disponíveis aqui

Neste post vou mostrar o caminho para baixar diretamente do R o arquivo que contém os resultados do Ideb por escola dos anos iniciais do ensino fundamental regular.

Você pode usar esse passo a passo para baixar qualquer outro arquivo que queira analisar.

Pacotes utilizados

Inicialmente vamos utilizar o pacote Zip. Esse pacote lida melhor com caracteres especiais, que são comuns em português, do que a função nativa do R.

Para mais informações sobre esse pacote, clique aqui

library(zip)

Download do banco de dados

Na primeira linha do código estamos dizendo para o R que, se a pasta “./data” não existir, ele deve criá-la.

Em seguida, para o código ficar mais organizado, salvamos em dois objetos, “url” e “destfile”, as informações que devem ser fornecidas para a função download.file.

Assim, estamos dizendo para o R de qual link ele deve baixar o arquivo e em qual pasta ele deve salvá-lo.

Além disso, especificamos o modo como o arquivo deve ser escrito: “wb”. Este modo é adequado para windows, que é o sistema operacional que estamos usando.

Um pequeno truque para a definição do destfile: usamos a função basename para extrair o nome do arquivo do link e mandamos o R colá-lo (paste) com nossa pasta de destino (“./data”) sepadados pela “/”.

if(!file.exists("./data")){dir.create("./data")}

url <- "https://download.inep.gov.br/educacao_basica/portal_ideb/planilhas_para_download/2021/divulgacao_anos_iniciais_escolas_2021.zip"

destfile <- paste("./data",basename(url), sep = "/")

download.file(url = url,
              destfile = destfile,
              mode = "wb")

Descompactando o arquivo

Agora que o arquivo está em nosso computador, vamos descompactá-lo.

Na função unzip estamos utilizando três argumentos: “zipfile”, que indica o arquivo que queremos descompactar, “exdir”, que aponta a pasta onde o arquivo descompactado deve ficar, e “overwrite”, que está sinalizado como verdadeiro (T), de modo que ele vai sobrescrever arquivos existentes com o mesmo nome.

unzip(zipfile = "./data/divulgacao_anos_iniciais_escolas_2021.zip",
      exdir = "./data", 
      overwrite = T)

Conclusões

Neste post aprendemos usar o R para baixar arquivos diretamente da internet e a descompactar arquivos zipados.

Se estiver precisando de ajuda para analisar dados quantitativos ou outras atividades acadêmicas, você pode contatar a Beta Consultoria e Assessoria através do e-mail