operacao | sintaxe |
---|---|
Adição | + |
Subtração | - |
Multiplicação | * |
Divisão | / |
Potenciação | ^ ou ** |
Logaritmo Natural | log() |
Exponencial | exp() |
Valor absoluto | abs() |
Raíz Quadrada | sqrt() |
Resto de Divisão | %% |
Quociente | %/% |
Linguagem R: Um Tutorial Interativo
Um tutorial interativo sobre a linguagem R para iniciantes.
1 Introdução
Seja bem-vindo(a) a “Linguagem R: Um Tutorial Interativo”!
Este tutorial foi criado especialmente para estudantes e profissionais das áreas de administração, economia e contabilidade, que buscam aprimorar suas habilidades na análise e modelagem de dados com a linguagem R.
O que você encontrará neste tutorial?:
Uma introdução completa à linguagem R, incluindo Tipos e Estruturas de Dados. Técnicas para sumarização, visualização e modelagem de dados.
Você não precisará instalar nenhum software em seu computador! Por que utilizaremos WebR, que é uma versão da linguagem R compilada para navegadores, que possibilita a execução de código R no seu navegador, sem a necessidade de um servidor para executar o código.
Aplicações práticas da linguagem R em estudos de caso reais nas áreas de administração, economia e contabilidade.
Público-alvo:
Alunos do Mestrado Profissional em Administração e do Bacharelado em Administração do IFMG - Campus Formiga.
Estudantes e profissionais de administração, economia e contabilidade que desejam aprender a utilizar a linguagem R para a análise de dados.
Pré-requisitos:
- Acesso a um computador
- Acesso à internet
Esperamos que este tutorial seja uma ferramenta relevante para o seu aprendizado e desenvolvimento profissional.
2 Algumas dicas
Uma pergunta que nos é feita com frequência é “qual é a melhor forma de aprender R?”. Infelizmente, não temos uma resposta pronta para essa pergunta, pois, em geral, todos tendem a aprender R (ou qualquer outra linguagem) à sua maneira e no seu próprio ritmo.
Dito isso, aqui estão algumas coisas a ter em mente que podem ajudar:
Use R com frequência e regularmente - encontre qualquer desculpa para ativar o interpretador da linguagem R ou algum Ambiente de Desenvolvimento Integrado adequado para a linguagem R.
Aprender R não é um teste de memória. Uma das vantagens de uma linguagem como R é que você sempre terá seu código para se referir quando inevitavelmente esquecer como fazer algo.
Você não precisa saber tudo sobre R para usá-la de forma produtiva. Se você ficar preso, pesquise no Google, não é trapaça, e escrever uma boa consulta de pesquisa é uma habilidade muito importante. Apenas certifique-se de verificar cuidadosamente se o código que você encontra está fazendo o que você quer que ele faça.
Se você se encontrar olhando para o código por horas tentando descobrir por que não está funcionando, então faça uma pausa. Perdemos a conta do número de vezes que conseguimos identificar erros quase imediatamente depois de voltar de uma pequena pausa.
Em qualquer linguagem e em R, há muitas maneiras de resolver um problema específico. Se o seu código não se parece com o de outra pessoa, mas faz o que você quer que ele faça em um tempo razoável e de forma robusta, então não se preocupe com isso - trabalho feito.
Relacionado ao ponto anterior, lembre-se de que R é apenas uma ferramenta para ajudá-lo a responder às suas perguntas interessantes. Embora possa ser divertido mergulhar em uma linguagem, não perca de vista o que é importante - sua(s) pergunta(s) de pesquisa e seus dados. Nenhuma quantidade de habilidade usando R ajudará se sua pergunta for vaga e os dados forem de baixa qualidade.
Aceite que haverá momentos em que as coisas ficarão um pouco difíceis ou frustrantes, isso acontece com todos nós. Tente aceitar esses períodos como parte do processo natural de aprender uma nova habilidade, lembre-se de que o tempo e a energia que você investir agora serão mais do que pagos em um futuro não muito distante.
3 A Linguagem R
Conforme Venables, Smith e R Core Team (2023), a linguagem R pode ser considerada uma implementação da linguagem S, que foi desenvolvida nos Laboratórios Bell por Rick Becker, John Chambers e Allan Wilks, e que também serviu como base para os sistemas S-PLUS.
A linguagem S foi iniciada em 1976 como uma linguagem para análise estatística originalmente implementada como um conjunto de bibliotecas Fortran. O objetivo da linguagem S, conforme expresso por John Chambers, era “traduzir ideias em software, de forma rápida e fiel”.
A evolução da linguagem S é caracterizada por três livros de John Chambers e coautores. Para R, a referência básica é Becker, Chambers e Wilks (1988). As novas características da versão de 1991 da linguagem S são abordadas em Chambers e Hastie (1992). Os métodos e classes formais do pacote methods são baseados em Chambers (1998).
R é uma linguagem de programação para computação estatística e visualização de dados, sendo adotada em diversas áreas do conhecimento e na indústria. A linguagem principal é aumentada por um grande número de pacotes, os quais contém, em geral, código reutilizável, documentação e dados.
A linguagem R é de código aberto e livre. É licenciada pelo Projeto GNU e disponível sob a General Public Licnce (GPL). A linguagem é escrita principalmente em C, Fortran e R. Existem executáveis pré-compilados para vários sistemas operacionais.
A sessão de informações a seguir contém um breve histórico do desenvolvimento das linguagens S e R, clique na caixa para que o conteúdo seja expandido.
1976: A linguagem S é iniciada nos Laboratórios Bell por Rick Becker, John Chambers e Allan Wilks como uma linguagem para análise estatística originalmente implementada como um conjunto de bibliotecas Fortran.
1988: a linguagem S é reescrita em C e começa a se parecer com o sistema atual (S3).
1991: A linguagem R é iniciada pelos professores Ross Ihaka e Robert Gentleman como uma linguagem de programação para ensinar estatística introdutória na Universidade de Auckland, Nova Zelândia. A linguagem foi inspirada na linguagem S, com a maioria dos programas S capazes de ser executadas inalteradas em R. A linguagem também foi inspirada no escopo léxico da linguagem Scheme, permitindo variáveis locais.
1993: Primeiro anúnico da linguagem R ao Público.
1995: Martin Machler convence Ross e Robert a usarem a licença GNU para tornar R um software Livre.
1997: The R Core Group é criado. Este grupo controla o código fonte da linguagem.
1998: A versão 4 (S4) da linguagem S foi lançada, esta é a versão que usada atualmente hoje. John Chambers recebe o Association for Computing Machinery’s Software System Award pela linguagem S.
2000: A versão R 1.0.0 é lançada.
2024: R version 4.4.1 é lançada.
5 Objetos
Para entender os cálculos em R, dois slogans são úteis: 1) Tudo o que existe é um objeto e 2) Tudo o que acontece é uma chamada de função. — John Chambers (tradução livre).
No coração de quase tudo o que você fará (ou provavelmente fará) em R está o conceito de que tudo na linguagem R é um objeto. Isso não significa que estamos fazendo programação orientada a objetos (POO) sobre a qual você pode ter ouvido falar, um paradigma de programação associado a algunas linguagems, como C++. Objetos R não são como objetos C++.
Esses objetos podem ser quase qualquer coisa, desde um único número ou sequência de caracteres (como uma palavra) até estruturas muito complexas, como o resultado de um gráfico, um resumo de sua análise estatística ou um conjunto de comandos R que executam uma tarefa específica.
Entender como você cria objetos e atribui valores a objetos é uma das chaves para entender a linguagem.
5.1 Criando objetos
Para criar um objeto, simplesmente damos um nome ao objeto. Podemos então atribuir um valor a este objeto usando o operador de atribuição <-
.
O operador de atribuição é um símbolo composto composto por um símbolo ’menor que <
e um hífen -
.
No código acima, criamos um objeto chamado meu_obj
e atribuímos a ele o número 48 usando o operador de atribuição. Ao executar o código acima, nenhuma informação é exibida, pois apenas foi feita uma atribuição, caso houvesse um erro seria exibida uma mensagem de erro.
Você provavelmente descobrirá que que ambos os operadores <-
e =
, são usados para atribuir valores a variáveis, e isso tende a causar alguma confusão.
Tecnicamente, R irá aceitar qualquer um deles ao atribuir variáveis, entretanto, isso é considerado uma má prática e nós o desencorajamos a usar =
como um operador de atribuição. Podem ocorrer problemas com =
no uso de algumas funções em alguns contextos.
Ambientes de Desenvolvimento integrado, como o RStudio, oferecem atalhos para a inserção de <-
. No RStudio, para inserir <-
, basta clicar em Alt e -, em sequência.
Para visualizar o valor do objeto, basta digitar o nome do objeto e executá-lo. Em Windows/Linux, aperte Enter, para MacOs: aperte Return
Em nosso caso, clique em Run Code em uma janela de comando contendo o nome do objeto:
Outras possibilidades para visualizar o conteúdo de um objeto são, usar a função print:
Ou, envolver a expressão que criou o objeto com parênteses:
Podemos utilizar a função ls()
(de list) para listar os nomes dos objetos ativos no ambiente atual:
Existem muitos tipos diferentes de valores que você pode atribuir a um objeto. Por exemplo:
Criamos um objeto chamado meu_obj2
e atribuímos a ele o texto "R é legal"
, que é uma string de caracteres. Observe que envolvemos o texto entre aspas. Se você esquecer de usar as aspas, receberá uma mensagem de erro:
Nosso workspace
agora contém os dois objetos que criamos até agora:
Para alterar o valor de um objeto existente, simplesmente atribuímos um novo valor a ele. Por exemplo, para alterar o valor de meu_obj2
de “R é legal” para o número 1024
fazemos:
Depois de criarmos alguns objetos, podemos fazer coisas com nossos objetos. Por exemplo, o código a seguir cria um novo objeto meu_obj3 e atribui a ele o valor de meu_obj adicionado a meu_obj2, que é 1072 (48 + 1024 = 1072):
Observe que, para exibir o valor de meu_obj3
, também precisamos escrever o nome do objeto.
O código acima funciona porque os valores de meu_obj
e meu_obj2
são numéricos (ou seja, números). Se você tentar fazer isso com objetos com valores de caracteres, receberá uma erro:
A mensagem de erro está essencialmente dizendo que um ou ambos os objetos, x
e/ou y
, não é um número e, portanto, não pode ser somado.
Quando você começa a aprender R, lidar com Error (mensagens de erro) e warnings
(avisos) pode ser frustrante, pois muitas vezes são difíceis de entender: o que é um argumento? O que é um operador binário?.
Uma maneira de descobrir mais informações sobre um erro específico é pesquisar no Google uma versão generalizada da mensagem de erro. Para o erro acima, tente pesquisar no Google non-numeric argument to binary operator erro + R
ou commom r error messages
.
Outra mensagem de erro que você receberá bastante quando começar a usar R pela é:
: object 'XXX' not found. Error
Por exemplo, dê uma olhada no código abaixo:
R retorna uma mensagem de erro porque ainda não criamos (definimos) o objeto no_obj
. Outra pista de que há um problema com este código é que, se você verificar seu ambiente, verá que o objeto my_obj4 não foi criado:
Podemos apagar os objetos criados anteriormente na sessão usando a função rm()
(de remove):
Ao apagar um objeto, não será mais possível efetuar operações com o mesmo. Para isso, será necssário criar novamente o objeto. Vejamos se os objetos foram apagados:
O resultado character(0)
indica que não há nenhum objetivo ativo na sessão.
R é uma linguagem de programação com tipagem dinâmica (dynamic typing), ou fracamente tipada (weakly typed). Isso significa duas coisas basicamente:
Ao contrário de C e C++, você não precisa “declarar” o tipo de objeto que está sendo criado ou utilizado.
Não é necessário compilar código R como em C e C++. Você pode simplesmente digitar R e ver o que acontece.
Isso torna a linguagem R infinitamente mais fácil de programar do que em C/C++. A principal desvantagem dessa facilidade é a velocidade de execução do código, o que pode ser imperceptível em muitos casos. Ainda assim, R é uma linguagem muito poderosa e pode ser facilmente estendida e combinada com códigos escritos em C/C++, Java, Fortran, Python entre outras.
5.2 Nomeando objetos
Nomear seus objetos é uma das coisas mais difíceis que você fará em R, estamos falando sério. Idealmente, seus nomes de objetos devem ser curtos e informativos, o que nem sempre é fácil.
Se você precisar criar objetos com várias palavras em seu nome, use um sublinhado ou um ponto entre as palavras ou capitalize as diferentes palavras (estilo chamado camel case). Nós preferimos usar o estilo camel case neste tutorial.
Recomendamos a leitura das dicas para nomear objetos contidas na seção de dicas a seguir. Clique na caixa para expandir seu conteúdo.
1. Descritivo e informativo:
- Use nomes que descrevam claramente o conteúdo do objeto.
- Evite abreviações e termos técnicos obscuros.
- Exemplos:
dados_clientes
modelo_regressao_linear
media_salarial_por_genero
-2. Consistente e conciso:
- Use um padrão de nomenclatura consistente para objetos relacionados.
- Evite nomes muito longos ou redundantes.
- Exemplos:
df_clientes
,df_vendas
,df_produtos
media_idade
,mediana_idade
,desvio_padrao_idade
3. Legível e Fácil de lembrar:
- Use nomes que sejam fáceis de ler e lembrar.
- Evite caracteres especiais e símbolos.
- Exemplos:
lista_compras
matriz_covariância
funcao_calcula_media
5.3 Maus exemplos de nomes de objetos em R:
Nomes muito curtos ou genéricos:
x
,y
,data
,df
.Nomes com abreviações ou termos técnicos obscuros:
reg_lin
,coef_est
,rmse
Nomes inconsistentes:
clientes_df
,vendas_data
,produtos_dataFrame
Nomes ilegíveis ou com caracteres especiais:
$#dados
,média_idade_2023
,função_complexa
Dicas para escolher bons nomes de objetos:
- Pense no que o objeto representa e como ele será usado.
- Use um nome que seja informativo e descritivo.
- Seja consistente no uso de um estilo, recomendamos o
snake_case
ouCamelCase
. - Evite nomes muito longos, redundantes ou com caracteres especiais.
Lembre-se:
Bons nomes de objetos facilitam a leitura, o entendimento e a manutenção do seu código R.
Invista tempo na escolha de nomes adequados para seus objetos.
Recursos adicionais:
- Guia de estilo do R: https://style.tidyverse.org/
5.4 Exercícios
Vamos praticar a manipulação de objetos em R com alguns exercícios. As soluções estão disponibilizadas logo abaiso de cada exercício, mas tente efetivamente resolvê-los antes de ver as soluções.
Exercício 1
- Crie um objeto chamado
preco_produto
com valor 199.99 - Crie um objeto chamado
quantidade_vendida
com valor 45 - Calcule o valor total das vendas (preço × quantidade) e armazene em um objeto chamado
valor_total
- Liste todos os objetos criados usando a função apropriada
- Remova o objeto
quantidade_vendida
- Liste novamente os objetos para confirmar a remoção
Tente resolver esse exercíco na janela abaixo:
Exercício 2
- Crie um objeto chamado
nome_empresa
contendo o texto “Tech Solutions” - Crie um objeto chamado
receita_mensal
com valor 50000 - Tente somar os objetos
nome_empresa
ereceita_mensal
- Observe e explique o erro
- Altere o valor de
nome_empresa
para 75000 - Calcule a soma dos objetos novamente
Tente resolver esse exercíco na janela abaixo:
6 Operadores e Funções Matemáticas
Alguns dos principais operadores e funções matemáticas da linguagem R são descritos na Tabela 1.
Recomendamos fortemente que você estude a sessão de informações a seguir sbore o uso de funções em R, será importante para você entender o uso das funções matemáticas apresentadas nesta sessão. Clique na caixa a seguir para que o conteúdo seja expandido.
- Sintaxe básica:
Em R, a chamada de uma função é realizada através da sintaxe nome_da_funcao(argumentos)
.
- Exemplo:
log(10)
utiliza a funçãolog
para calcular o logaritmo natural de 10.
- Argumentos:
Funções em R podem ter argumentos, que são parâmetros fornecidos para realizar operações específicas.
Exemplos incluem x
em log(x)
ou x
em exp(x)
.
- Argumentos padrão:
Muitas funções têm argumentos padrão, permitindo que sejam omitidos se desejar utilizar os valores padrão.
Exemplo: round(3.1415, digits = 0)
pode ser simplificado para round(3.1415)
, pois o valor padrão do argumento digits
é definido como sendo zero.
É fundamental estudar a documentação da função utilizada para saber quais são seus argumentos e quais os argumentos contém valores padrão.
- Ajuda e documentação:
Para obter informações detalhadas sobre uma função, utilize ?nome_da_funcao
ou help(nome_da_funcao)
. Isso oferece descrições, exemplos e informações sobre cada argumento.
- Funções vetoriais:
Muitas funções em R são vetoriais, o que significa que podem operar em vetores sem a necessidade de loops.
Exemplo: sqrt(c(1, 4, 9))
calcula a raiz quadrada de cada elemento do vetor.
- Funções de ordem superior:
R suporta funções de ordem superior, permitindo a passagem de funções como argumentos para outras funções.
Exemplo: sapply(data, mean)
aplica a função mean
a cada coluna de um data frame.
Ao explorar funções internas em R, é crucial consultar a documentação associada para compreender completamente seus recursos. Experimentar com diferentes argumentos e entender o comportamento da função ajuda a utilizar eficazmente as poderosas funcionalidades disponíveis na linguagem.
Vejamos alguns exemplos:
- Adição:
- Subtração
- Multiplicação
- Divisão
- Potenciação
- Logaritmo Natural: use a função
log()
- Logaritmo na base 10: use a função
log10()
Na verdade pode-se calcular o logaritmo de um número em uma determinada base usando o argumento base
da função log
:
- Exponencial: use a função
exp()
- Raíz Quadrada: use a função
sqrt()
- Valor absoluto (ou módulo): use a função
abs()
- Arredondamento: use a função
round(x, digits = 0)
A função round
arredonda os valores em seu primeiro argumento (x
) para o número especificado de casas decimais:
Por padrão, o argumento digits = 0
- Resto da divisão
o operador %%
é usado para calcular o resto da divisão entre dois valores.
- Divisão Inteira
P operador %/%
é usado para realizar a divisão inteira entre dois valores. A divisão inteira é diferente da divisão normal (operador /
) porque o resultado é sempre um número inteiro, e a parte decimal é truncada:
6.1 Precedência de Operações Aritméticas
A linguagem R segue regras específicas de precedência de operações aritméticas para determinar a ordem em que as operações são avaliadas. A precedência refere-se à prioridade que cada operador tem em relação aos outros.
A seguir são descritas as principais regras de precedência na linguagem R, da mais alta para a mais baixa:
- Parênteses:
- As operações dentro de parênteses têm a mais alta prioridade.
- Quando parênteses são usados, as operações dentro deles são avaliadas primeiro.
- Potenciação:
- A potenciação tem a segunda maior prioridade.
- Por exemplo,
2^3
é avaliado antes de outras operações.
- Multiplicação e Divisão:
- Multiplicação e divisão têm a mesma prioridade e são avaliadas da esquerda para a direita. Veja dois exemplos:
No primeiro exemplo, a multiplicação é realizada antes da divisão, resultando em 1.5. No segundo exemplo, a divisão é realizada antes da multiplicação, resultando em 2.666667.
Adição e Subtração:
- Adição e subtração têm a menor prioridade entre as operações aritméticas e também são avaliadas da esquerda para a direita.
Ao usar expressões aritméticas em R, é importante entender essas regras de precedência para garantir que as operações sejam avaliadas na ordem desejada. Se necessário, o uso de parênteses pode ser empregado para explicitamente indicar a ordem de avaliação desejada.
Por exemplo:
Neste caso, a exponenciação (4^2
) será avaliada primeiro, seguida pela multiplicação (3 * 16
). Se a ordem desejada for diferente, parênteses podem ser usados para modificar a precedência:
Nesse caso, a adição (2 + 3
) é avaliada primeiro devido aos parênteses.
Antes de prosseguirmos com os exercícios, vamos conhecer duas funções úteis para exibir resultados:
- A função
print()
- Exibe o valor de um objeto na tela
- Sintaxe básica:
print(objeto)
Exemplo:
- A função
paste()
- Combina (concatena) textos e valores em uma única mensagem
- Sintaxe básica:
paste("texto", valor)
- O texto deve estar entre aspas
Exemplo:
Estas funções são muito úteis para criar mensagens informativas com os resultados dos nossos cálculos. Por exemplo:
6.2 Exercícios
Agora, vamos praticar. Novamente, as soluções estão disponibilizadas logo abaiso de cada exercício, mas tente efetivamente resolvê-los antes de ver as soluções.
Exercício 3: Cálculo de Juros Simples
Crie código R que calcule o montante final de um investimento de R$ 1000,00 aplicado por 6 meses a uma taxa de juros simples de 2% ao mês. Use a fórmula: M = P(1 + rt), sendo:
- M = o montante final
- P = o principal (valor inicial)
- r = a taxa de juros (em decimal)
- t = tempo
Tente resolver esse exercíco na janela abaixo:
Exercício 4: Desconto em Produtos
Uma loja está oferecendo 15% de desconto em todos os produtos. Calcule o preço final de um produto que custa R$ 450,00, considerando:
- O desconto de 15%
- Arredonde o resultado para 2 casas decimais
Tente resolver esse exercíco na janela abaixo:
Exercício 5: Taxa de Crescimento
Uma empresa teve um faturamento de R$ 100.000 no primeiro ano e R$ 150.000 no segundo ano. Calcule a taxa de crescimento percentual do faturamento usando a fórmula:
\text{taxa} = \Biggl(\frac{\text{valor final}}{\text{valor inicial}} - 1 \Biggr) \times 100
Tente resolver esse exercíco na janela abaixo:
7 Operações Financeiras Básicas
Esta seção apresenta algumas operações financeiras fundamentais implementadas em R, com foco em cálculos comumente utilizados em administração, economia e contabilidade.
7.1 Juros Simples
O regime de juros simples é aquele em que os juros de cada período são calculados sempre em função do capital inicial. A fórmula para o cálculo do montante com juros simples é:
M = P(1 + rt)
sendo:
- M = o montante final
- P = o principal (valor inicial)
- r = a taxa de juros (em decimal)
- t = tempo
Exemplo de implementação em R:
7.2 Juros Compostos
No regime de juros compostos, os juros gerados em cada período são incorporados ao capital para o cálculo dos juros do período seguinte. A fórmula para o cálculo do montante com juros compostos é:
M = P(1 + r)^t
Exemplo em R:
7.3 Valor Presente e Valor Futuro
O conceito de valor do dinheiro no tempo é fundamental em finanças. Podemos calcular:
Valor Futuro (VF) de um valor presente (VP):
VF = VP(1 + r)^t
Valor Presente (VP) de um valor futuro (VF):
VP = \frac{VF}{(1 + r)^t}
Exemplo em R:
7.4 Conversão de Taxas
Em finanças, frequentemente precisamos converter taxas entre diferentes períodos. Por exemplo, converter uma taxa anual para mensal ou vice-versa.
Para converter uma taxa efetiva anual para uma taxa efetiva mensal, podemos usar a seguinte fórmula:
(1 + r_m)^{12} = (1 + r_a)
sendo:
- r_m = a taxa mensal
- r_a = a taxa anual
Exemplo em R:
Ao trabalhar com cálculos financeiros em R, sempre verifique:
- Se as taxas estão na forma decimal (10% = 0.10)
- Se os períodos de tempo estão consistentes com as taxas
- Se os resultados fazem sentido economicamente
7.5 Exercícios Práticos
Exercício 6: Investimento com Juros Compostos
Calcule o montante final de um investimento de R$ 5000,00 aplicado por 3 anos a uma taxa de 12% ao ano no regime de j uros compostos.
Exercício 7: Valor Presente
Uma empresa precisa ter R$ 100.000 daqui a 2 anos. Considerando uma taxa de juros de 8% ao ano, quanto precisa ser investido hoje?
8 Estruturas de Dados em R
Na linguagem R, existem diferentes formas de organizar dados. Neste tutorial, focaremos nas estruturas mais utilizadas na análise de dados moderna com R, especialmente aquelas que se integram bem com o ecossistema tidyverse
.
8.1 Vetores
Vetores são a estrutura mais básica em R - são sequências de valores do mesmo tipo. Por exemplo:
8.2 Data Frames e Tibbles
O data frame é a estrutura mais importante para análise de dados em R. É uma tabela onde:
- Cada coluna representa uma variável
- Cada linha representa uma observação
- Cada coluna deve ter o mesmo número de linhas
- Cada coluna deve conter dados do mesmo tipo
Para demonstrar o uso de data frames e as principais funções do tidyverse, vamos usar o conjunto de dados gapminder
, que contém informações sobre expectativa de vida, PIB per capita e população de diversos países ao longo do tempo.
8.3 Principais Funções do dplyr
O pacote dplyr do tidyverse oferece um conjunto poderoso de funções para manipulação de dados. Vamos explorar as principais.
- select(): Selecionaa Colunas
- filter(): Filtra Linhas
- mutate(): Modifica ou Cria Variáveis a Partir das Existentes
- group_by() e summarize(): Agrupa e Sumariza Dados, respectivamente.
- arrange(): Ordena uma Data Frame por uma Variável
8.4 Combinando Funções do dplyr
O operador pipe (%>%
) permite encadear várias operações de forma clara e intuitiva:
8.5 Exercícios
Exercício 8: Análise Básica de Dados
Usando o data frame gapminder
, crie um código R que:
- Filtre os dados para o ano de 2007
- Selecione apenas país, continente e PIB per capita
- Ordene os países por PIB per capita (decrescente)
- Mostre apenas os 10 primeiros países
Exercício 9: Análise por Continente
Calcule para cada continente:
- A população total
- A expectativa de vida média
- O PIB per capita médio
- Ordene os continentes pela expectativa de vida média
Exercício 10: Análise Temporal
Compare o Brasil com a média da América do Sul em termos de:
- Expectativa de vida
- PIB per capita
Para os anos disponíveis na data frame gapminder