Avaliação 1 - Questões 4 e 5
Informações sobre os Dados do Pacote farr

Introdução à Ciência de Dados - 2025
Mestrado em Administração

Autor

Prof. Dr. Washington S. da Silva

Data de Publicação

29 de maio de 2025

Informações sobre os Dados do Pacote farr

O pacote farr da linguagem R disponibiliza três data frames interrelacionadas contendo informações sobre bancos australianos, cobrindo diferentes aspectos do desempenho financeiro dessas instituições. Estas data frames são utilizadas nas Questões 4 e 5.

📈 Data frame aus_banks

Estrutura: 10 observações × 3 variáveis

Esta data frame contém informações básicas de identificação de 10 bancos australianos, servindo como tabela de referência para as demais.

Variável Descrição Tipo
gvkey Identificador único da empresa (Compustat) character
ticker Código de negociação na bolsa de valores character
co_name Nome oficial completo do banco character

Bancos incluídos: National Australia Bank (NAB), Westpac Banking Corp (WBC), ANZ Bank New Zealand Limited (ANZ), Commonwealth Bank of Australia (CBA), Adelaide Bank Ltd (ADB), Bank of Queensland Ltd (BOQ), Bendigo and Adelaide Bank Limited (BEN), St. George Bank Ltd (SGB), Bank Of Western Australia (BWA), e BNK Banking Corp Ltd (BBC).

📈 Data frame aus_bank_funds

Estrutura: 283 observações × 7 variáveis

Período: Dados anuais de demonstrações financeiras

Esta data frame contém dados sobre indicadores financeiros selecionados das demonstrações financeiras dos bancos australianos, relevantes para análises de desempenho operacional e financeiro.

Variável Descrição Tipo Unidade
gvkey Identificador único da empresa character -
datadate Data de encerramento do exercício fiscal date YYYY-MM-DD
at Ativo Total (Total Assets) double Milhões USD
ceq Patrimônio Líquido (Common Equity) double Milhões USD
ib Lucro antes de Itens Extraordinários double Milhões USD
xi Itens Extraordinários double Milhões USD
do Operações Descontinuadas double Milhões USD

Nota importante: A variável ib (Income Before Extraordinary Items) é frequentemente utilizada como proxy para o desempenho operacional recorrente, pois exclui eventos não-recorrentes. Para calcular o lucro líquido aproximado: ni ≈ ib + xi + do.

📈 Data frame aus_bank_rets

Estrutura: 3.047 observações × 4 variáveis

Frequência: Dados mensais

Período: Dados históricos de mercado de ações

Esta data frame contém dados mensais sobre o desempenho das ações dos bancos australianos no mercado de capitais.

Variável Descrição Tipo Unidade
gvkey Identificador único da empresa character -
datadate Data de fim do mês date YYYY-MM-DD
ret Retorno mensal da ação double Decimal (ex: 0.148 = 14,8%)
mkt_cap Capitalização de mercado double Milhões USD

Interpretação dos retornos: O valor 0.148 em ret indica um retorno de 14,8% naquele mês. Valores negativos indicam perdas. O primeiro mês de cada ação sempre apresenta NA para retorno, pois não há preço anterior para o cálculo.

🔗 Relações entre as Data Frames
  • Chave de ligação: Todas as três data frames compartilham a variável gvkey como identificador comum

  • Cardinalidade:

    • aus_banks: 1 registro por banco (seção-cruzada)
    • aus_bank_funds: múltiplos registros por banco (dados em painel)
    • aus_bank_rets: múltiplos registros por banco (dados em painel)
  • Cardinalidade em estruturas de dados descreve as relações quantitativas entre registros de diferentes tabelas quando conectadas por chaves comuns. O conceito determina quantos registros de uma tabela podem estar associados a registros de outra tabela.

  • Existe uma correspondência direta entre os conceitos de cardinalidade em estruturas de dados e as classificações tradicionais de dados econométricos. A data frame aus_banks exemplifica perfeitamente uma estrutura de seção-cruzada, apresentando cardinalidade de um para um em relação às entidades analisadas. Cada banco possui exatamente um registro com suas características de identificação, capturando informações estáticas em um momento específico. As data frames aus_bank_funds e aus_bank_rets representam estruturas de dados em painel, demonstrando cardinalidade de um para muitos entre entidades e observações temporais.

  • ⚠️ Considerações Importantes

  • Valores ausentes: Algumas observações podem conter NA, especialmente em aus_bank_funds

  • Moeda: Todos os valores monetários estão em milhões de dólares americanos

  • Período de cobertura: Os dados cobrem diferentes períodos para cada data frame.

  • Consistência temporal: Nem todos os bancos possuem dados para todos os períodos

Instruções para Envio da Avaliação

Envio da Avaliação
  1. Compacte seu arquivo HTML em um arquivo ZIP (01-avaliacao-seunome.zip)

  2. Atualize o repositório no github de seu projeto RStudio da disciplina, que deve conter sua resolução da avaliação.

  3. Envie o arquivo compactado e o link do seu repositório no github para o email washington.silva@ifmg.edu.br, use o assunto: Avaliação 1 - MPA.