O diagrama de dispersão é usado quando você deseja obter uma análise gráfica de dados bivariados. Representa a relação entre duas variáveis de forma gráfica, o que facilita a visualização e a interpretação dos dados. Em nosso quarto tutorial com o pacote ggplot2, utilizaremos as variáveis de níquel e cobre dos dados de jura, como nas lições anteriores, os gráficos serão personalizados.
Como fazer um scatter plot básico
A maneira básica de representar um gráfico de dispersão no ggplot2 é usar a linha de comando “geom_point ()” onde você solicita ao ggplot2 que, a partir dos dados jura.pred, selecione as colunas “Ni” e “Cu” e depois execute um gráfico de dispersão. A função “geom_point()” é usada para mudar, o cor, o tamanho e a forma de cada ponto.
Como mudar as cores do gráfico no R
Os comandos colour e fill inseridos na função geom_point() permitem alterar e personalizar as cores do gráfico. O exemplo a seguir ilustra como esta modificação pode ser realizada.
Como usar a função geom_smooth ()
A função geom_smooth () é usada para adicionar linhas de regressão ao diagrama de dispersão. Em seguida, ilustraremos 3 exemplos utilizando a função smooth.
A cor do intervalo de confiança, a cor da linha e o tipo de linha de regressão do gráfico podem ser modificados usando a função geom_smooth com a adição de diferentes argumentos dentro desta função.
Como usar scatterplot por grupos
Usando a variável fator Rock modificaremos as cores e a forma dos pontos do diagrama de dispersão. Esta alteração pode ser feita automaticamente ou personalizada para cada gráfico.
A função geom_rug () desenha as marginais ao longo dos eixos x e y, como segue:
O que é Facet
O argumento facets espera um tipo de entrada de fórmula, com um ~ separando a variável do lado esquerdo e a variável do lado direito. A variável do lado esquerdo indica como as linhas dos painéis devem ser divididas e a variável do lado direito indica como as colunas dos painéis devem ser divididas. Aqui, queremos apenas cinco linhas de scatterplot (e apenas uma coluna), uma para cada classe de unidade, então especificamos a variável Rock no lado esquerdo e “.” no lado direito indicando que não existe nenhuma variável lá (está vazia).