Olá! Meu nome é Regina.
Audiodescrição: Regina é uma mulher morena, de cabelo longo, cacheado e preto. Ela está usando uma blusa laranja.
Neste curso de visualização de dados, ideal para analistas de dados, cientistas de dados e engenheiros de dados, nós aprenderemos a montar gráficos estratégicos, ideais para que possamos apresentar e defender nossas ideias e hipóteses.
Neste curso, abordaremos temas como gráficos de barras, linhas, bolhas, conceitos estatísticos e matemáticos, a leitura de alguns artigos científicos, as principais bibliotecas de Python e, principalmente, storytelling. O objetivo é que possamos aplicar os conceitos deste curso utilizando qualquer linguagem de programação e qualquer plataforma que desejarmos. Ao final deste curso, aprenderemos a escolher e montar os gráficos adequados para os dados que possuímos e para solucionar os problemas que enfrentaremos em nosso dia a dia como profissionais de dados.
Bem-vindos ao curso de Visualização de Dados. Antes de tudo, precisamos entender o que é a Visualização de Dados. A visualização de dados consiste em transformar dados em códigos visuais. O código visual é a mensagem que desejamos transmitir, o insight que acabamos de descobrir e que queremos compartilhar com nosso público. Utilizar recursos de visualização de dados é essencial para explorar dados, gerar insights científicos, demonstrar esses insights e, obviamente, para ensinar tudo o que sabemos.
Vamos apresentar um exemplo prático e real de como a visualização de dados pode ser poderosa quando aplicada corretamente no dia a dia. Este é o gráfico de Florence Nightingale, de 1858. Ela foi enfermeira e trabalhou na Guerra da Crimeia, no Hospital do Exército. No gráfico à direita, temos um gráfico de setores, ou o famoso gráfico de pizza. Cada porção desse gráfico representa um mês do ano e, dentro de cada porção, há três cores: azul, que representa mortes por doenças infecciosas; vermelho, que representa mortes por ferimentos; e preto, que representa mortes por outras causas. Florence Nightingale conseguiu, por meio deste gráfico, mostrar que a maioria dos soldados morria por doenças infecciosas que poderiam ser evitadas com técnicas adequadas de saneamento e limpeza no hospital. Com essa demonstração gráfica, ela melhorou a qualidade de vida dos soldados na guerra e salvou muitas vidas.
Quando falamos de visualização de dados, referimo-nos a duas técnicas diferentes: explorar dados e expor dados. Explorar dados é algo que fazemos constantemente como cientistas de dados, engenheiros ou analistas. Quando recebemos uma nova base de dados, como uma base de vendas, precisamos entender do que se trata, quantas linhas possui, qual é a média, se há muitas variáveis numéricas ou nominais, etc. Isso é exploração de dados, ou seja, estamos inspecionando.
Expor dados, por outro lado, é mostrar a uma audiência selecionada os insights que obtivemos. Não mostramos tudo o que exploramos, mas selecionamos nossos achados, trabalhamos esses dados para transformá-los em visualizações e, então, apresentamos ao público.
Durante a exploração de dados, buscamos quatro descobertas principais:
Distribuição Geral: Identificar a distribuição de cada categoria, ou seja, a frequência relativa e absoluta de variáveis nominais.
Medida da Distribuição: Analisar variáveis numéricas para descobrir a média, mediana, desvio padrão e moda.
Distribuição Amostral: Verificar se há uma média frequente entre subgrupos ou se existem múltiplas modas, ou seja, valores extremamente frequentes.
Identificação de Valores Atípicos: Detectar pontos fora da curva ou observações anormais, que podem ser anomalias na coleta de dados, acidentes ou erros de digitação. É crucial identificar a origem desses valores para extrair informações valiosas.
Ao expor dados, selecionamos o que foi feito na exploração de dados, identificando nosso público-alvo, definindo a mensagem a ser transmitida e como nos comportaremos diante do público. Escolhemos quais dados dos exploratórios serão utilizados para montar a visualização de dados. Construímos nossa narrativa ou storytelling, um tema que será abordado ao longo de toda esta formação.
Para gerar e construir uma comunicação eficaz, quando falamos de expor dados, nos referimos a quatro pilares. O primeiro é o 'quem': nosso público. Ao identificar esses pilares, é importante tomar um papel e uma caneta antes de qualquer reunião e já identificar nosso público. Ou seja, para quem a decisão será tomada. Se estivermos em uma sala de reuniões, não importa se estamos com diretor, gerente, vice-presidente ou colegas de trabalho, quem ali vai tomar a decisão? Esse é nosso público. Não devemos dizer que nosso público são pessoas interessadas, internas ou externas, pois isso nunca é uma definição de público.
O segundo pilar da exposição de dados é identificar nosso 'o quê', ou nosso objetivo. O que precisamos que eles saibam? Geralmente, queremos que nosso público faça algo. Na verdade, devemos querer que nosso público faça algo, ou seja, deve ser um público ativo. Normalmente, definimos isso com alguns verbos. Podemos pensar, por exemplo, que queremos que a pessoa que toma decisões aceite um novo orçamento ou que acredite que o projeto foi um sucesso nos últimos seis meses.
O terceiro pilar é o 'como'. Ou seja, que gráficos vamos usar? Como vamos transmitir nossa mensagem? E, com isso, como vamos selecionar os melhores dados para construir os melhores gráficos? Obviamente, extrairemos essa informação de nossa análise exploratória, que foi a primeira coisa que fizemos. Na verdade, é o que todo cientista de dados, engenheiro ou analista faz inicialmente.
Aqui trazemos um exemplo de como podemos selecionar esses pilares dentro de nossa empresa ou trabalho. Primeira coisa, definir nosso 'quem', nosso público. O que é? É um comitê de orçamento que pode aprovar um recurso financeiro para a continuação do curso de verão. Ou seja, tínhamos um projeto que era o curso de verão, e dentro de nossa sala de reuniões teremos nosso comitê de orçamento. Precisamos que invistam em nós, que decidam investir antes do final da reunião.
O que precisamos? Já mencionamos. O curso de verão sobre ciência foi um sucesso. Por favor, aprovem o orçamento para continuar. E como vamos fazer isso? Vamos utilizar métricas de sucesso com os dados que coletamos durante esse curso de verão. Aqui trazemos um exemplo clássico de como poderíamos utilizar um gráfico para mostrar esse sucesso. À direita, temos um gráfico de barras no qual uma barra representa o valor das vendas antes do curso de verão, e mais à direita, a segunda barra representa o valor das vendas após o curso de verão.
É sempre interessante, quando falamos de KPI (Indicador-Chave de Desempenho) ou métrica, termos um valor de referência. Temos algo a alcançar ou superar. Quando falamos de valor de referência, KPI, dentro da visualização de dados, buscamos indicadores visuais de referência. Neste caso, colocamos uma linha pontilhada que representa nossa referência, que é a média anual de vendas. Com essa linha, podemos demonstrar que, após a implementação do curso de verão, conseguimos superar nossa meta anual em poucos meses.
Esse tipo de gráfico é excelente para falar sobre KPI, mas, obviamente, estamos falando de melhorias e sucessos em relação a uma referência, um número de referência. Quando temos um gráfico com apenas duas barras, geralmente, podemos transformar essa informação em big numbers (números grandes). O que são big numbers? É uma estratégia visual para mostrar um, no máximo dois ou três números de forma rápida e que se distancie do texto.
Aqui está um exemplo. Em vez de mostrar graficamente que aumentamos nosso número de vendas, mostramos o valor. Em quanto aumentamos? Aumentamos 30% nas vendas de pós-graduação. Temos um big number, que é o valor, nosso KPI, em uma fonte de tamanho diferente do texto, em uma cor diferente, chamando imediatamente a atenção. Esse é o conceito de big number. Geralmente, podemos identificar que um big number é melhor que um gráfico quando temos um gráfico de barras muito simples. Neste caso, apesar de ser simples, é mais difícil de ler que o próprio big number. Este é um excelente conselho para começarmos a construção de gráficos e também de um grande storytelling (narrativa).
Na aula passada, aprendemos sobre a importância da visualização de dados e como aplicá-la em nosso dia a dia. No entanto, muitas vezes não precisamos focar apenas na construção de gráficos; também podemos apresentar tabelas. As tabelas são uma excelente fonte de informação, especialmente se temos uma audiência muito diversa. O primeiro ponto a lembrar é que a tabela serve para ser lida, não apenas para ser vista. Ou seja, não adianta passar horas criando uma tabela colorida, com tons sobre tons, pois isso pode dificultar a leitura das informações necessárias pela audiência.
Como mencionamos no início, as tabelas são essenciais e sensacionais para uma audiência mista. Retomando o exemplo da primeira aula, se temos uma audiência em uma sala de reunião com um vice-presidente, um diretor, um colega de trabalho e o analista da área de negócios, é interessante mostrar tabelas. Por quê? Cada pessoa se concentrará na parte da tabela que lhe interessa, de acordo com o negócio ou as decisões a serem tomadas. Assim, o diretor se focará na linha A, o colega de trabalho na linha C, e o vice-presidente em um KPI que está na coluna F, e assim por diante.
Aqui, trazemos um exemplo de como funciona uma tabela pouco agradável e uma tabela mais profissional. Geralmente, uma tabela pouco agradável possui um cabeçalho colorido. Observem que, linha após linha, há um sombreamento, todos os nomes das colunas estão em maiúsculas, e os valores decimais não estão configurados corretamente. Por exemplo, temos um número com uma casa decimal, outro com três casas decimais, e outro novamente com uma casa decimal, sem um alinhamento correto dessas informações.
Comparando com a tabela abaixo, que é mais profissional e limpa, quais conteúdos e conselhos podemos oferecer aqui? Primeiramente, notamos que não possui um cabeçalho colorido, nem bordas marcadas; na verdade, não há bordas, apenas um traço destacado que divide o cabeçalho da informação. Os títulos das colunas não estão em maiúsculas; pelo contrário, apenas a primeira letra está em maiúscula e o restante em minúsculas.
Outra característica é que toda a informação nominal está alinhada à esquerda, enquanto a informação numérica está alinhada à direita. Os valores decimais têm apenas duas casas decimais, e aqueles que aparecem com uma só têm um zero após a vírgula. Notamos que destacamos apenas uma única linha, que está em negrito, representando a loja D, que já superou o percentual da meta, ou seja, já superou o KPI, que é nosso foco nesta reunião. Estamos, portanto, focando nosso storytelling e toda a audiência nessa linha. Se a audiência quiser ler outras informações, pode procurar com o olhar a linha que interessa.
Lembrando que a tabela é para ser lida, não apenas vista. Portanto, ao apresentar uma tabela, devemos reduzir o ritmo da fala, pois todos estarão lendo a tabela, não prestando atenção ao que dizemos. Se quisermos dar uma notícia impactante durante a apresentação, devemos deixá-la para depois ou antes da tabela, nunca durante, para evitar ruídos na comunicação.
Aqui, apresentamos uma lista de regras para construir uma tabela. Primeiramente, eliminar bordas, sombreados e cores; eliminar negritos, deixando-os apenas para as linhas ou partes da tabela que queremos destacar. O alinhamento deve ser à esquerda e à direita, conforme o conteúdo, e devemos adicionar linhas em branco para melhorar a leitura. No caso da tabela apresentada, é uma tabela pequena. No entanto, quando temos uma tabela, imaginemos uma com 30 linhas, com muito texto, às vezes até um parágrafo inteiro dentro de uma célula no Excel, é melhor pular uma linha, deixando-a realmente em branco, para que o olhar da audiência possa descansar. Devemos arredondar valores numéricos até duas casas decimais.
A fonte de todos esses conselhos está no Remove to Improve, que é um site muito interessante para consulta.
O curso Visualização de dados: criar gráficos estratégicos com Python possui 363 minutos de vídeos, em um total de 73 atividades. Gostou? Conheça nossos outros cursos de Data Visualization em Data Science, ou leia nossos artigos de Data Science.
Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:
O Plano Plus evoluiu: agora com Luri para impulsionar sua carreira com os melhores cursos e acesso à maior comunidade tech.
2 anos de Alura
Matricule-se no plano PLUS 24 e garanta:
Jornada de estudos progressiva que te guia desde os fundamentos até a atuação prática. Você acompanha sua evolução, entende os próximos passos e se aprofunda nos conteúdos com quem é referência no mercado.
Programação, Data Science, Front-end, DevOps, Mobile, Inovação & Gestão, UX & Design, Inteligência Artificial
Formações com mais de 1500 cursos atualizados e novos lançamentos semanais, em Programação, Inteligência Artificial, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.
A cada curso ou formação concluído, um novo certificado para turbinar seu currículo e LinkedIn.
Acesso à inteligência artificial da Alura.
No Discord, você participa de eventos exclusivos, pode tirar dúvidas em estudos colaborativos e ainda conta com mentorias em grupo com especialistas de diversas áreas.
Faça parte da maior comunidade Dev do país e crie conexões com mais de 120 mil pessoas no Discord.
Acesso ilimitado ao catálogo de Imersões da Alura para praticar conhecimentos em diferentes áreas.
Explore um universo de possibilidades na palma da sua mão. Baixe as aulas para assistir offline, onde e quando quiser.
Luri Vision chegou no Plano Pro: a IA da Alura que enxerga suas dúvidas, acelera seu aprendizado e conta também com o Alura Língua que prepara você para competir no mercado internacional.
2 anos de Alura
Todos os benefícios do PLUS 24 e mais vantagens exclusivas:
Chat, busca, exercícios abertos, revisão de aula, geração de legenda para certificado.
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais.
Aprenda um novo idioma e expanda seus horizontes profissionais. Cursos de Inglês, Espanhol e Inglês para Devs, 100% focado em tecnologia.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.
Para quem quer atingir seus objetivos mais rápido: Luri Vision ilimitado, vagas de emprego exclusivas e mentorias para acelerar cada etapa da jornada.
2 anos de Alura
Todos os benefícios do PRO 24 e mais vantagens exclusivas:
Catálogo de tecnologia para quem é da área de Marketing
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais de forma ilimitada.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.
Conecte-se ao mercado com mentoria individual personalizada, vagas exclusivas e networking estratégico que impulsionam sua carreira tech para o próximo nível.