
Nesta videoaula você vai aprender:
O que é Estatística? Para que Serve?
Sequencia Lógica de aprendizagem
Estatística Descritica - Probabilidade - Estatística Inferencial
Passo a passo dos conteúdos a serem estudados da sequência de aprendizagem
O QUE É O GRÁFICO DE PARETO? COMO ELABORAR? COMO INTERPRETAR?
É uma ferramenta visual utilizada para identificar as causas mais frequentes de um problema. Assim, o Pareto ajuda a priorizar os problemas mais significativos em um conjunto de dados. Ele combina um gráfico de barras e um gráfico de linha, onde as barras representam a frequência ou o impacto de diferentes causas, e a linha mostra a soma cumulativa dessas frequências em percentual. O gráfico é baseado no Princípio de Pareto, também conhecido como a regra 80/20, que sugere que 80% dos problemas são causados por 20% das causas.
COMPONENTES DE UM GRÁFICO DE PARETO
Eixo horizontal (x): As diferentes categorias ou causas dos problemas, classificadas da mais frequente para a menos frequente.
Eixo vertical esquerdo (y): A frequência ou impacto de cada causa.
Barras: Representam as frequências de cada causa.
Eixo vertical direito (y): O percentual acumulado das causas.
Linha cumulativa: Mostra a soma percentual acumulada das causas conforme avança da maior para a menor.
IMPORTÂNCIA DO GRÁFICO DE PARETO
Priorizar problemas: O gráfico ajuda a visualizar quais problemas ou causas têm maior impacto, permitindo que os esforços sejam concentrados nas áreas mais críticas.
Tomada de decisão eficiente: Ao destacar os problemas mais relevantes, facilita o direcionamento de recursos e ações para onde eles terão maior efeito.
Identificação de causas principais: Utilizando o princípio 80/20, o gráfico sugere que uma pequena parte das causas pode ser responsável pela maioria dos efeitos, ajudando na resolução eficaz de problemas.
Melhoria contínua: É uma ferramenta essencial em processos de qualidade e melhoria contínua, como o Lean e o Six Sigma.
ESTUDO DE CASO
Aplicação do Gráfico de Pareto em uma Indústria de Manufatura
a) Cenário: Uma empresa de manufatura de componentes eletrônicos estava enfrentando altos índices de defeitos em seus produtos, resultando em aumento de custos com retrabalho e redução de satisfação dos clientes. A gerência decidiu investigar a origem dos defeitos para priorizar ações corretivas. Eles coletaram dados sobre os tipos de defeitos mais comuns que ocorriam no processo de produção.
b) Dados Coletados: Após análise de um mês de produção, os seguintes defeitos foram identificados, juntamente com a frequência de ocorrência:
Solda fraca foi o defeito mais comum, com 120 ocorrências, representando 40% do total de problemas.
Componentes tortos tiveram 60 ocorrências, o que corresponde a 20%.
Falhas de isolamento ocorreram 45 vezes, equivalendo a 15% dos defeitos.
Curto circuito apareceu em 30 ocasiões, representando 10%.
Falta de componente foi registrada 25 vezes, ou seja, 8%.
Outros defeitos diversos somaram 20 ocorrências, representando os 7% restantes.
c) Construção do gráfico:
Após a construção do gráfico, observou-se que dois tipos de defeitos (solda fraca e componente torto) representavam 60% dos problemas (40% + 20%).
d) Análise: O princípio de Pareto, também conhecido como regra 80/20, sugere que 80% dos problemas são causados por 20% das causas. Neste caso, 60% dos defeitos eram causados por apenas 2 dos 6 tipos de problemas identificados.
e) Ação Corretiva: Com base no Gráfico de Pareto, a empresa decidiu priorizar ações corretivas nos processos que causavam os defeitos de solda fraca e componente torto, já que a redução desses dois defeitos impactaria significativamente a qualidade geral dos produtos. Isso incluiu a revisão do processo de soldagem e a melhoria na calibragem das máquinas responsáveis pela inserção dos componentes.
f) Resultado: Após implementar essas melhorias, a empresa conseguiu reduzir os defeitos de solda em 30% e os defeitos de componente torto em 25%, o que resultou em uma redução geral de 55% nos defeitos do processo de produção
O que é a Média? Como interpretar?
Representa o valor central ou típico do conjunto. A média é a soma de todos os valores de um conjunto de dados dividida pelo número de valores. Interpretação: A média fornece uma ideia geral do valor típico em um conjunto de dados. No entanto, ela pode ser afetada por valores extremos (outliers), o que pode distorcer a percepção do comportamento típico dos dados.
O que é a Mediana? Como interpretar?
A mediana é o valor central de um conjunto de dados ordenados (do menor para o maior valor). Ela divide os dados em duas metades iguais. Interpretação: A mediana é útil em distribuições assimétricas ou quando há outliers, pois não é influenciada por valores extremos.
O que é a Moda: Como interpretar?
A moda é o valor que aparece com maior frequência em um conjunto de dados. Um conjunto de dados pode ser unimodal (uma moda), bimodal (duas modas) ou multimodal (mais de duas modas). Interpretação: A moda indica o valor mais comum em uma distribuição de dados. É útil para dados categóricos e quando se quer identificar tendências em grandes conjuntos de dados.
O que é o Desvio Padrão? Como interpretar?
O desvio padrão mede a dispersão dos valores em relação à média. É a raiz quadrada da variância e reflete quanto os dados variam em torno da média. Interpretação: Um desvio padrão baixo indica que os dados estão próximos da média, enquanto um desvio padrão alto indica que os dados estão dispersos. É uma medida de variabilidade útil para dados com distribuição simétrica.
O que é o Coeficiente de Variação (CV)? Como interpretar? É a razão entre o desvio padrão e a média, geralmente expresso como uma porcentagem. Ele é uma medida padronizada de dispersão. Interpretação: O coeficiente de variação compara a variação relativa entre diferentes conjuntos de dados.
Um CV mais alto indica maior variabilidade relativa em relação à média, e um CV baixo indica menor variabilidade. É útil para comparar a dispersão entre conjuntos de dados com diferentes escalas ou unidades.
O que é o Quartil? Como interpretar?
Os quartis dividem um conjunto de dados ordenado em quatro partes iguais. São três valores que separam os dados em quatro partes: o primeiro quartil (Q1), o segundo quartil (Q2 ou mediana) e o terceiro quartil (Q3). Q1: 25% dos dados estão abaixo deste valor. Q2 (Mediana): 50% dos dados estão abaixo deste valor. Q3: 75% dos dados estão abaixo deste valor.
Interpretação: Os quartis fornecem uma ideia de dispersão e localização dos dados em termos de percentis. Eles são particularmente úteis para entender a distribuição dos dados e identificar a presença de outliers. Por exemplo, a diferença entre Q1 e Q3 é chamada de intervalo interquartil (IQR), que pode ser usada para identificar a variabilidade dos dados sem ser influenciada por valores extremos.
Nesta aula vamos apresentar um projeto desenvolvido pela ANAC, uma aplicação prática da distribuição de frequências com classes. Eis abaixo os detalhes gerais do projeto.
LEVANTAMENTO DO PERFIL ANTROPOMÉTRICO DA POPULAÇÃO BRASILEIRA USUÁRIA DO TRANSPORTE AÉREO NACIONAL – PROJETO CONHECER
Fundamentos e Objetivo: A questão do espaço entre assentos nos aviões tem mostrado ser de ordem econômica, conduzindo as empresas a praticarem uma maior densidade de assentos, por consequência menores espaços, maior oferta e menores preços. Contudo, fatores como saúde e segurança do passageiro podem ser bem mais importantes que preços menores. O objetivo deste estudo foi o de traçar um perfil da população brasileira que utiliza a aviação como meio de transporte e verificar que parcela desta população é atualmente atendida satisfatoriamente dentro das configurações de interior praticadas nas aeronaves.
Métodos: Foram coletados dados antropométricos de massa corporal total, estatura, altura tronco- cefálica, largura de ombro, largura de quadril, comprimento glúteo-joelho e altura de poplíteo de 5.305 homens, entre 15 e 87 anos de idade nos 20 principais aeroportos do país. Além disso, foram coletadas medidas referentes à largura do assento através da almofada da poltrona, largura do assento entre os braços, espaço útil e o seat pitch em aeronaves selecionadas entre as três maiores empresas de transporte aéreo nacional. De posse desses dados foram gerados modelos virtuais através dos softwares catia 5.17 e corel draw grafics x3.13. O tratamento dos dados foi realizado por meio de estatística descritiva e escore z. A análise dos dados populacionais e espaço útil entre assentos foi feita em função do menor pitch praticado nas aeronaves para cada um dos 22 modelos de assentos analisados em função do perfil antropométrico, do conforto, da saúde e da segurança.
Resultados: Os resultados evidenciaram uma estatura média de 173,1 cm com desvio padrão de 7,3 cm. Além disso, mostrou que apenas 1,2% da população possuem estatura acima de 190,1 cm. Analisando os dados do Índice de Massa Corpórea (IMC) é possível verificar que 72,8% os indivíduos estudados apresentam excesso de peso corporal (IMC≥25,0 kg/m2). Através dos dados antropométricos de larguras e comprimento verifica-se que apenas 8,31% dos indivíduos estudados possuem um comprimento glúteo-joelho acima de 65,0 cm. Quanto à largura dos ombros 69,0% da amostra estudada possui mais 45,0 cm de largura. Dos vinte e dois modelos virtuais gerados a partir dos dados do perfil antropométrico da população estudada e modelos de assentos, apenas cinco não atendem ao P95 da população. Outro dado importante diz respeito aos indivíduos com menos de 1,60 m (3,47%) e mais de 1,90 m (1,23), em virtude de esses dados apontarem para pré-disposição da Trombose Venosa Profunda (TVP).
Conclusões: Apenas cinco dos vinte e dois assentos avaliados, com pitch 29”, não atendem ao P95 da amostra estudada. Além disso, independente do modelo de assento, parece que pitchs acima de 30” não interferem no espaço útil. No que diz respeito ao conforto parece que o mesmo está associado ao tempo de permanência na posição sentada, às características morfológicas da população estudada e à ergonomia do assento. Quanto ao risco de TVP observa-se que 4,7% da amostra se encontram nos extremos de estatura, o que combinado ao excesso de peso corporal e limitações no espaço útil, aumenta o risco dos indivíduos nessa faixa desenvolverem TVP em voos com mais de 4 horas. No que concerne à segurança, verifica-se que 36,6% dos indivíduos estudados possuem peso corporal acima de 85,0 kg, o que demonstra uma defasagem de 8 kg em relação ao peso utilizado na certificação do assento e cinto de segurança, equipamentos utilizados por esses indivíduos. Tal fato provavelmente em uma situação de emergência pode colocar em risco a vida de indivíduos que apresentem características similares as verificadas no estudo.
Conceito de Diagrama de Dispersão
Um diagrama de dispersão é um gráfico utilizado para exibir a relação entre duas variáveis quantitativas. Cada ponto no gráfico representa um par de valores, com um eixo representando uma variável (geralmente o eixo x) e o outro eixo representando a segunda variável (geralmente o eixo y). O diagrama de dispersão é útil para identificar padrões, tendências e possíveis relações entre as variáveis, como correlação ou dependência.
Conceito de Correlação
Correlação refere-se à medida estatística que indica a força e a direção da relação linear entre duas variáveis. O coeficiente de correlação, representado geralmente por r, que pode variar de -1 a 1:
r=1: Correlação linear positiva perfeita.
r=−1: Correlação linear negativa perfeita.
r=0: Não há correlação linear.
A correlação é importante para entender como as variáveis se comportam juntas, mas não implica causalidade.
Conceito de Regressão Linear Simples
A regressão linear simples é um modelo estatístico usado para descrever a relação entre duas variáveis, uma dependente (y) e uma independente (x). A ideia é ajustar uma reta que melhor descreva essa relação, minimizando os erros. A regressão linear simples é importante porque permite prever valores de y com base em valores de x, além de fornecer uma estimativa da relação entre as variáveis.
Estudo de Caso:
Correlação entre Nível de Renda e Geração de Resíduos Sólidos Urbanos
O aumento da geração de resíduos sólidos urbanos é um desafio crescente em cidades e áreas urbanas. Muitos estudos apontam que há uma relação entre o nível de renda da população e a quantidade de resíduos gerados.
Populações com rendas mais altas tendem a gerar mais resíduos devido ao maior consumo de produtos e serviços, enquanto populações com renda mais baixa tendem a consumir menos e, portanto, gerar menos resíduos.
a) Estudo de Caso: Imagine um estudo que avalie a correlação entre o nível de renda de diferentes bairros de uma cidade e a quantidade de resíduos sólidos gerados nesses bairros. Neste caso, o nível de renda seria a variável independente (x) e a quantidade de resíduos sólidos gerados seria a variável dependente (y).
b) Coleta de Dados: Dados de renda média mensal por habitante em diferentes bairros são coletados, assim como a quantidade média de resíduos sólidos gerados por habitante.
c) Diagrama de Dispersão: Ao traçar um diagrama de dispersão com os dados, pode-se observar uma tendência: bairros com maior renda tendem a gerar mais resíduos sólidos per capita.
d) Correlação: Calcula-se o coeficiente de correlação (r). Se, por exemplo, r=0,75, isso indicaria uma correlação positiva moderada a forte entre a renda e a geração de resíduos. Isso sugere que conforme a renda aumenta, a geração de resíduos sólidos também tende a aumentar.
e) Regressão Linear Simples: Aplicando a regressão linear simples, obtém-se uma equação que descreve essa relação, por exemplo: y = 0,5x + 10, onde: y é a quantidade de resíduos sólidos gerados (kg/habitante) e x é a renda média mensal (em mil reais).
Isso significa que para cada aumento de 1.000 reais na renda média mensal, a quantidade de resíduos gerados aumenta em 0,5 kg por habitante.
Conclusão: A análise de correlação e regressão linear simples entre nível de renda e geração de resíduos sólidos urbanos permite identificar uma relação positiva, o que pode ajudar gestores públicos a planejar estratégias de gestão de resíduos mais eficazes, considerando a dinâmica econômica da população.
CONCEITO DE GRÁFICO DE CONTROLE DA QUALIDADE
É uma ferramenta estatística utilizada para monitorar a variação de processos ao longo do tempo, ajudando a identificar se um processo está sob controle estatístico ou se há variabilidade que requer ação corretiva.
Ele consiste em um gráfico onde se plota uma característica de qualidade de um processo (como tempo, volume ou dimensões) ao longo do tempo, com limites de controle superior e inferior baseados em dados históricos do processo.
Os limites de controle são determinados pelo desvio padrão da distribuição dos dados e são usados para identificar padrões incomuns ou variações fora do esperado. Se os pontos caem dentro dos limites de controle e seguem uma distribuição aleatória, o processo é considerado sob controle. Se algum ponto cair fora desses limites ou se um padrão não aleatório aparecer, isso indica a necessidade de investigação.
IMPORTÂNCIA DO GRÁFICO DE CONTROLE
a) Monitorar a estabilidade do processo: Identificando se o processo está sob controle estatístico ou se houve variações inesperadas que precisam ser investigadas.
b) Prevenir defeitos: Ao detectar variações que possam levar a defeitos, ele permite intervenções antes que os problemas afetem a qualidade.
c) Facilitar a tomada de decisões baseadas em dados: Eles fornecem uma base objetiva para decidir quando ajustar um processo ou deixá-lo inalterado.
d) Melhorar a eficiência operacional: Reduzindo retrabalho, desperdício e paradas não planejadas, o gráfico de controle auxilia na melhoria contínua.
ESTUDO DE CASO
Empresa de Fabricação de Peças Automotivas
a) Situação
Uma fábrica de peças automotivas utiliza uma máquina de corte para produzir componentes metálicos. Os componentes devem ter uma espessura precisa de 10 mm com uma tolerância de ±0,2 mm. No entanto, variações no processo começaram a resultar em peças fora dessas especificações, gerando um aumento no retrabalho e na rejeição de produtos.
b) Implementação do Gráfico de Controle
A equipe de qualidade decide implementar um gráfico de controle para monitorar a espessura das peças ao longo do tempo. Eles coletam dados de 30 amostras consecutivas de peças e calculam a média e o desvio padrão da espessura. Eles definem os seguintes parâmetros: Média do processo (CL): 10 mm Limite superior de controle (UCL): 10,2 mm Limite inferior de controle (LCL): 9,8 mm
c) Coleta de Dados
Os operadores da máquina medem a espessura de uma amostra a cada hora e plotam os resultados no gráfico de controle. Ao longo de algumas semanas, observam que a maioria das amostras está dentro dos limites de controle, exceto por alguns pontos que excedem o limite superior, indicando uma possível mudança no processo.
d) Análise e Ação Corretiva
A equipe de engenharia investiga o aumento na espessura e descobre que a lâmina de corte da máquina está desgastada, o que aumenta a pressão durante o corte, resultando em peças mais grossas. Eles substituem a lâmina e continuam monitorando o processo com o gráfico de controle. Após a substituição, os pontos no gráfico retornam aos limites normais, confirmando que o processo voltou ao controle. A implementação do gráfico de controle não só identificou o problema rapidamente como também evitou maiores perdas e aumentou a eficiência operacional.
e) Conclusão
O uso de gráficos de controle permitiu à empresa identificar a causa da variação no processo de corte, realizar uma intervenção antes que o problema se agravasse e garantir a qualidade dos produtos, minimizando desperdícios e custos.
O QUE É PERCENTIL?
O conceito de percentil indica a posição de um valor específico dentro de uma distribuição, mostrando a porcentagem de observações abaixo desse valor. Por exemplo, se uma pessoa está no 70º percentil de altura, significa que sua altura é maior do que a de 70% das pessoas na amostra.
Exemplo prático com Estatura e Peso
Estatura no Percentil 95: Em uma pesquisa fictícia, se o percentil 95 para altura fosse de 1,85 m, apenas 5% dos brasileiros teriam altura superior a esse valor. Isso implica que, ao desenhar assentos em aviões, se os assentos acomodarem essa altura, quase todos os passageiros poderão sentar-se confortavelmente.
Peso no Percentil 95: Suponhamos que o percentil 95 de peso seja 100 kg. Isso indica que 95% da população tem peso abaixo desse valor. Em uma análise de segurança, essa informação é útil para definir o peso máximo que o equipamento precisa suportar com segurança para a maioria dos passageiros.
RELAÇÃO ENTRE MEDIANA, QUARTIL, DECIL E PERCENTIL
Percentis são fundamentais em análises de dados para determinar onde um valor específico se encontra em relação a um grupo. Eles se relacionam diretamente com a mediana, que é o 50º percentil, representando o ponto central dos dados. Os quartis dividem os dados em quatro partes, com o 1º quartil no 25º percentil e o 3º quartil no 75º percentil, enquanto os decil dividem em dez partes, com o 1º decil no 10º percentil e assim por diante.
ESTUDO DE CASO
Para um estudo antropométrico da população brasileira usuária do transporte aéreo, o uso de percentis ajuda a identificar o quão bem as configurações atuais de assentos atendem às necessidades físicas dos passageiros.
Abaixo, um exemplo detalhado utilizando diferentes percentis de altura para análise:
Percentil 10 (ou 1° Decil): Representa passageiros com altura abaixo da média, ou seja, os 10% mais baixos. Se o espaço entre os assentos é adequado para este grupo, significa que eles têm espaço suficiente, mas não indica se o mesmo é válido para passageiros mais altos.
Percentil 25 (ou 1º Quartil): Neste ponto, 25% dos passageiros têm altura igual ou inferior a essa medida. Se as configurações são ajustadas para atender esse percentil, ainda um grande número de passageiros poderá estar desconfortável, especialmente os mais altos.
Percentil 50 (ou Mediana ou 2° Quartil ou 5° Decil): Este é o ponto onde 50% dos passageiros têm altura inferior e 50% superior. Configurações que atendem este percentil podem ser confortáveis para passageiros de altura média, mas ainda podem ser insuficientes para pessoas mais altas.
Percentil 75 (ou 3º Quartil): Com uma configuração que atende ao 75º percentil, até 75% dos passageiros estão acomodados de forma confortável. Esse ajuste já representaria uma melhoria significativa, garantindo que apenas 25% dos passageiros, com altura acima da média, possam ter dificuldades.
Percentil 90 (ou 9° Decil): Ao projetar os assentos para atender ao 90º percentil, apenas os 10% mais altos ficariam potencialmente desconfortáveis. Este nível de acomodação minimizaria problemas relacionados ao conforto e à segurança, pois a maioria dos passageiros teria espaço adequado para pernas e mobilidade.
A análise desses percentis auxilia a ANAC e as companhias aéreas a decidir se os padrões atuais são adequados ou se precisam ser ajustados para melhor acomodar a maioria dos passageiros. Por exemplo, se a configuração de assentos atende apenas até o 50º percentil, uma atualização poderia ser recomendada para atingir o 75º ou 95º percentil, garantindo um espaço mais adequado para a saúde e segurança dos passageiros, em vez de priorizar apenas a economia.
Linguagem simples é a fórmula para promover o aprendizado!
Está perdido em estatística? Fuja de jargões técnicos e métodos confusos. Este é o curso introdutório da série "Estatística para Leigos", criado EXCLUSIVAMENTE para INICIANTES. O curso vai guiar você na jornada de aprendizado, apresentando um caminho claro para iniciar seus estudos em estatística.
O aluno leigo em estatística não está em busca de um especialista. Ele quer apenas encontrar um mentor: alguém que compreenda suas dificuldades, conheça suas necessidades e mostre o melhor caminho a seguir. E estou aqui para ajudar você a dar os primeiros passos nessa trajetória!
O QUE VOCÊ VAI ESTUDAR
Seção 1: Conhecendo o curso, a estatística e a sequência lógica de aprendizagem
Aula 1: Seja bem-vindo (a)!
Aula 2: O que é Estatística? Qual é a sequência lógica de aprendizagem de estatística?
Seção 2: Exemplos de aplicações práticas da estatística
Aula 3: Gráfico de Pareto e Histograma - caso de aplicação no setor industrial
Aula 4: Média, Mediana, Moda, Quartil e Desvio Padrão - aplicação e interpretação
Aula 5: Distribuição de Frequência e Histograma - caso real de uso no setor de Aviação
Aula 6: Diagrama de Dispersão e Correlação - caso real de uso nas Nações Unidas
Aula 7: Gráfico de Controle - caso real de uso no carregamento de caminhões
Aula 8: Percentil - caso real de uso no setor de Aviação
Aula 9: Diagrama de Ramo e Folhas - caso real de uso nas estações de metrô do Japão
Seção 3: Livros recomendados
Aula 10: Livros recomendados
Aula 11: Trailer - Estatística I (para leigos): aprenda fácil e rápido!