Análise de dados com Python: calculando média e mediana

Estou trabalhando em um projeto de análise de dados em Python e preciso calcular a média e a mediana de um conjunto de dados. Entendo os conceitos básicos, mas estou procurando um exemplo de código Python que demonstre como fazer isso de forma eficiente.

Digamos que eu tenha uma lista de números:

data = [12, 45, 67, 23, 41, 89, 34, 54, 21]

Quero calcular a média e a mediana desses números. Você poderia fornecer um trecho de código Python que faça isso? Além disso, seria útil se você pudesse explicar quaisquer bibliotecas ou funções usadas no código.

Obrigado por sua ajuda no cálculo dessas estatísticas básicas para meu projeto de análise de dados!

Olá @jesse100

Para média, o jeito mais simples sempre vai ser iterar os elementos da sua lista, criando um totalizador e depois dividindo pelo numero total de elementos da lista. Existem inúmeras forma de fazer, mas segue uma sugestão: media = sum(data) / len(data)

Porém Python é muito utilizado para analise de dados, não por causa de coisas desse tipo, mas sim pela sua biblioteca de funções matemáticas, e sua excelente performance com grandes volumes de dados.

Caso ainda não conheça sugiro dar uma olhada na documentação:

Espero ter ajudado.

Você pode usar numpy:

import numpy as np
...
print(np.mean(data))
print(np.median(data))

provavelmente vai precisar instalar:

pip install numpy

statistics também é uma biblioteca voltada para esse tipo de trabalho.

1 curtida