quarta-feira, 13 de julho de 2011

As Tendências Centrais

Tendência central é como conhecemos popularmente hoje como média. Porém, estatisticamente, esse termo é muito mais restringente do que pensamos, pois a tendência central é dividida em 3 valores:

- Média amostral, que é a soma dos termos dividida pelo número de termos existentes (sendo que também existe a média ponderada, quando os termos possuem pesos ou valores diferentes);

- Mediana, que é o valor que divide o conjunto de valores observados em uma amostra em duas metades iguais;

- Moda, como se diz no mundo fashion, que é o valor mais frequente, o termo que mais aparece em um conjunto, ou seja, a tendência do momento.

No histograma da postagem anterior, a média amostral foi calculada a partir da fómula de média geométrica, porque os valores percentuais são dependentes:




A mediana foi também calculada:



Por fim, estimamos do resultado da moda:
Está no intervalo entre 2006 e 2008 (41%), porque a porcentagem, por ser maior, é a mais frequente, por causa do aumento da incidência de AIDS.

Observe que, nessa ordem, os tamanhos da média amostral, da mediana e da moda estão em ordem crescente:



33% < 34,5% < 41%

Assim, concluímos que o histograma unimodal (somente uma coluna se sobressai) é assimétrico à esquerda. Já poderia-se deduzir isso olhando para a figura, porém, em alguns casos complexos, é necessário o cálculo das três médias acima.

Caso a ordem fosse decrescente, o histograma seria assimétrico à direita. E se todas as médias fossem iguais ou bem aproximadas entre si, poderíamos chamar o histograma de simétrico.

AIDS em Homossexuais

Essas doenças, abreviadas DSTS, são muito comuns atualmente, porém, um assunto merece atenção especial devido à pouca informação e inclusive negligência dos parceiros: a relação homoafetiva e a AIDS (a síndrome da imunodeficiência adquirida).

Abaixo se encontra um histograma com o índice percentual da AIDS nos casais com indivíduos do mesmo sexo, em todas as idades, ao longo do tempo, que foi montado baseado em valores da doença de 1996 até 2008 no Brasil. Observe que cada intervalo possui um tamanho, eles foram estabelecidos com contas partindo dos valores mínimo e máximo encontrados, depois calculou-se a amplitude, que dividida pela quantidade de anos da década (10), foi estabelecido o tamanho de cada intervalo, ou seja, dois anos para cada um. Sendo assim por questões estéticas e práticas. Existem formas mais complexas, mas o descrito foi somente para explicar a primeira parte da construção de um histograma.

A quantidade de valores encontrados em cada intervalo foi calculada a partir da quantidade de valores que aquele intervalo possui, que nada mais é do que a porcentagem da incidência de AIDS em cada biênio, construindo-se assim as colunas:

Probabilidade do Presidente

Alguns funcionários de uma filial da empresa sabem que o presidente da mesma possui um filho quatorze anos mais novo. Como eles trabalham juntos, resolveram deduzir que a concepção foi acidental, daí eles calcularam a probabilidade P de eles encontrarem o resultado da resposta do presidente, ou seja, qual método ele utilizou com sua parceira que deu errado. Sabe-se que o presidente foi um dos 40 mil entrevistados.

Sabendo que, de acordo com a tabela, há eficácia maior com o uso de preservativos masculinos do que feminino, os funcionários supuseram que o presidente utilizou o preservativo, e não sua parceira, entretanto, resolveram calcular também a probabilidade da parceira estar tomando pílulas anticoncepcionais naquela época.

Eles calcularam, utilizando os valores da primeira tabela da postagem anterior, e encontraram os valores para camisinha e para a pílula, o símbolo ~ indica "valor aproximado":



Os funcionários também quiseram calcular a probabiidade a posteriori, ou seja, a probabilidade atualizada do presidente não ter tido filho, após a inclusão de uma nova informação, o fato dele ter uma nova relação sexual após realizar uma vasectomia.

A probabilidade é dada por P(presidente não teve filho | realizou uma vasectomia). Sendo que o símbolo | significa "dado que."

O cálculo foi baseado na fórmula de Bayes, nome em homenagem a quem contribuiu para a pesquisa desse tipo de probabilidade:


P(H) = probabilidade de não ter filho, independente do método utilizado;
P(D) = probabilidade de ter realizado uma vasectomia, independente do resultado da gravidez.

Conclui-se que, como a vasectomia é um método bastante confiável, sendo que não é costume ter filhos após a operação, essa probabilidade chega muito perto de 100%.

Gestações

Relativo à ocorrência de gestações, sempre há um risco mesmo com o uso de métodos anticoncepcionais, mas o casal deverá ser composto por um homem e uma mulher, abaixo está uma tabela de contingência que resultou de uma entrevista com 40.000 pessoas (individualmente) que trabalham em várias filiais de uma mesma grande empresa na cidade do Rio de Janeiro. As última linha e a última coluna representam a soma dos valores, pois envolvem a soma das ocorrências de gravidez e a soma das pessoas que utilizam o método contraceptivo, respectivamente:



As frequências absolutas, que é definida como a quantidade de dados compreendida entre os limites superior e inferior de cada célula da tabela acima, estão descritas em uma outra tabela:



O cálculo foi realizado da seguinte forma, tomando um exemplo (com os números presentes na primeira tabela): em caso positivo de gravidez utilizando preservativo masculino durante a relação (célula 138), multiplicou-se o número de homens que utilizaram o preservativo com sua parceira, também chamado de camisinha ou condom, (7.155) pelo número de pessoas que, após o ato sexual com seu (sua) parceiro (a), presenciaram uma gravidez positiva (1.941). Depois, pegou-se o valor da multiplicação e dividiu-o pelo total de pessoas entrevistadas (40.000). O resultado aproximado é igual ao que aparece na segunda tabela: 347.

As demais células seguem o mesmo modelo, com suas respectivas células correspondentes.

quarta-feira, 6 de julho de 2011

Apresentação

Olá!

Sou André Athayde de Figueiredo Freire, tenho 21 anos, sou aluno de Farmácia da UFRJ, do 2º período e este é o meu blog com a finalidade de apresentar o trabalho da disciplina Bioestatística com o tema: "Métodos Contraceptivos e as Estatísticas de Compromisso e Negligências."

Trata-se de um tema polêmico, mas que desperta muita curiosidade no ser humano por fazer parte de um dos assuntos de maior interesse dele: o sexo. Porém, como todo prazer possui um porém, a relação sexual deve ser praticada com os devidos cuidados, porque, seja qual for o sexo e a opção do indivíduo, qualquer falta de cuidado e a falha no funcionamento de um contraceptivo pode acarretar em consequências nada agradáveis.

O meu trabalho irá abrangir a relação sexual com métodos contraceptivos e os seus possíveis erros. Além disso, mostrará as estatísticas envolvendo a presença ou não de gravidez e de doenças sexualmente transmissíveis (DST), sendo que esta última consequência pode estar presente em casais compostos tanto por indivíduos heterossexuais quanto por homossexuais, sendo que as estatísticas irão focar nos cônjugues formados por parceiros do mesmo sexo e na DST AIDS (síndrome da imunodeficiência adquirida), por ser um índice que vem piorando em conta da falta de informação e até mesmo negligência.

São diversos tópicos e mecanismos aprendidos durante o curso de Bioestatística no primeiro semestre de 2011, organizados nas postagens a seguir. Os índices se restringem ao Brasil.

André Athayde de Figueiredo Freire.