howhenno.ru

Como faço para escolher uma árvore de decisão Análise Estatística?

Uma árvore de decisão é como um modelo a escolher as estatísticas apropriadas.
Uma árvore de decisão é como um modelo a escolher as estatísticas apropriadas. (Imagem: Monkey Business Images Ltd / Valueline / Getty Images)

Parte da concepção de um projeto de pesquisa sólida é escolher as análises estatísticas. Uma maneira de abordar esta tarefa é usar uma árvore de decisão. Se você está abordando questões de múltipla em seu projeto, você vai precisar usar a árvore de decisão para cada um deles.

Coisas que você precisa

  • livro de estatística
  • livro de projeto de pesquisa

Preparação

Anote as cinco categorias de questões de pesquisa: “Descrição”, você quer saber os valores típicos para sua amostra, tais como a idade média de seus pacientes ou o tamanho médio de uma “diferença” venda- -você quer saber se dois ou mais grupos diferem em uma ou mais características, como o tipo de carro que comprou, ou doméstico-renda “Associação”, você quer saber quão perto duas variáveis ​​estão associadas, tais como educação e renda, ou dor percebida e depression- e “Prediction “-você quer saber como um ou mais fatores tem um impacto sobre alguma característica de interesse, tais como previsão de audiência da TV com base variables- demográfica e `Outros`.

Anote os quatro níveis de medição. Cada qualidade ou característica medida num projecto de pesquisa, isto é, cada variável-faz uso de um dos quatro níveis de medição, o que, em ordem crescente ou força, são nominal, ordinal, intervalo e Rácio. Dados envolvendo contagens, tais como o número de cada tipo de filme que os espectadores ver em uma determinada noite, o romance contra ação / aventura, por exemplo, usar o nível nominal de medição. Dados envolvendo classificação, tais como preferências encomendados para férias spot-use o nível ordinal de medição. Dados envolvendo números, onde a diferença entre, por exemplo 25 e 35 envolve a mesma diferença em alguma qualidade como entre 55 e 65, tais como temperatura, utilizar o nível de intervalo de medição. Dados que envolvam números de uma maneira semelhante uma escala de intervalo, mas com um verdadeiro zero como o número de horas extras-usar trabalhado que uma pessoa o nível do índice de medição.

Anote as duas grandes categorias de forma para uma coleção ou distribuição de dados. Se os dados de criar uma distribuição sino-curva ou “Normal”, use as estatísticas paramétricas. Use estatísticas não paramétricas se os dados criar uma distribuição "não-normal", como uma forma-double-camelo corcunda, ou uma rusga como uma antena parabólica.

Desenhar uma árvore de decisão Análise Estatística



Desenhe a primeira bifurcação na árvore de decisão com cinco alternativas, sobre o tipo de pergunta de pesquisa que você tem: Descrição, Difference, Associação, previsão, ou Outro. Se uma pergunta tipos como “Outro”, você terá que falar com um consultor de estatística, de modo ignorar "Outros" a partir de agora quando se trata de desenhar a árvore de decisão.

Desenhe quatro alternativas para cada bifurcação na etapa anterior, além de "Outros". Estes envolvem nível de medição, nominal, ordinal, intervalo e razão dos dados. No final desta etapa, você deve ter 16 garfos: Descrição / Nominal, Descrição / ordinal, Descrição / Intervalo, Descrição / Ratio, Difference / Nominal, e assim por diante.

Desenhe dois garfos para cada alternativa envolvendo ordinal, intervalo ou dados Ratio. Estes envolvem a forma da distribuição, tal como descrito na Preparação Passo 4. Por exemplo, Descrição / nominal não tem mais forquilhas, mas Descrição / ordinal decompõe em Descrição / ordinal / paramétrico e Descrição / ordinal / não-paramétrico. No final desta etapa, você deve ter 28 garfos.

Escrever nas estatísticas que se aplicam a cada um dos finais "Descrição" Forks



Escrever nas seguintes estatísticas para Descrição / Nominal: frequência, frequência relativa, de modo. Para Descrição / ordinal / Parametric: freqüência, freqüência relativa, o modo, a gama. Para Descrição / ordinal / não-paramétricos: freqüência, freqüência relativa, mediana, moda, gama.

Escrever nas seguintes estatísticas para Descrição / Intervalo / Parametric: freqüência, freqüência relativa, média, mediana, moda, gama, desvio padrão ou variância. Para Descrição / Intervalo / não-paramétricos: freqüência, freqüência relativa, mediana, moda, gama.

Escrever nas seguintes estatísticas para Descrição / Proporção / Parametric: freqüência, freqüência relativa, média, mediana, moda, gama, desvio padrão ou variância. Para Descrição / Proporção / não-paramétricos: freqüência, freqüência relativa, mediana, moda, gama.

Escrever nas estatísticas que se aplicam a cada um dos finais Forks “diferença”

Escrever nas seguintes estatísticas para Difference / Nominal: Se a comparação for para duas amostras de dois grupos independentes completamente distintas de pessoas, dizer-calcular a estatística qui-quadrado. Se a comparação for por dois relacionados ou dependentes amostras, digamos, dois grupos que foram combinados uns com os outros, ou dois “grupos” de pontuação em que uma pessoa contribui duas pontuações escolha, como um “antes de ver o grupo de anúncios” e um “ depois de ver o grupo de anúncios”-Calcule o teste de McNemar para a significância das mudanças. Se a comparação é mais de duas amostras independentes, calcular a estatística de qui-quadrado. Se a comparação for para mais do que duas amostras dependentes ou afins, calcular o teste de Cochran Q.

Escrever nas seguintes estatísticas para Difference / ordinal / Parametric ou não paramétricos: Se a comparação for para duas amostras independentes, calcular o teste de Mann-Whitney, o teste de duas amostras de Kolmogorov-Smirnov, ou o posto somas. Se a comparação é para duas amostras relacionadas ou dependentes, calcular o teste de sinal, ou as Wilcoxon combinados pares assinado fileiras ou teste T. Se a comparação é mais de duas amostras independentes, utilizar a análise de uma via de Kruskal-Wallis de variância ou teste H. Se a comparação for para mais do que duas amostras dependentes ou afins, utilizar a análise de duas vias de variância de Friedman ou teste do Qui-quadrado.



Escrever nas seguintes estatísticas para Difference / Intervalo / Parametric: Calcule Se a comparação for para duas amostras independentes, calcular a amostras independentes t-teste. Se a comparação for para duas amostras relacionadas ou dependentes, calcular amostras dependentes t-teste. Se a comparação é mais de duas amostras independentes, utilizar a análise entre sujeitos de variância, ou ANOVA. Se a comparação for para mais do que duas amostras dependentes ou associadas, utilizar o dentro submete-ANOVA.

Escrever nas seguintes estatísticas para Difference / Intervalo / não-paramétricos, e Diferença / Proporção / não-paramétricos: Veja “Difference / ordinal / Parametric ou não paramétricos,” acima também, tente o teste de aleatorização para pares combinados. Para Diferença / Proporção / Parametric: Veja “Difference / Intervalo / Parametric,” acima.

Escrever nas estatísticas que se aplicam a cada um dos finais "associação" e Forks "previsão"

Escrever nas seguintes estatísticas para Associação Nominal /: o coeficiente de contingência, C - veja Siegel - ou o coeficiente phi para a correlação - ver Heiman. Para Associação / ordinal / paramétricas e não paramétricas: coeficiente de correlação de Spearman, r-Sub-s, ou o coeficiente de correlação de Kendall classificação, tau.

Escrever no seguinte estatística para Associação / Intervalo / paramétrico: produto-momento de Pearson correlação, r. Para Association / Intervalo / não-paramétricos: Não opção disponível.



Escrever na seguinte estatística para Associação / Proporção / Parametric: o produto Pearson momento de correlação, r. Para Association / Proporção / não-paramétricos: Não opção disponível.

Escreva na seguinte estatística de Previsão / Nominal: regressão múltipla para nominal dependente variables- ver Pedhazur, 1997. Para todos os outros ramos de previsão: a regressão múltipla conduta, interpretar os dados com muita cautela no caso de dados não-paramétricos. Se você estiver usando preditores de nível nominal, ver Pedhazur de 1997, ou Aguinis de 2004.

Aplicação

Anote cada uma de suas perguntas de pesquisa. Um projeto dado pode ter mais de uma pergunta. Por exemplo, “Quanto de cada tamanho de roupa para cada estilo de roupa que nossas lojas vendem?” Ou “Existe uma diferença real entre os estilos ou as quantidades de materiais encomendados em Nova York contra o Los Angeles?” - o que é realmente duas perguntas -ou “Como é o tamanho do tumor relacionada com a idade e sexo do paciente, e o período de tempo desde o diagnóstico inicial?”

Classificar sua primeira pergunta da pesquisa em uma das cinco categorias, descrição e assim por diante.

Determinar o nível de medida a ser usada para os dados, para a sua primeira pergunta da pesquisa. Os níveis são nominal, ordinal, intervalo e Ratio.

Faça uma estimativa da forma da distribuição de seus dados, para a sua primeira pergunta da pesquisa, se ele tiver dados numéricos medidos na ordinal, intervalo ou nível de razão. Ou seja, estimar se os seus dados para cada variável são Normal ou não-normal na distribuição.

Siga a árvore de decisão para determinar o que as estatísticas a utilizar para a sua primeira pergunta da pesquisa.

Repita Aplicação Passos 2 a 5 para cada uma de suas perguntas de pesquisa.

dicas avisos

  • Não hesite em trabalhar com um consultor estatístico no planejamento ou cálculo das estatísticas.
Compartilhar em redes sociais:

Similar