Análise de dados em pesquisa

Análise de dados em pesquisa

O pesquisador de qualquer disciplina é confrontado com o problema do que fazer com os dados depois de coletados. A massa de dados pode ser tão grande que o pesquisador não consegue colocá-los todos na forma como foram coletados em seu relatório.

Muitos dos dados devem ser reduzidos a uma forma adequada para análise, para que um conjunto conciso de conclusões ou descobertas possa ser relatado a um público científico.

Na tentativa de analisar os dados, devemos primeiro decidir

  • Se a tabulação dos dados será realizada manualmente ou por computador
  • Como a informação pode ser convertida em um formato que permita seu processamento eficiente e
  • Quais ferramentas ou métodos estatísticos serão empregados

Nos últimos tempos, os computadores tornaram-se uma ferramenta essencial para a tabulação e análise de dados de inquéritos.

Mesmo em estudos de pequena escala que empregam procedimentos estatísticos relativamente simples, a tabulação por computador é encorajada para um tratamento fácil e flexível dos dados.

Micro e laptops podem produzir tabelas de qualquer dimensão e realizar operações estatísticas com muito mais facilidade e geralmente com muito menos erros do que seria possível manualmente.

Supondo que o banco de dados seja grande e que o processamento dos dados seja realizado por computador, abordaremos as seguintes questões principais na tarefa de análise de dados:

  • Preparação de dados que inclui;
    • edição,
    • codificação e
    • entrada de dados.
  • Explorar, exibir e examinar dados que envolvem quebrar, examinar e reorganizar dados para procurar descrições, padrões e relacionamentos significativos.

Edição

A primeira etapa habitual na análise é editar os dados brutos. A edição detecta erros e omissões, corrige-os sempre que possível e certifica que os padrões mínimos de qualidade dos dados são alcançados.

A responsabilidade do editor é garantir que os dados sejam;

  1. preciso,
  2. consistente com a intenção da pergunta ou outras informações,
  3. inserido uniformemente,
  4. completo, e
  5. organizados para simplificar a codificação e a tabulação.

A edição dos dados pode ser realizada de duas formas: edição em campo e edição interna, também chamada de edição central.

Edição de campo é a edição preliminar dos dados por um supervisor de campo no mesmo dia da entrevista. Seu objetivo é identificar omissões técnicas, verificar a legibilidade e esclarecer respostas que sejam lógica ou conceitualmente inconsistentes.

Quando existem lacunas nas entrevistas, deve ser feita uma chamada de retorno em vez de adivinhar o que o entrevistado “provavelmente teria dito”.

Uma segunda tarefa importante do supervisor é entrevistar novamente alguns entrevistados, pelo menos sobre algumas questões pré-selecionadas, como verificação de validade. Em central ou edição interna, todos os questionários passam por uma edição minuciosa. É um trabalho rigoroso executado pela equipe do escritório central.

Codificação

Codificação é o processo de atribuição de números ou outros símbolos às respostas, para que as respostas possam ser agrupadas em um número limitado de classes ou categorias. A codificação ajuda o pesquisador a reduzir vários milhares de respostas a algumas categorias contendo as informações críticas destinadas à pergunta feita.

A codificação numérica pode ser incorporada na preparação do próprio questionário, o que chamamos pré-codificação ou após o questionário ter sido aplicado. As perguntas respondidas, que chamamos pós-codificação.

A pré-codificação é necessariamente limitada principalmente a questões cujas categorias de resposta são conhecidas antecipadamente.

Estas são principalmente questões fechadas (como sexo, religião) ou perguntas cuja resposta já é um número e, portanto, não precisa ser convertida (como idade, número de filhos).

A pré-codificação é particularmente útil para a entrada de dados porque torna desnecessária a etapa intermediária de preenchimento de uma folha de codificação. Os dados são acessíveis diretamente do questionário.

Um entrevistado, entrevistador, supervisor de campo ou pesquisador (dependendo do método de coleta de dados) pode atribuir respostas numéricas apropriadas ao instrumento, marcando-o ou circulando-o no local de codificação adequado.

A principal vantagem da pós-codificação sobre a pré-codificação é que a pós-codificação permite ao codificador verificar quais respostas são dadas pelo respondente antes de iniciar a codificação.

Isto pode levar a uma grande simplificação. A pós-codificação também permite ao pesquisador codificar múltiplas respostas para uma única variável, escrevendo um número de código diferente para cada combinação de respostas dadas.

A codificação, seja pré ou pós, é um procedimento de duas partes que envolve;

  1. escolha de um número diferente para cada categoria de resposta possível; e
  2. escolha da coluna ou colunas apropriadas na placa do computador que conterá os números de código para essas variáveis.

A codificação dos dados sacrifica alguns detalhes dos dados, mas é necessária para uma análise eficiente. Em vez de solicitar a palavra muçulmano ou cristão para uma pergunta que pede a identificação da religião de alguém, poderíamos usar o código “M” ou “C”.

Normalmente esta variável seria codificada 1 para muçulmanos e 2 para cristãos. Os códigos do tipo “QI” ou “VI” são chamados de códigos alfanuméricos. Quando são usados ​​exclusivamente números (por exemplo, 1, 2, etc.), os códigos são numéricos.

Codebook e sua construção

O livro de códigos é um tipo de livreto compilado pelo pessoal da pesquisa que informa o significado de cada código de cada pergunta de um questionário.

Por exemplo, o livro de códigos pode revelar que para a pergunta número 10, o homem é codificado 1 e a mulher 2.

O livro de códigos é usado pelo pesquisador como um guia para tornar a entrada de dados menos propensa a erros e mais eficiente. É também o

a fonte definitiva para localizar as posições das variáveis ​​no arquivo de dados durante a análise.

Se um questionário puder ser completamente pré-codificado, com um código de borda indicando a localização da variável no arquivo de dados, então um livro de códigos separado não será necessário e um questionário em branco poderá ser usado como livro de códigos.

Contudo, particularmente para a pós-codificação e para perguntas abertas que recebem muitas respostas, não há espaço suficiente no questionário para identificar todos os códigos.

O seguinte é um exemplo da parte de um livro de códigos.

Exemplo de livro de códigos

Pergunta não.Localização da colunaNúmero variávelDescrição da variávelNome variável
1-3V101Número do entrevistado

Autocódigo 999 = Ausente

EU IA
4V102Local de residência: l=Rural 2=Urbano 9=DesaparecidoRES
25V103Sexo do entrevistado: l=Masculino 2=Feminino 9=DesaparecidoSEXO
36-7V104Idade:

Autocódigo
99=Faltando

IDADE
48V105Estado civil: l=Solteiro 2=Casado 3=Viúvo 4=Divorciado 5=Separado 9=DesaparecidoCONJUGAL

Codificação de não respostas

A não resposta (ou casos omissos) ocorre como resultado da falha em fornecer qualquer resposta a uma pergunta, e estes são inevitáveis ​​em qualquer questionário.

Deve-se tomar cuidado para evitar não respostas, mas se estas ocorrerem, o pesquisador deve elaborar algum esquema para codificá-las, de preferência um esquema padrão para que o mesmo código possa ser usado para não respostas, independentemente da questão específica.

Um código numérico deve ser atribuído a uma não resposta.

Os números usados ​​com mais frequência para não respostas são 0 e 9. Para variáveis ​​que exigem mais de uma coluna, o número é meramente repetido para cada coluna (por exemplo, 99, 999).

Qualquer código numérico é satisfatório para não resposta, desde que não seja um número que possa ocorrer como resposta legítima.

Por exemplo, se pedir ao entrevistado para listar o número de crianças na sua família, não deverá usar 9 para não resposta porque não conseguirá distinguir uma não resposta de uma família de nove filhos.

Além dos itens sem resposta, também pode ser necessário atribuir um código para respostas “não sei” abreviadas como “NS” e para respostas “não aplicável (NA)”, onde a pergunta não se aplica a um respondente específico. As respostas 'não sei' são frequentemente codificadas como 'O' ou 'OO'.

Entrada de dados

Após o término da codificação, o próximo passo é inserir as informações codificadas em um arquivo, que pode ser armazenado em a disco, disquete ou fita.

Se os questionários forem pré-codificados, incluindo codificação de borda para indicar as colunas adequadas no arquivo de dados para cada variável, os códigos poderão ser extraídos diretamente dos questionários.

Isto é aconselhável, se possível, pois economiza trabalho administrativo, o que não só custa tempo e dinheiro, mas também oferece potencial para erros adicionais.

Contudo, se o questionário tiver sido pós-codificado e se os códigos forem complicados e exigirem um livro de códigos extenso, será difícil ou impossível trabalhar diretamente a partir dos questionários. Nesse caso, um procedimento padrão é dividir a tarefa de construção do arquivo de dados em duas operações separadas;

  1. ler os questionários e o livro de códigos e transferir os códigos numéricos corretos para cada pergunta para uma transcrição ou folha de transferência, e
  2. inserir os dados no computador através de um terminal de computador.

Até muito recentemente, o uso de cartões perfurados era a forma mais comum de inserir dados em computadores.

Este sistema praticamente desapareceu. Nos últimos tempos, muitos computadores permitem a entrada de dados de formulários de digitalização óptica. Nos exames, os examinandos escurecem pequenos círculos, elipses ou conjuntos de linhas paralelas para escolher uma resposta do teste.

Os scanners ópticos processam os questionários marcados e armazenam as respostas em um arquivo de dados brutos no computador. Alguns questionários são agora desenvolvidos, que possuem formulários de digitalização óptica como folhas de respostas, ou o próprio questionário pode ser sobreposto a um formulário de digitalização óptica.

Se for esse o caso, o pesquisador não precisará transferir os dados para os formulários.

Esta tecnologia foi adotada por criadores de questionários para a coleta de dados mais rotineira. Reduz o número de vezes que os dados são manipulados, reduzindo assim o número de erros introduzidos.

Além do procedimento acima, a entrada pelo teclado continua sendo um pilar para pesquisadores que precisam criar um arquivo de dados imediatamente e armazená-lo em um espaço mínimo em uma variedade de mídias.

Para este procedimento, deve-se pegar seus dados codificados, sentar-se em um terminal de computador e inserir seus dados no teclado do terminal, caso a caso. Depois que os dados forem inseridos, podemos obter uma listagem do computador com o que você inseriu e verificar a lista com os dados codificados originais.

Resposta do teclado do telefone é outra capacidade possibilitada por computadores conectados a linhas telefônicas.

Usando o teclado do telefone (toque um), o entrevistado responde às perguntas pressionando o número apropriado.

O computador captura os dados “escutando”, decodificando o sinal elétrico do tom e armazenando a resposta numérica ou alfabética em um arquivo de dados.

Hoje em dia, Leitores de código de barras são amplamente utilizados nos negócios. Esta tecnologia pode ser usada para simplificar o papel do entrevistador como registrador de dados.

Em vez de escrever ou digitar informações sobre os entrevistados e suas respostas à mão, o entrevistador pode passar um código de barras sobre os códigos apropriados. Os dados são registrados em uma unidade pequena e leve para tradução posterior.

Transformação Variável

Muitas vezes é necessário transformar ou modificar dados para análises posteriores. É o processo de mudança de dados de sua forma original para um formato que melhor suporte a análise de dados para alcançar objetivos de pesquisa.

Muitos investigadores acreditam que o enviesamento das respostas será menor se os entrevistadores perguntarem aos entrevistados o seu ano de nascimento e não a sua idade, embora o objectivo da análise dos dados seja investigar a idade dos entrevistados em anos.

Os dados brutos codificados como ano de nascimento podem ser facilmente transformados para a idade atual subtraindo o ano de nascimento do ano atual.

Como este cálculo pode ser feito com mais facilidade e precisão pelo computador do que manualmente, ele deve ser feito durante o análise de dados fase e não durante a codificação.

Recolher ou combinar categorias adjacentes de uma variável é uma transformação de dados comum que reduz o número de categorias, e toda essa transformação pode ser feita no computador em qualquer estágio da análise. Por exemplo, anos únicos de idade (como 0, 1,..) podem ser recolhidos e transformados em categorias de idade 0-4, 5-9, 10-14, etc.

Uma das desvantagens deste processo de colapso é que a identidade individual das observações é permanentemente perdida.

Para evitar isto, é, no entanto, aconselhável criar uma nova variável a partir da antiga, mantendo a variável original.

Em qualquer caso, a variável original deve ser mantida e a variável transformada deve receber um novo nome para que você possa fazer outras transformações sempre que necessário.

Calculando uma nova variável

Às vezes, é necessário calcular uma nova variável combinando duas ou mais variáveis ​​para análise.

Suponha que, para um indivíduo, você registrou o número de filhas (x1) e o número de filhos (x2) ele ou ela tem.

Você deseja combinar essas duas variáveis ​​em uma única variável (x), que denota o número total de filhos que o indivíduo tem, tal que x=x1+x2.

Ao calcular uma nova variável, você pode fazer adição, subtração, multiplicação e divisão com uma ou mais variáveis ​​originais.

Para calcular sua margem de lucro P, você pode subtrair o valor de compra (Y) do valor de vendas (X). P=XY. P é, portanto, sua variável computada. Todas essas operações podem ser facilmente realizadas por um programa de computador em qualquer estágio da análise de dados.

Recodificação de dados

A recodificação é um procedimento de manipulação comum que você precisa adotar ao configurar sua variável para análise.

O objetivo do registro é geralmente reduzir o número de categorias em uma variável para uma forma mais gerenciável para análise numérica.

Suponha, por exemplo, que você tenha codificado a religião da seguinte forma:

Muçulmano=1, Hindu=2, Cristão=3, Budista=4, Outros=5

Suponhamos que uma série de frequências mostre que cristãos, budistas e a categoria “outros” juntos constituem apenas uma pequena proporção do todo. Nesse caso, você está convencido de que a análise separada dos seus dados por essas categorias sub-representadas pode não ser significativa.

Nesse caso, você ficará tentado a combinar essas três categorias e atribuir um novo código ‘3’.

Qual é o principal desafio enfrentado pelos pesquisadores após a coleta de dados?

Após a recolha de dados, os investigadores são confrontados com o desafio de processar e analisar a vasta quantidade de dados para apresentá-los de forma concisa e significativa, adequada para reportar a um relatório científico. público.

Por que os computadores são considerados ferramentas essenciais para tabular e analisar dados de pesquisas?

Os computadores são essenciais para tabular e analisar dados de inquéritos porque podem produzir tabelas de qualquer dimensão, realizar operações estatísticas mais facilmente e, geralmente, com muito menos erros do que os métodos manuais, tornando o processamento de dados eficiente e flexível.

Qual é o propósito de editar dados brutos em pesquisa?

A edição de dados brutos detecta erros e omissões, corrige-os sempre que possível e garante que os dados atendam aos padrões mínimos de qualidade. Ele garante que os dados sejam precisos, consistentes, inseridos uniformemente e organizados para simplificar a codificação e tabulação subsequentes.

O que é codificação no contexto da análise de dados e por que é necessária?

Codificação é o processo de atribuição de números ou outros símbolos às respostas, permitindo que as respostas sejam agrupadas em um número limitado de classes ou categorias. Ajuda a reduzir inúmeras respostas a algumas categorias que contêm as informações críticas destinadas à pergunta feita.

Qual é a diferença entre pré-codificação e pós-codificação?

A pré-codificação atribui códigos numéricos às respostas quando o questionário está sendo preparado, principalmente para perguntas com categorias de respostas conhecidas. A pós-codificação atribui códigos após a aplicação do questionário, permitindo maior flexibilidade na codificação de respostas múltiplas ou inesperadas.

Como são tratadas as não respostas ou os casos omissos na análise dos dados?

As não respostas são inevitáveis ​​em qualquer questionário. A elas é atribuído um código numérico, geralmente 0 ou 9, para distingui-las das respostas legítimas. É tomado cuidado para garantir que o código de não resposta não possa ser confundido com uma resposta válida.

O que é transformação de variáveis ​​na análise de dados?

A transformação variável é o processo de alteração dos dados de sua forma original para um formato que melhor suporte a análise de dados para atingir os objetivos da pesquisa. Pode envolver operações como adição, subtração, multiplicação ou divisão em uma ou mais variáveis ​​originais.