Efecto del número de opciones de respuesta en las propiedades psicométricas de cuatro escalas psicosociales

Autores/as

  • Nazira Calleja Universidad Nacional Autónoma de México
  • Félix Javier Reskala Sánchez Universidad Nacional Autónoma de México
  • Liliana Rivera-Fong Universidad Nacional Autónoma de México
  • Diana Buenrostro Mercado Universidad Nacional Autónoma de México

Palabras clave:

Número de opciones de respuesta, escalas Likert, psicometría, confiabilidad, validez

Resumen

Las escalas psicosociales son utilizadas profusamente en estudios de muy diversos campos. Sin embargo, la investigación psicométrica no ha sido concluyente respecto del número de opciones de respuesta que resulta óptimo en la medición de un constructo. El objetivo del presente estudio fue comparar las propiedades psicométricas de cuatro escalas psicosociales empleando diferente número de opciones de respuesta. Los participantes (757 estudiantes universitarios) fueron asignados a uno de tres grupos independientes para responder a una batería integrada por cuatro escalas cortas, que evaluaban gratitud, optimismo, bienestar subjetivo y soledad, con cinco, seis o siete opciones de respuesta. Se encontró una asociación positiva entre el número de opciones y la calidad psicométrica de las escalas. La mayor variabilidad (dispersión) se observó en las versiones de seis y siete opciones; asimismo, en estas versiones los índices de consistencia interna y los porcentajes de varianza explicada fueron los más altos. Se concluyó que el uso de seis y siete opciones de respuesta, específicamente en escalas psicométricas breves y unidimensionales, ofrece mediciones más precisas, en comparación con las de cinco. Se discuten las implicaciones de estos hallazgos.

Citas

Aiken, L. R. (1983). Number of response categories and statistics on a teacher rating scale. Educational and Psychological Measurement, 43(2), 397-401. doi: 10.1177/001316448304300209

Allen, E., & Seaman, C. (2007). Likert scales and data analyses. Quality Progress, 40(7), 64-65. Recuperado de: http://rube.asq.org/quality-progress/2007/07/statistics/likert-scales-and-data-analyses.html

Boote, A. S. (1981). Reliability testing of psychographic scales. Journal of Advertising Research, 21(5), 53-60. doi: http://psycnet.apa.org/record/1982-04609-001

Calleja, N. y Almazán, T. (en prensa). Escala de Bienestar Subjetivo (EBS-20 y EBS-8): Construcción, validación e invarianza de medición. Revista Iberoamericana de Diagnóstico y Evaluación Psicológica.

Carver, C. S., Scheier, M. F., & Segerstrom, S. C. (2010). Optimism. Clinical Psychology Review, 30(7), 879-889. doi: 10.1016/j.cpr.2010.01.006

Chang, L. (1994). A psychometric evaluation of 4-point and 6-point Likert-type scales in relation to reliability and validity. Applied Psychological Measurement, 18(3), 205-215. doi: 10.1177/014662169401800302

Cicchetti, D.V., Showalter, D., & Tyrer, P.J. (1985). The effect of number of rating scale categories on levels of inter-rater reliability: A Monte Carlo investigation. Applied Psychological Measurement, 9(1), 31-36. doi: 10.1177/014662168500900103

Comrey, A. (1988). Factor-analytic methods of scale development in personality and clinical psychology. Journal of Consulting and Clinical Psychology, 56(5), 754-761. doi:10.1037/0022-006X.56.5.754

Croasmun, J. & Ostrom, L. (2011). Using Likert-type scales in the Social Sciences. Journal of Adult Education, 40(1), 19-22. https://files.eric.ed.gov/fulltext/EJ961998.pdf

Cummins, R. A. & Gullone, E. (2000). Why we should not use 5-point Likert scales: The case for subjective quality-of-life measurement. In Proceedings of the Second International Conference on Quality of Life in Cities (pp. 74-93). Kent Ridge, Singapore: National University of Singapore.

Dawes, J. (2008). Do data characteristics change according to the number of scale points used? An experiment using 5-point, 7-point and 10-point scales. International Journal of Market Research, 50(1), 61-104. doi: 10.1177/147078530805000106

DeVellis, R. F. (2017). Scale development: Theory and applications. (4th ed.). Los Angeles, CA: Sage.

Diener, E. & Diener, C. (1996). Most people are happy. Psychological Science. 7(3), 181-185. doi: 10.1111/j.1467-9280.1996.tb00354.x.

Diener, E. (2006). Guidelines for national indicators of subjective wellbeing and ill being. Journal of Happiness Studies, 7(4), 397-404. doi: 10.1007/s10902-006-9000-y

Domínguez, S. A. (2013). ¿Ítems politómicos o dicotómicos? Un estudio empírico con una escala unidimensional. Revista Argentina de Ciencias del Comportamiento, 5(3), 30-37. Recuperado de: https://revistas.unc.edu.ar/index.php/racc/article/view/5562/Lara.

Fornell, C., & Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39-50. doi: 10.2307/3151312

Furr, R. M. (2018). Psychometrics: An introduction. (3rd. Edition). Los Angeles, CA: Sage.

Garner, W. (1960). Rating scales, discriminability and information transmission. Psychological Review, 67(6), 343-352. doi: 1037/h0043047

González, M., & Andrade, P. (2016). Escala de Bienestar Psicológico para Adolescentes. Revista Iberoamericana de Diagnóstico y Evaluación - e Avaliação Psicológica, 42(2), 69-83. doi: 10.21865/ridep42_69

Green, P. & Rao, V. (1970). Rating scale and information recovery: How many scales and response category to use? Journal of Marketing, 34(3), 33-39. doi: 10.2307/1249817

Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(1), 1-55. doi: 10.1080/10705519909540118

Maeda, H. (2015). Response option configuration of online administered Likert scales. International Journal of Social Research Methodology, 18(1), 15-26. doi: 10.1080/13645579.2014.885159

Martínez, F. & Rodríguez, M. J. (2017). Comportamiento de las correlaciones producto-momento y tetracórica-policórica en escalas ordinales: Un estudio de simulación. Relieve, 23(2), 11-19. doi: 10.7203/relieve.23.2.9476

Leung, S. (2011). A Comparison of psychometric properties and normality in 4-, 5-, 6-, and 11-point Likert scales. Journal of Social Service Research, 37(4), 412-421. doi: 10.1080/01488376.2011.580697

López, J. (2005). Items politómicos vs. dicotómicos: un estudio metodológico. Anales de Psicología, 21(2), 339-344. Recuperado de: http://www.redalyc.org/html/167/16721216/

Lozano, L., García-Cueto, E. & Muñiz, J. (2008). Effect of the number of response categories on the reliability and validity of rating Scales. Methodology, 4(2), 73-79. doi: 10.1027/1614-2241.4.2.73

Maydeu-Olivares, A., Fairchild, A., & Hall, A. (2017). Goodness of fit in item factor analysis: Effect of the number of response alternatives. Structural Equation Modeling, 24(4), 495–505. doi:10.1080/ 10705511.2017.1289816

Mills, G. E., & Gay, L. R. (2016). Educational research: Competencies for analysis and applications. Upper Saddle Ridge, NJ: Pearson.

McCullough, M. E., Emmons, R. A., & Tsang, J. A. (2002). The grateful disposition: A conceptual and empirical topography. Journal of Personality and Social Psychology, 82(1), 112-127. doi:10.1037//0022-3514.82.1.112

McKelvie, S. J. (1978). Graphic rating scales. How many categories? British Journal of Psychology, 69, 185–202. doi:10.1111/j.2044-8295.1978.tb01647.x

Miles, J. & Shevlin, M. (2011). Applying regression & correlation: A guide for students and researchers. Los Angeles, CA: Sage.

Montero, M. E. y Sánchez, J. J. (2001). La soledad como fenómeno psicológico: Un análisis conceptual. Salud Mental, 24(1), 19-27. Recuperado de: http://www.medigraphic.com/pdfs/salmen/sam-2001/sam011d.pdf

Montero, M. E. (1998). Soledad: Desarrollo y validación de un inventario multifacético para su medición. (Tesis de Doctorado). Recuperado de: http://132.248.9.195/pdbis/269524/Index.html

Nunnally, J. & Bernstein, I. (1994). Psychometric theory. New York: McGraw-Hill.

Pedrosa, I., Celis-Atenas, K., Suárez-Álvarez, J., García-Cueto, E., & Muñiz, J. (2015). Cuestionario para la evaluación del optimismo: Fiabilidad y evidencias de validez. Terapia psicológica, 33(2), 127-138. doi: 10.4067/S0718-48082015000200007

Preston, C. & Colman, A. (2000). Optimal number of response categories in rating scales: reliability, validity, discriminating power, and respondent preferences. Acta Psychologica, 104(1), 1-15. doi: 10.1016/S0001-6918(99)00050-5

Ramsay, J. O. (1973). Effects of number of categories in rating scales on precision of estimation of scale values. Psychometrika, 38, 513–532. doi: 10.1007/BF02291492

Revilla, M., Saris, W., & Krosnick, J. (2014). Choosing the number of categories in Agree–Disagree Scales. Sociological Methods & Research, 43(1), 73-97. doi: 10.1177/0049124113509605

Schmidt, C. (2008). Construcción de un cuestionario de emociones positivas en población entrerriana. Revista Iberoamericana de Diagnóstico y Evaluación – e Avaliação Psicológica, 26(2), 117-139. Recuperado de: http://www.redalyc.org/html/4596/459647347007/

Schuts, H. & Rucker, M. (1975). A comparison of variables configuration across scale lengths: an empirical study. Educational and Psychological Measurement, 35(2), 319-324. doi: 10.1177/001316447503500210

Simms, L. J., Zelazny, K., Williams, T. F., & Bernstein, L. (2019). Does the number of response options matter? Psychometric perspectives using personality questionnaire data. Psychological Assessment, 31(4), 557-566. doi: 10.1037/pas0000648

Stevens, S. (1946). On the theory of scales of measurement. Science, 103, 677-680. Recuperado de: http://gaius.fpce.uc.pt/niips/novoplano/mip1/mip1_201314/scales/Stevens_1946.pdf

Stevens, S. (1957). On the psychophysical law. Psychological Review, 64(3), 153-181. doi: 10.1037/h0046162

Streiner, D., Norman, G., & Cairney, J. (2015). Health measurement scales: A practical guide to their development and use. (5ª ed.). Oxford: Oxford University Press.

Wakita, T., Ueshima, N., & Noguchi, H. (2012). Psychological distance between categories in the Likert scale. Educational and Psychological Measurement, 72(4), 533-546. doi: 10.1177/0013164411431162

Weng, L. J. (2004). Impact of the number of response categories and anchor labels on coefficient α test-retest reliability. Educational and Psychological Measurement, 64, 956-972. doi: 10.1177/0013164404268674

Descargas

Publicado

2019-11-26

Número

Sección

Investigación empírica y análisis teórico