CASO DE ESTUDIO
El problema de la consultoría está en la t
The problem of the consultancy is in the t
O Problema da Consultoria está no t
Julio César Alonsoa, Beatriz Eugenia Galloa
aCentro de Investigación en Economía y Finanzas, Universidad Icesi, Cali, Colombia
Autor para correspondencia:
Universidad Icesi, Calle 18 # 122-135, Pance,
Cali, Colombia
Correo electrónico: jcalonso@icesi.edu.co (J.C. Alonso).
Historia del artículo:
Recibido el 17 de agosto de 2012
Aceptado
el 16 de mayo de 2013
Resumen
El objetivo de este caso es reforzar la capacidad del lector de aproximarse de forma sistémica a un problema que requiere el uso de herramientas econométricas, en especial la regresión múltiple. Para ello, el problema se contextualiza en una empresa consultora que debe estimar una función de demanda y debe determinar qué pruebas de hipótesis deben hacerse para los coeficientes del modelo de regresión lineal estimado. Esta discusión toca un tema que parece darse por sentado, pero que refleja la necesidad de reflexionar acerca de las razones por las cuales se hace uso de una prueba t individual de 2 colas o de 1 cola y la relación con la teoría económica.
Palabras Clave: Modelo de regresión lineal, Pruebas t, Comparación entre modelos, Estimación de demanda.
Clasificación JEL: C01, C18
Abstract
This case of study aims to strengthen the ability of the reader to systematically solve issues that involve using econometric tools. We focus on the linear regression model. The problem is about the estimation of a demand curve, which leads to hypothesis testing for a linear regression model. The discussion deals with a problem that seems to be taken for granted, and it also mentions the importance of considering theoretical implications when using one- and two- tailed tests.
Keywords: Linear Regression Model, t-test, Model comparison, Demand estimation
JEL Clasificacion: C01, C18
RESUMO
O objectivo deste caso é reforçar a capacidade do leitor de aproximar-se de forma sistémica de um problema que requer a utilização de ferramentas econométricas, em especial na regressão múltipla. Para tal, o problema é contextualizado numa empresa consultora que deve calcular uma função de procura e deve determinar que provas de hipótese devem ser levadas a cabo para os coeficientes do modelo de regressão linear estimado. Esta discussão toca num tema que parece encarar-se como assente, mas que reflecte a necessidade de reflectir sobre as razões pelas quais se utiliza uma prova de t individual de duas listas ou de uma lista e a relação com a teoria económica.
Palavras-Chave: Modelo de regressão linear, Provas t, Comparação entre modelos, Estimativa de procura
Classificação JEL: C01, C18
1. Introducción
En este caso, se ejemplifican una serie de ''disputas'' que se presentan en una empresa de consultoría como consecuencia de una situación que se supondría bastante cotidiana en este negocio.
Primero, se presenta un breve contexto de la empresa consultora y la empresa que solicita el servicio de consultoría para mostrar los objetivos del estudio que se pide a la consultora. Se discuten algunos de los pasos que siguió la consultora antes de decidir el modelo que se ha de estimar y decidir la forma en que se muestran los resultados.
De esta manera, el caso permite traer a colación temas como la estimación y elección de un modelo de demanda lineal empleando regresión múltiple. No obstante, el problema principal del caso es el tipo de prueba t que se debe realizar para los coeficientes del modelo de demanda (regresión múltiple). Para dar solución a esta discusión, como ocurre naturalmente, se cuenta con fuertes limitaciones de información, y su solución depende de la capacidad de aproximarse de forma sistémica al problema. Este caso viene acompañado de un archivo que contiene los datos que permiten replicar todos los cálculos y realizar nuevos cálculos si se cree pertinente. Finalmente, se proveen salidas de 3 diferentes paquetes estadísticos (Easy Reg International, R y STATA) para los cálculos realizados.
2. Caso
Consultores S.A. es una empresa consultora colombiana, reconocida como una de las líderes en emplear métodos estadísticos para resolver problemas en las organizaciones de diversa índole. Dada su experiencia en el empleo de modelos econométricos, Green INC., una empresa estadounidense de ropa que está interesada en incursionar en el mercado colombiano, firmó un contrato con Consultores para que estime la demanda por blusas, camisas y camisetas ecológicas, que es el producto estrella de Green INC.
En especial, el departamento de mercadeo de Green está interesado en saber cómo se ven afectadas las unidades vendidas por el ingreso de las personas y, por supuesto, por el precio, para conformar una estrategia de mercadeo que esté en concordancia con las personas que realmente demandarían el producto.
Debido a que Consultores S.A. no tenía datos disponibles sobre el mercado de blusas, camisas y camisetas ecológicas, debió diseñar una encuesta en la que se preguntaba a las personas la cantidad de blusas, camisas y camisetas que estaban dispuestas a comprar con diferentes precios, tanto para ropa ecológica como para prendas de vestir convencionales.
Una vez diseñada la encuesta, el siguiente paso fue calcular el tamaño de la muestra necesario para que los datos fueran representativos en el ámbito nacional, y por lo tanto, poder inferir sobre la demanda en el ámbito nacional. Como los representantes de Green insistieron arduamente en que querían la mayor precisión posible en sus resultados, el tamaño de la muestra fue calculado de forma que fuera representativo de la población para un modelo de regresión lineal. Después de realizar los cálculos necesarios, se decidió que el tamaño de la muestra adecuado era de 30.886 personas.
El siguiente paso era decidir la forma funcional de la demanda que debía ser estimada. El equipo de consultores, involucrados directamente en este negocio, estuvo rápidamente de acuerdo con que debía tratarse de un modelo de regresión lineal en el que la variable dependiente fuera la cantidad demandada de prendas de vestir. También hubo acuerdo en que, de acuerdo con la teoría económica, las variables independientes que debían incluirse eran el ingreso mensual de la persona, el precio de las blusas, camisas y camisetas ecológicas y el precio de este tipo de prendas convencionales, así como de bienes sustitutos.
Sin embargo, no fue posible que los consultores del equipo de trabajo se pusieran de acuerdo sobre la forma funcional del modelo que debía ser estimado. Algunos defendían que lo mejor era usar un modelo convencional, con las variables en sus niveles, por considerarlo el de una interpretación más directa. Otros declaraban que era mejor usar un modelo log-log, de tal forma que las elasticidades implicadas en el modelo se pudieran leer directamente a partir de los coeficientes y que elasticidades fuesen constantes.
Finalmente, un grupo de consultores sénior, con mayor experiencia en estimación de modelos de demanda, afirmaron que era mejor usar un modelo semilog, de forma que se obtuvieran las semielasticidades de la demanda. Al entender que no era posible lograr un acuerdo entre los consultores del equipo, el gerente de la compañía ordenó que se estimaran todos los modelos, y que se optara finalmente por aquel que presentara el mejor ajuste, de acuerdo al R2 de los modelos. Esta decisión parecía satisfacer a todos los consultores líderes.
Esta pregunta fue solucionada rápidamente por el equipo de consultores, pero meses después, apareció una pregunta ''más complicada''. Un nuevo practicante de Consultores S.A. planteó una pregunta que a primera vista parecía obvia, pero tal vez no lo es.
Mientras el practicante construía la tabla para reportar los resultados de la estimación del modelo finalmente elegido, preguntó si debería emplear pruebas t de 1 cola o de 2 colas. Esta tabla iría en el informe presentado a los consultores líderes, quienes obtendrían las conclusiones finales a partir de ella.
El consultor BETA cree que la mayoría de las pruebas t (individuales) para una ecuación estimada por mínimos cuadrados ordinarios debería ser de 1 cola. La razón es que uno puede emplear la teoría económica o la lógica para ''contar la historia'' detrás del problema. Y en general, se termina esperando (de acuerdo con la teoría o la lógica) un coeficiente negativo o positivo.
Por el contrario, el consultor ALFA está convencido de que la mayoría de las pruebas t (individuales) para una ecuación estimada por mínimos cuadrados ordinarios debería ser de 2 colas. La razón, según este consultor, es que la teoría rara vez provee expectativas no ambiguas sobre el signo del efecto de la variable explicativa sobre la dependiente. Aun en el caso de una función de demanda, el consultor ALFA afirma que ''ni siquiera en ese caso podemos hablar de un signo claro esperado para el coeficiente asociado al precio, pues no podemos descartar la posibilidad de un bien Giffen''. Y adiciona, ''¿y qué tal con respecto al ingreso?, la teoría tampoco nos da un signo determinado para el efecto del ingreso sobre la demanda''.
Un tercer consultor, el consultor GAMMA, dice estar de acuerdo con el consultor ALFA, aduciendo que todos los programas que ha usado para estimar los modelos econométricos a lo largo de su vida reportan el valor-p de la prueba de 2 colas y nunca el de 1 de las colas. Argumentó que ''si todos los programas econométricos reportan los resultados de una prueba de 2 colas, ¿por qué Consultores debería llevarles la contraria?''.
Los libros de econometría no parecen resolver esta disputa. El practicante revisó varios libros de econometría, pero no encontró referencia a este tipo de discusión. Los textos hablan sobre cómo hacer una prueba de 1 o de 2 colas, pero eso no permite resolver la duda. Por ejemplo, encontró las siguientes citas:
• ''Although most hypotheses in regression analysis can be tested with
one-sided t-tests, two-sided t-tests are appropriate in particular situations''
(Studenmund, 2010, p. 135).
• Goldberger (1991, p. 73) al respecto dice : ''In some economic contexts, however, only one-sided alternatives are relevant''.
• Stock y Watson (2006, p. 154) escriben ''In practice, one-sided alternative
hypothesis should be used only where there is a clear reason for doing so. The
reason could come from economic theory, prior empirical evidence, or both''.
Así, la revisión bibliográfica no le ayudó al practicante a resolver su problema. El practicante continuó preguntando, pero ahora a los consultores de su grupo de trabajo. El primero de ellos le contestó:
''Si tus resultados (rechazar o no rechazar) dependen de si estás empleando una prueba de 1 o de 2 colas, entonces para empezar, tus resultados no son demasiado convincentes''. De hecho, argumenta este consultor, ''lo que uno lee, en los artículos de revistas y reportes técnicos, es que la tendencia es a reportar los valores p, más que una decisión de rechazar o aceptar una hipótesis. Esto hace que no tengas que resolver el problema que tienes. Así, uno le tira el problema al lector y él o ella tendrá que tomar la decisión''.
El segundo consultor del grupo involucrado replica que eso no resuelve el problema, pues ''si empleamos los valores p, aún sigue la misma pregunta, ¿debemos reportar los valores p de 1 cola o de 2 colas?'' El consultor junior agrega ''...por ejemplo, si el valor p de 1 cola es 0,06 y de 2 colas es 0,12, entonces ALFA y GAMMA reportarán en su tabla el valor p de 0,12 y BETA el de 0,06. BETA dirá que se puede rechazar la hipótesis nula y hasta pondrán dos '*' al lado de los coeficientes estimados, mientras que ALFA y GAMMA dirán que no se puede rechazar la hipótesis nula''.
Como ni el practicante ni el primer consultor junior parecían entender por completo este punto, el segundo consultor toma una hoja de papel y hace el gráfico que se muestra en la figura 1 para intentar explicar su punto. En gris coloreó las áreas que representan el valor p para una prueba de 2 colas, y luego sombreó con líneas negras el área de la distribución que corresponde al valor p de una prueba de hipótesis de cola superior.
Aun después de esta explicación el practicante no sabe qué hacer y el problema es que tiene 2 tablas cruciales por hacer para 2 reportes diferentes. La primera tabla se incluirá en el reporte para que los consultores obtengan sus conclusiones. La segunda se entregará en el reporte definitivo que recibirán las máximas directivas de Green INC. Los resultados a los que se enfrenta el estudiante se muestran en los anexos 1, 2 y 3.
3. Preguntas de discusión
• ¿Es adecuado el criterio que determinó el gerente de la compañía para
escoger el modelo que debía usarse para estimar la demanda? ¿Por qué usar o no
la facilidad para interpretar los resultados como criterio de decisión?
• De
acuerdo con el criterio elegido por el gerente, ¿cuál de los modelos se usó
finalmente en la elaboración del informe para Green INC.?
'' ¿Cuál debería ser
la política de la firma consultora de aquí en adelante, respecto a las pruebas
de hipótesis sobre los coeficientes de los modelos estimados? ¿Deberían usar 1 o
2 colas?
• ¿Qué debería hacer el practicante?
Bibliografía
Bierens, H. J. (2005). EasyReg International. University Park, PA: Pennsylvania State University.
Goldberger, A. S. (1991). A Course in Econometrics. Cambridge: Harvard University Press.
R Core Team. (2012). R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing.
StataCorp. (2011). Stata Statistical Software: Release 12. Texas: College Station.
Stock, J. H. & Watson, M. W. (2006). Introduction to Econometrics (2.a ed.). Londres: Pearson.
Studenmund, A. H. (2010). Using Econometrics: A Practical Guide (5.a ed.). Londres: Pearson.
Anexos
Anexo 1. Salida de la estimación en EasyReg
Anexo 1: Tablas A1 a A7
Anexo 1: Tablas A8 a A15
Anexo 2. Salida de la estimación en R Tabla A18
Anexo 2: Tablas A16 a A19
Anexo 3. Salida de la estimación en Stata Tabla A21
Anexo 3: Tablas A20 - A21