Revista de Ciencias Sociales (RCS)

Vol. XXVIII, No. 3, Julio - Septiembre 2022. pp. 142-159

FCES - LUZ ● ISSN: 1315-9518 ● ISSN-E: 2477-9431

Como citar APA: Rahmer, B., Garzón, H., y Solana, J. (2022). Aplicación de modelos de difusión y de series temporales para pronóstico de demanda agregada. Revista de Ciencias Sociales (Ve), XXVIII(3), 142-159.

Aplicación de modelos de difusión y de series temporales para pronóstico de demanda agregada

Rahmer, Bruno de Jesús*

Garzón Saénz, Hernando**

Solana Garzón, José***

Resumen

El amplio abanico de métodos cuantitativos utilizados para el pronóstico de demanda, constituyen herramientas técnicas invaluables que permiten vaticinar la ocurrencia de eventos futuros y brindar soporte al proceso de toma de decisiones en el contexto de la planificación y coordinación de procesos empresariales internos. Por tanto, se colige que la labor de proyectar la demanda de los bienes y servicios ofertados por unidades estratégicas de negocios sea una necesidad inexorable. En la presente investigación se traen a colación tres modelos de corte cuantitativo para pronosticar la demanda agregada en el contexto industrial cartagenero en Colombia, a saber, el modelo geométrico Browniano, el modelo ARFIMA y un modelo de espacio-estado resuelto via Filtro de Kalman. Los resultados arrojados indican que la eficiencia predictiva del modelo espacio de estado es significativamente superior a la de los demás modelos traídos a colación. Se concluye por tanto, que éste enfoque de modelado propuesto reproduce apropiadamente el comportamiento histórico de la característica de interés analizada, como es, la demanda.

Palabras clave: Modelos de difusión; modelo de espacio-estado; proceso de Wiener; pronóstico de demanda; demanda agregada.

* Doctorando en Economía, Finanzas y Computación. Master en Estadística. Productor Industrial. Ingenierio Industrial. Docente de la Facultad de Ingeniería en la Fundación Universitaria Tecnológico Comfenalco, Colombia. E-mail: brunodejesus.2509@gmail.com ORCID: https://orcid.org/0000-0003-1925-0432

** Doctorando en Ingeniería con Mención en Ingeniería Industrial en la Universidad Nacional Lomas de Zamora, Buenos Aires, Argentina. Magister en Administración de Empresas con especialidad en Gestión Integrada de la Calidad, Seguridad y Medio Ambiente. Ingeniero de Alimentos. Docente Investigador de la Facultad de Ingeniería en la Fundación Universitaria Tecnológico Comfenalco, Colombia. E-mail: hgarzons2019@gmail.com ORCID: https://orcid.org/0000-0002-5592-7298

*** Doctorando en Ingeniería mención en Ingeniería Industrial. Especialista en Gerencia de Producción y Calidad. Ingeniero Industrial. Docente de la Facultad de Ingeniería en la Fundación Universitaria Tecnológico Comfenalco, Colombia. Email: ingjosemsolanag@gmail.com

Recibido: 2022-03-11 · Aceptado: 2022-05-28

Application of diffusion and time series models for aggregate demand forecasting

Abstract

The wide range of quantitative methods used for demand forecasting constitute invaluable technical tools that allow predicting the occurrence of future events and providing support to the decision-making process in the context of planning and coordinating internal business processes. Therefore, it follows that the task of projecting the demand for goods and services offered by strategic business units is an inexorable necessity. In the present investigation, three quantitative models are brought up to forecast aggregate demand in the industrial context of Cartagena in Colombia, namely, the Brownian geometric model, the ARFIMA model and a state-space model resolved via the Kalman Filter. The results obtained indicate that the predictive efficiency of the state space model is significantly higher than that of the other models brought up. It is concluded, therefore, that this proposed modeling approach appropriately reproduces the historical behavior of the characteristic of interest analyzed, that is, the demand.

Keywords: Difussion model; state-space model; Wiener process, demand forecast; aggregate demand.

Introducción

Una amplia gama de modelos matemáticos han sido aplicados en dominio gerencial para efectos de una explotación eficiente de información de carácter económico-empresariales y el desarrollo de estrategias cuantitativas para el análisis de procesos productivos y logísticos que deben disponerse en el corto plazo para la elaboración de planes, así como estrategias cuyo objetivo ulterior sea el alcance del equilibrio entre la oferta y la demanda (Albey et al., 2015). Por ello, la aplicación de técnicas para el pronóstico de variables económicas y financieras es de capital importancia dada la incertidumbre involucrada en el proceso de planificación de ventas y operaciones.

Se colige, a partir de lo anterior, que la configuración de sistemas de pronóstico con estructuras analíticas definidas y que parten de la información histórica disponible es una fase invaluable en el proceso de planeación (Lao-León et al., 2017). Asimismo, permiten efectuar procesos de retroalimentación, así como también antemperar el impacto de las fluctuaciones de la demanda de un entorno altamente convulsivo y difuso como los mercados de bienes y servicios (Ortegón-Cortázar y Gómez, 2016). De este modo, es posible coordinar una sucesión lógica u ordenamiento específico de operaciones integradas en procura de maximizar el aprovechamiento de la masa crítica de factores productivos hasta la creación primaria de valor.

En la literatura especializada se ha propuesto una miríada de modelos de prospectivos, entre los cuales se hallan los métodos de proyección que parten de la información pasada disponible; los modelos de series de tiempo que predicen valores futuros para la variable de interés, basándose exclusivamente en patrones históricos de esa variable, suponiendo que su conducta permanecerá prácticamente invariante en la progresión temporal. Sin embargo, ha de acotarse que la influencia de factores exógenos, inducirá inexorablemente a que los modelos prospectivos disten de la tendencia real de la demanda, razón por la cual conviene evaluar otros componentes adicionales.

La aplicación de los métodos prospectivos anteriormente descritos, no sólo se restringe al análisis de series temporales y a subdominios tan diversos como el ámbito de las telecomunicaciones (Soubdhan et al., 2016), predicción de la volatilidad de activos financieros (Ramírez, Cristancho y Cleves-Leguizamo, 2021), o commodities (Kristjanpoller y Minutolo, 2016; Urdaneta y Borgucci, 2018; Izzeldin et al., 2019), y sistemas físicos (Chang, 2014).

En este paper se presenta un análisis comparativo entre tres métodos para la estimación de la demanda de un bien, a partir de la información histórica disponible de la demanda agregada en el clúster petroquímico plástico en Cartagena- Colombia. Los métodos contemplados son: El modelo geométrico browniano, el modelo de espacio de estados- resuelto mediante el conocido Filtro de Kalman-, y el modelo ARFIMA.

El primero, caracterizado por incorrelación y normalidad de la distribución de sus incrementos, corresponde a uno de los modelos profusamente utilizados para describir la evolución de variables económico-financieras. El modelo espacio de estados, entendido como una representación de un sistema que consta de inputs, outputs y variables de estado, relacionadas por ecuaciones diferenciales de orden infinito y que son combinadas en una ecuación diferencial matricial de primer orden. El modelo ARFIMA, en última instancia es un tipo de modelo fraccionalmente integrado capaz de exhibir dependencias significativas o comportamientos persistentes en el largo plazo.

Se acota que la utilidad de los métodos de pronóstico aquí traídos a colación estriba en su capacidad para determinar de modo anticipativo el balance de las capacidades, con el objetivo de evitar subutilizaciones o cuellos de botella en sistemas productivos localizados en este escenario geográfico donde se registran pocos o ningún estudio en tales áreas.

1. Metodología

En el estudio se contemplan diversas estrategias de modelización para predecir en el corto plazo la demanda de bienes de un sector petroquímico cartagenero. Debido a la heterogeneidad de la composición de los bienes ofertados éstos serán cuantificados en unidades agregadas, esto es, en términos monetarios. Los datos históricos son extraidos vía selección muestral no aleatorizada y corresponden al periodo 2010-2017.

A la postre, se reportan los resultados de la aplicación de tres modelos proyectivos con características bien distinguidas, previa validación de ciertos supuestos formales como lo son: Ausencia de dependencia serial en los datos recabados, verificación del supuesto de normalidad univariante, y estacionariedad de la serie temporal.

En primera instancia, se presentan los resultados del proceso geométrico browniano, un proceso aleatorio que describe con un elevado nivel de exactitud el comportamiento de ciertas variables aleatorias que se desplazan en el tiempo. Subsiguientemente, se trae a colación el modelo ARFIMA, siendo este un método referencia en el análisis de series temporales con dependencia a largo plazo. Estos tipos de modelos, permiten ajustar la dinámica a largo plazo, problema comúnmente asociado a los modelos ARMA, proporcionando una descripción más parsimoniosa de las series económicas o financieras.

En última instancia, se construye un modelo de espacio de estado que ofrece la posibilidad de capturar los dinamismos inherentes a las variables y obtener información de variables no observables (suponiendo que sigue un proceso Markov de primer orden) a partir de su relación con variables de las que si se dispone información. La hipótesis de partida es que ninguno de los métodos reportados ostenta ventaja comparativa respecto a los demás analizados. En la fase final, se reportan varios estimadores que tienen por objeto calcular la discrepancia entre los valores reales y pronosticados de la serie de ventas, así como también el uso de criterios de información con miras a evaluar la idoneidad de los modelos emplazados (Solera, 2000). A la posteridad, se explicitan los fundamentos teóricos y conceptuales de cada modelo.

1.1. Modelo de difusión de Wiener

Un proceso de Wiener, es un tipo de proceso estocástico con tiempo continuo. es un modelo de Wiener si es una función definida en algún intervalo . Tres propiedades caracterizan el proceso Wiener, que se enumeran a continuación: , esto es, que parte del origen. , la variable aleatoria es independiente de ,

El proceso de Wiener, es un tipo de proceso markoviano con media nula y varianza unitaria, es decir, la distribución de probabilidad de todos los valores futuros del proceso no dependen de su comportamiento pasado sino estrictamente de la información disponible actual, y es a partir de ésta que se realizan las estimaciones futuras o proyecciones.

La distribución de probabilidad de las variaciones del proceso de Wiener son independientes inter-termporalmente, denotados los pequeños intervalos de tiempo como Las variaciones en el proceso generadas en un intervalo finito de tiempo () se distribuyen normalmente, con una varianza que incrementa linealmente con el tamaño del intervalo temporal. Por consiguiente, (donde es una variable aleatoria del tipo ]). Bajo la asunción teórica que . La covarianza es:

Considérese por tanto, un proceso definido en el intervalo y una partición de de sub-intervalos equilongitudinales, se definen y e igualmente De este modo se obtiene:

Con ello en mente, el algoritmo de simulación de las trayectorias de un proceso de Wiener univariado con incrementos diminutos (para aproximarse de modo más realista a las realizaciones del proceso), puede trazarse como sigue:

1.

2. Obtener N muestras de una distribución

3. Hacer

a. Momentos del proceso de Wiener

La función de densidad de probabilidad de los incrementos del proceso de Wiener es par, entonces para y las esperanzas de las potencias impares son nulas. Así, los momentos de orden con son obtenidos como la expresión matemática posterior:

Por lo que se sigue que:

En otros términos, los momentos de valor absoluto de los incrementos del proceso de Wiener pueden ser definidos para y , .

Con la función doble factorial definida para argumentos pares e impares. Por otra parte, el modelo de movimiento geométrico browniano está basado en la ecuación diferencial estocástica tipo Itô:

Así, la solución de esta ecuación diferencial estocástica puede hallarse a través de la aplicación del Lema de Itô, de modo que:

Luego de la aplicación de un conjunto de operaciones se obtiene la solución:

Mientras tanto, la función media y la función varianza son respectivamente:

La integral de la ecuación diferencial estocástica que modeliza el comportamiento de la demanda está dada por:

Con la salvedad que puede ser expresada como . (Qin y Nembhard, 2012).

1.2. Modelo ARFIMA

Una técnica de pronóstico que se ha tornado en referente insoslayable en el análisis de series temporales con dependencia a largo plazo, son los de tipo ARFIMA. Estos tipos de modelos permiten ajustar la dinámica a largo plazo, problema comúnmente asociado a los modelos ARMA, proporcionando una descripción más parsimoniosa de las series económicas o financieras. Muchas series aparentemente no estacionarias suelen diferenciarse para conseguir una serie estacionaria. Sin embargo, la serie diferenciada se convierte en una serie en la cual se suprime el componente de bajas frecuencias, que es fundamental en las predicciones a largo plazo. Para modelar este tipo de series, la diferenciacion entera es excesiva, pero prescindir del proceso de diferenciación tampoco es propicio.

Desde una óptica estrictamente empírica, la propiedad de memoria larga suele relacionarse con la persistencia exhibida por las autocorrelaciones muestrales de ciertas series de tiempo estacionarias, que decrecen a un ritmo poco acelerado pero convergen hacia cero. El proceso ARFIMA proporciona una gran flexibilidad en la modelización del comportamiento dinámico de series económicas, puesto que permite describir simultáneamente las propiedades dinámicas en el largo plazo, a través del parámetro , y la correlación en el corto plazo, a través de los parámetros de la parte ARMA del modelo.

Dado un proceso estocástico estacionario estacionario y centrado, será un ARMA fraccional integrado o ARFIMA si y solo si, existe un proceso , números naturales, y números reales, tales que , o en su forma general:

Siendo el operador shift, y los polinomios y son respectivamente, los polinomios autorregresivos y de medias móviles de orden y de un proceso autorregresivo de medias móviles, cuyos ceros se localizan fuera del círculo unidad y no poseen raíces comunes. Por otra parte, se tiene el operador:

Los modelos ARFIMA , suelen tener una estructura de correlación de tipo cuando , es decir, que la función de autocorrelación decae hiperbólicamente y no es absolutamente sumable, que en otros términos, equivale a sostener que .

a. Estimador de Whittle

Consíderese el vector que sigue una distribución gaussiana con media nula y autocovarianza:

Siendo y está asociado con el set de parámetros del modelo definido en , La función de log-verosimilitud del proceso está dado por:

Siendo con Para el cálculo de la expresión anterior dos aproximaciones asintóticas para los términos y con la finalidad de obtener:

Como donde es el periodograma indicado anteriormente siendo igual a:

Así, una versión discreta de es actualmente la aproximación de la integral que es:

Donde son las frecuencias de Fourier. Ahora, para encontrar el estimador del vector de parámetros , se utiliza la minimización de . Esta función de minimización no lineal lleva a cabo una minimización de utilizando un algoritmo de tipo Newton-Raphson. En condiciones de regularidad, el estimador de Whittlê que maximiza la función de probabilidad versomilitud es consistente y se distribuye normalmente.

El procedimiento iterativo basado en la estimación tentativa del parámetro de diferenciación fraccional para la identificación de un modelo ARFIMA puede sumarizarse tal y como se percibe en a la postre:

1. Estimar el parámetro de diferenciación en el modelo ARFIMA , denotándose el estimador como .

2. Obtener la diferenciación fraccional

3. Utilizar el procedimiento de identificación de Box-Jenkins o a través del uso de criterios de información para identificar los valores y . Estimar los valores del proceso ARMA ,

4. Calcular la serie filtrada

5. Estimar el parámetro en el modelo ARFIMA . El actual valor del parámetro opera como estimador de .

6. Ejecutar los pasos 2 a 5 hasta que alcanzar la convergencia de los parámetros

1.3. Modelos de espacios de estados y filtro de Kalman

Los análisis empíricos ortodoxos intentan aislar el componente tendencial de una serie de tiempo, y determinar un conjunto de propiedades y regularidades de los ciclos de las misma. No obstante, aún es una “quaestio disputata” el definir qué propiedades de la tendencia y su relación con el componente cíclico reviste importancia singular para efectos investigativos. Dos vías se han abierto para abordar estas cuestiones: Partir de un marco teórico cohesivo para proveer una explanación sobre el mecanismo que origina las fluctuaciones exhibidas en las series temporales, o por otro lado, apelar al uso de técnicas estadísticas, permiten establecer el tipo de tendencia que una serie presenta y la relación exacta entre los componentes de tendencia y cíclico. El filtro de Kalman se circunscribe en la segunda vía de análisis (Vásquez, Restrepo y Lopera, 2010).

La técnica mentada antecedentemente, es un procedimiento recursivo para calcular el estimador óptimo del vector de estados al tiempo , con base en la información disponible al tiempo . La derivación del filtro de Kalman reposa bajo el supuesto que las innovaciones y el vector de estado inicial, están normalmente distribuidos (Pardo, 2015).

Sea entonces el estimador óptimo de tomando como base las observaciones hasta e incluyendo a y sea la matriz de error de cuadrado medio de ese estimador.

Así dados y , el estimador óptimo de vendrá dado por las ecuaciones de predicción:

,

Una vez que la información se torna disponible, el estimador se actualiza, las ecuaciones de actualización serán:

Siendo

Los valores iniciales del filtro de Kalman pueden expresarse como o también, . Ahora, reescrito el filtro de Kalman como un conjunto de recursiones que parten directamente de hacia queda que:

Siendo la matriz de ganancia que es igual a:

La recursión para la matriz de error cuadrado medio, está expresada por:

a. Estimación máximo verosímil y generación de pronósticos

Es consabido que la distribución condicional de sigue una distribución normal con media:

Y la matriz de covarianzas:

El vector de hiperparámetros para la representación espacio-estados quedará denotado por y por consiguiente, la función de verosimilitud como:

Siendo

El pronóstico para pasos posteriores para el estado es:

Mientras el pronóstico para pasos posteriores para la serie es:

En tanto que, la matriz de error cuadrático medio es:

La aplicación del filtro de Kalman puede sintetizarse en la siguiente secuencia cronológica y lógica de pasos (Morales-Velázquez, Aparicio y Valdés, 2014):

1. Generar un pronóstico del estado hacia adelante en el tiempo, tomando en cuenta toda la información disponible hasta ese momento, partiendo de la proposición inicial del estado y de la matriz de covarianza del error.

2. Corregir la proyección del estado (proceso de actualización con las mediciones). La primera tarea dentro de esta etapa es el cálculo de la ganancia de Kalman. Este factor de ponderación o ganancia se selecciona de tal forma que minimice la covarianza del error de la nueva estimación del estado, teniendo en cuenta tanto el error probable de las mediciones como la incertidumbre sobre la representación del estado del sistema.

3. Medir el proceso para obtener y entonces generar una nueva estimación del estado, incorporando la nueva medición.

4. Obtener una nueva estimación de la matriz de covarianza del error, para después valorar de nuevo el estado.

2. Resultados y discusión

Antes de proceder a la estimación y comparación de los modelos a construir, se reporta en la Tabla 1, un análisis descriptivo de la serie temporal a analizar. Para el caso presente se ha utilizado una periodicidad mensual y la demanda- tal y como se expuso en la sección de metodología- se expresa en términos monetarios. En ese tenor, se reporta la demanda media neta para cada periodo del último cuatrenio. Se relaciona además la desviación típica para cada uno de los periodos en mención.

Tabla 1

Análisis descriptivo de la serie temporal

PERIODO

DEMANDA MEDIA AGREGADA ($)

DESVIACIÓN ESTÁNDAR

COEFICIENTE DE VARIACIÓN

1

4876,6

814,9

16,71%

2

5985,7

881,7

14,73%

3

4874,7

854,9

17,54%

4

6777,2

888,8

13,11%

5

7675,2

902,3

11,76%

6

6700,7

927,8

13,85%

7

7600,0

894,6

11,77%

8

9690,2

871,6

8,99%

9

8701,0

801,6

9,21%

10

12800,4

826,2

6,45%

11

41000,1

928,5

2,26%

12

31000,3

902,9

2,91%

Fuente: Elaboración propia, 2022.

Si el coeficiente de variación de los datos reales de la demanda es superior a 20% se presume entonces, que ésta es de tipo probabilístico. Si además de ello, existe una diferencia escrutable entre los coeficientes de variación para cada periodo, se conjetura que la demanda no es de tipo estacionaria, tal y como se percibe en la Tabla 1. Esta clasificación de patrones de demanda es de singular importancia, pues antecede la fase de selección del modelo de pronóstico. Es incontrovertible el hecho que el comportamiento de los datos no es muy fluctuante aunque existen cambios considerables entre los coeficientes de variación entre los periodos analizados.

2.1. Constraste de hipótesis formales

En este apartado se realiza un análisis exploratorio de la serie temporal analizada. La primera hipótesis que se sostiene es que la serie puede ser modelada por una distribución normal con parámetros (μ,σ). En el gráfico combinado I, se reporta el histograma que es un gráfico de la representación de distribuciones de frecuencias, en el cual se emplean rectángulos dentro de unas coordenadas. Sobre la gráfica se superpone una traza de densidad normal. En la parte inferior se reportan los resultados del procedimiento de Kolmogorov-Smirnov para la variable continua analizada. Este test compara la función de distribución acumulada observada de una variable cualquiera con una distribución teórica determinada, en este caso la distribución normal.

Fuente: Elaboración propia, 2022.

Gráfico I: Histograma y Test de Normalidad

Conviene acotar que la prueba Kolmogórov-Smirnov es más sensible frente a los valores próximos a la mediana de la distribución de datos, que a los extremos de la distribución. La hipótesis nula es que los datos siguen una distribución establecida a priori. El estadístico del test no paramétrico de Kolgomorov-Smirnov para dos colas se reduce a la expresión:

Esta es equivalente a la diferencia máxima entre la función de distribución muestral y la función de distribución especificada apriorísticamente en la hipótesis nula. Dado que el valor P asociado a la prueba es superior a 0,05, no es posible objetarse la idea que los datos proceden de una distribución normal con parámetros y .

A través de la aplicación del test de Box-Pierce, se prueba la hipótesis conjunta que todos los hasta ciertos retardos, son simultáneamente nulos. El estadístico de la prueba está dada por:

Si una muestra es puramente aleatoria, es decir, ruido blanco, se cumple la condición que los coeficientes de autocorrelación siguen, aproximadamente una distribución normal con media 0 y varianza tal y como se percibe en:

Puede comprobarse, en la Tabla 2, que en efecto, los son no significativos. Los desfases reportados corresponden al punto temporal que separa los datos cronológicamente ordenados. El valor de Chi-cuadrado, es utilizado para calcular el valor p, y contrastar formalmente la hipótesis que los residuos son independientes. Dado que el p valor en la totalidad de rezagos es mayor a 0,05 se colige que el supuesto de aleatoriedad no se satisface a cabalidad.

Tabla 2

Resultado del Test de Box-Pierce

Resultados

Desfase

12

24

36

48

Chi-cuadrada

25,96

57,51

70,66

96,00

Grados de libertad

9

21

33

45

Valor p

0,002

0,000

0,000

0,000

Fuente: Elaboración propia, 2022.

El test de raíces unitarias de Dickey-Fuller Aumentado permite contrastar la hipótesis de estacionariedad en el proceso autorregresivo. Con cierta laxitud, puede aseverarse que una serie es estacionaria, en el sentido débil, si sus momentos de primer y segundo orden permanecen invariantes en el tiempo y son finitos, tal y como se muestra en:

y

En caso tal que se acepte la hipótesis de contención de raíz unitaria en la serie en niveles, se requiere de diferenciación de primer o orden para lograr la condición de estacionariedad. Al examinar los resultados arrojados en la Tabla 3, se concluye que la serie está integrada en I(0). El estadístico Dickey-Fuller Aumentado es superior a cada uno de los valores críticos de Mackinnon para los diferentes niveles de confianza allí establecidos; por tanto, se cumple que para su distribución conjunta permanece invariable y no requiere de diferenciaciones.

Tabla 3

Resultados de la Prueba de Dickey-Fuller aumentada

t-Statistic

Prob.*

Augmented Dickey-Fuller test statistic

-1.805762

0.7009

Test critical values:

1% level

-3.974528

5% level

-3.417865

10% level

-3.131380

Variable

Coefficient

Std. Error

t-Statistic

Prob.

Serie(-1)

-0.003039

0.001683

-1.805762

0.0715

D(Serie (-1))

0.460112

0.041723

11.02766

0.0000

D(Serie (-2))

0.133000

0.046100

2.885008

0.0041

C

694.6709

3.870530

1.795493

0.0731

@TREND(“1”)

47.44557

21.54907

3.201746

0.0000

Fuente: Elaboración propia, 2022.

El test de Dickey-Fuller en su versión ampliada, se efectúa bajo la hipótesis nula de la presencia de raíz unitaria en la serie, esto es, contra la alternativa que la serie es estacionaria en torno a una tendencia determinística . En caso tal de verificarse la ausencia de estacionariedad, es decir, rechazar la hipótesis de existencia de raíz unitaria, lo lógico sería transformar la serie de tiempo mediante la aplicación de diferencias.

Se proporcionan en la Tabla 3, los resultados de la aplicación de la prueba Dickey-Fuller Aumentada. Se confirma pues, que la serie no es estacionaria dado que el p-valor asociado al test es mayor que 0,05 y se concluye que sí hay presencia de raíz unitaria en el polinomio autorregresivo, es decir, que la serie está integrada en orden cero I(1). El resultado se valida en tanto que el estadístico de Durbin Watson es considerablemente menor que 2, refleja ausencia de correlación serial. Por tanto, no se pueden colocar en tela de juicio, las conclusiones obtenidas en este inciso, pues la aplicación del test de Dickey-Fuller aumentado es plausible. Nótese además, que el término “tendencia” es estadísticamente significativo, no así el intercepto.

Los resultados de la simulación de proceso de Wiener se reportan en la Tabla 4, permiten efectuar las predicciones a pasos, partiendo de ciertas condiciones iniciales proporcionadas por los datos históricos. Tal y como se explicó en apartados antecedentes, la expresión que gobierna el proceso es:

puede ser expresada como . El intercepto es , la demanda pico es mientras que la varianza viene dada por

Tabla 4

Resultados de la simulación del proceso de Wiener

PARÁMETRO

VALOR

LIMITE INFERIOR

LÍMITE SUPERIOR

493,124

489,932

496,878

193,420

190,575

197,999

71893,793

71891,844

71896,709

1198,361

1193,474

1202,493

5489,9124

Fuente: Elaboración propia, 2022.

A continuación en el Gráfico II, se reportan las predicciones generadas diez periodos adelante. Para pronosticar la conducta futura de una variable aleatoria, es menester construir un modelo y estimar sus parámetros usando datos históricos, es decir, logrando una caracterización estadística de los enlaces entre el presente y el pasado. En forma simple se usa el modelo estimado del pronóstico para extrapolar los datos observados.

Fuente: Elaboración propia, 2022.

Gráfico II: Predicciones generadas por el Modelo de Wiener

Para el caso que ocupa la demanda en un tiempo durante un ciclo de vida , luego será el cambio relativo de la demanda dentro de un intervalo de tiempo pequeño dado por Es evidente que varía en el tiempo, debido a la heterogeneidad del ratio de difusión. Con esto en mente se tiene que:

Siendo el parámetro el ratio de crecimiento esperado, la desviación estándar y representa la incertidumbre asociada al crecimiento. Cada variación en , denotadas por satisface la condición y para .

En la Tabla 5, se reportan los resultados de estimación del modelo a través del método de máxima verosimilitud exacta y atendiendo simultáneamente al criterio de información de Akaike. Dado que el orden de integración fraccional, la prevalencia de memoria larga en el modelo estimado no es patente. El coeficiente corresponde a los parámetros autorregresivos en forma vectorial, los parámetros de medias móviles en forma vectorial; no se contempla el parámetro estacional autorregresivo en forma vectorial, ni se reporta la periodicicidad de los componentes estacionales (Castaño, 2016).

Tabla 5

Resumen de la estimación del Modelo ARFIMA

Parametro

Coeficiente

Desviación estándar

Limite inferior

Limite superior

0,0652*

0,0666263

0,6584

-0,3120

0,8511*

0,0523593

1,6162

0,6687

Grados de libertad

0,2882

0,104559

0,5042

0,0657

1,6997*

0,0405761

2,0159

1,1123

-290,273*

-2872,9531

-298,3286

106,201*

103,6147

107,4044

0,4

Nota: * Significativo al 5% de Confianza

Fuente: Elaboración propia, 2022.

Los pronósticos con sus respectivos intervalos de confianza estimados a partir del modelo ARFIMA se reportan a la posteridad junto con el gráfico de autocorrelaciones, en el Gráfico III. El coeficiente de Hurst se obtiene por medio de la estimación del a través del método de máxima verosimilitud. El coeficiente de Hurst puede tomar valores en , y se relaciona con el orden de integración . Si como es el actual caso, la serie de tiempo no presenta memoria larga, no es antipersistente y los valores medios en el largo plazo regresan a su condicion inicial (reversión a la media) (Salazar-Núñez, Venegas-Martínez y Calderón-Villareal, 2017).

Fuente: Elaboración propia, 2022.

Gráfico III: Predicciones generadas por el Modelo ARFIMA

Nótese que para el caso analizado, las autocorrelaciones se ajustan a un proceso en cual se cumple la condición y por ello existe una constante tal que para un grande , lo que indica que la función de autocorrelación decae hiperbólicamente y no es absolutamente sumable, es decir, que no converge. En tanto, que se sigue que el proceso analizado es de tipo estacionario y la función de densidad espectral será:

El estimador muestral de la función de autocorrelación simple está dado por:

Mientras que el periodograma se calcula como:

El periodograma se define para ω = 0, este punto se excluye debido a que corresponde a la media de la muestra. Se evidencia, en la estructura del correlograma reportado, un decrecimiento exponencial de las autocorrealciones estimadas, y una cantidad considerable de ellas exceden los límites de confianza, siendo esto un indicativo de correlación serial entre las observaciones a un 95% de confianza. Posiblemente se trate de un proceso no estacionario de memoria larga con reversión a la media. En un proceso fraccionalmente integrado con , el efecto de un shock se amortigua progresivamente, y la serie revierte finalmente a su media, incluso en el instante temporal donde el proceso no es estacionario. El periodograma reportado inmediatamente muestra que al inicio del periodo existe unos picos significativos al inicio de la serie analizada.

En la primera etapa de estimación del flitro de Kalman se fijan de manera apriorística los valores iniciales de los hiperparámetros del modelo. A la postre, las ecuaciones del filtro son aplicadas a fin de obtener los valores de las innovaciones, esto es, los errores de predicción para un periodo hacia adelante. A partir de la descomposición del error de predicción es posible obtener el valor de la función de verosimilitud, una vez conocidos los valores de las innovaciones.

La especificación del modelo se ejecuta a partir de los algoritmos de subespacios, estiman el orden de una representación mínima. La identificabilidad se consigue fijando un sistema coordenado para los estados mediante la elección de una matriz invertible arbitraria. Este procedimiento de optimización numérica se aplica a fin de determinar si el valor de la función de verosimilitud es un máximo. Dado que esta última condición es verificada, el proceso de estimación de los hiperparámetros finaliza (Ramos, Clar y Suriñach, 2000; Izquierdo, Hernández y Pajares, 2004).

Los resultados obtenidos a través de la estimación máximo verosímil se reportan en la Tabla 6. Nótese que la tasa de aceptación del modelo es de 0. Los parámetros estimados corresponden a las varianzas de las innovaciones de las ecuaciones de medición y transición, así como otros parámetros que entran a la matriz . Tales parámetros seguirán un proceso autorregresivo. La distancia de Minkowski es utilizada para cuantificar la discrepancia entre las estimaciones con respecto al valor real de los parámetros. La convergencia es alcanzada luego de 12 iteraciones y se obtiene una solucion de estado estacionario

Tabla 6

Resultados del filtro de Kalman

Parámetros

Estimados

Error

P valor

Limite inferior

Límite superior

Distancia de Minkowski

0,5601

0,041

0,004

0,0469

0,0591

0,2101

0,0043

0,056

0,002

0,0032

0,0506

0,0302

0,010

0,001

0,0287

0,0405

Fuente: Elaboración propia, 2022.

Para este caso el ruido del sistema es 0,0043 y que la medición del ruido adopta un valor equivalente a 0,03. Al extrapolar el sistema a diez pasos adelante se obtienen las predicciones reportadas en el Gráfico IV.

Fuente: Elaboración propia, 2022.

Gráfico IV: Predicciones obtenidas a partir del filtro de Kalman

2.2. Análisis comparativo entre modelos

En este apartado se pretende realizar un análisis comparativo entre los modelos traídos a colación en el caso presente, utilizando como input los valores históricos de la demanda. Es un factor crítico, evaluar con relativo acierto, el desempeño de los modelos para reproducir el comportamiento de la variable respuesta, haciéndose ineludible recurrir al uso de indicadores cuantitativos que estimen la disimilitud entre los valores pronosticados y los valores reales de la serie temporal, pues la selección del modelo más adecuado viene precedida por la diagnosis y evaluación del grado de ajuste de todas las posibles alternativas de modelización.

Obsérvese en la Tabla 7, que se computan tres indicadores como lo son el RMSE (error cuadrático medio), MAE (error absoluto medio) y MAPE (error porcentual absoluto medio), para cada uno de los modelos. Se toman como referencia otras medidas de calidad, como lo son de acuerdo con García et al. (2014): Los criterios de Información propuestos por Akaike, Schwarz, y Hannan y Quinn, que comparan el beneficio de tener más información en términos de la reducción de la varianza de las innovaciones, con el costo de obtener tal beneficio en términos de la pérdida de grados de libertad en la estimación.

Tabla 7

Evaluación de modelos

Movimiento geométrico browniano

Modelo ARFIMA

Modelo de Espacio-estados

Error cuadrático Medio

9,563

7,562

3,791

Error Absoluto Medio

8,241

7,325

3,942

Porcentaje de Error Absoluto medio

9,021

7,906

4,787

Criterio de Schwarz-Bayesian

11,092

10,995

5,1056

Criterio de información de Akaike

14,108

13,996

5,087

Criterio de Hannan-Quinn

10,321

10,853

6,984

Fuente: Elaboración propia, 2022.

El criterio de Schwarz-Bayesian penaliza parámetros libres y depende del tamaño muestral, es calculado como: ; el criterio de información de Akaike, que incluye una penalización en forma de función creciente del número de términos estimados, se calcula como sigue: Según este criterio, el modelo seleccionado minimizará el cuadrado medio del error y tendrá la particularidad de poseer pocos coeficientes con respecto a la cantidad de datos que se tienen a disposición.

Por último, el criterio de Hannan-Quinn que también incluye penalizaciones para la cantidad de parámetros estimados, se determina mediante la siguiente fórmula: . Todos estos criterios de información proveen un soporte adicional relevante, para la selección de un modelo que sea, a lo sumo, idóneo para explicar apropiadamente el comportamiento de la variable dependiente.

Es perceptible que la capacidad predictiva del modelo espacio de estados, es superior en tanto que reporta valores más bajos para los criterios informativos utilizados y las funciones de costo o de error. No obstante, los demás modelos reportados exhiben comportamientos estables y son capaces de reproducir con relativo acierto, la dinámica histórica y futura de la variable dependiente. En consecuencia, queda refrendada la utilidad de los métodos expuestos para construir modelos que describan la evolución de la demanda en el corto plazo.

Conclusiones

Para modelar apropiadamente la dinámica futura de ciertas variables de índole económica se suele tomar como punto de referencia un marco analítico robusto, como lo es en este caso, la teoría de procesos estocásticos que ha cobrado creciente relevancia no solo en el plano de la predicción econométrica sino también en el altamente complejo terreno de la estadística matemática. De allí, que se hallen múltiples estudios reseñados en la literatura en torno a la predicción estadística, lo que por supuesto, da cuenta sobre la inacabalidad de este dominio de estudio en el cual se circunscribe un sinnúmero de técnicas con bases teóricas robustas.

En esta investigación, se trazó como objetivo cardinal la prospección futura del nivel de demanda agregada, al disponer de un plexo de técnicas de pronóstico con soporte cuantitativo. En concordancia con lo mencionado previamente, se propusieron tres enfoques formidables para prospectar el nivel de ventas agregadas: Uno basado en el modelo geométrico browniano, el siguiente fundamentado en el modelo ARFIMA, y en última instancia, se procedió a apelar a la técnica del filtro de Kalmar. Los resultados indican que éste último reporta ventajas comparativas en términos predictivos y por tanto, éste enfoque de modelado propuesto reproduce apropiadamente el comportamiento histórico de la característica de interés analizada, a saber, la demanda.

Como posibles limitaciones del presente estudio se lista: La captación de datos históricos en un intervalo temporal relativamente pequeño, así como el uso de unidades agregadas para homogeneizar la demanda neta. Empero, se acota que los elementos centrales del diseño metodológico de la investigación, pueden ser extrapolados a otros casos de estudios siempre y cuando se adapten a las particularidades inherentes de cada pesquisa. Es consabido que el flujo de información financiera o contable de algunas entidades de este sector suele estar restringido o no disponible para terceros.

Sin ánimo de exhaustividad se listan algunas líneas de investigación futuras como por ejemplo, el diseño de casos de estudios dónde se apliquen distintas variantes de modelos de espacio-estados, y modelos de difusión para la prospección del comportamiento futuro de variables económicas y financieras.

Referencias bibliográficas

Albey, E., Norouzi, A., Kempf, K. G., y Uzsoy, R. (2015). Demand modeling with forecast evolution: An application to production planning. IEEE Transactions On Semiconductor Manufacturing, 28(3), 374-384. https://doi.org/10.1109/TSM.2015.2453792

Castaño, E. (2016). Identificación de los modelos ARFIMA. Revista de la Facultad de Ciencias, 5(1), 12-37. https://doi.org/10.15446/rev.fac.cienc.v5n1.52890

Chang, W-Y. (2014). A literature review of wind forecasting methods. Journal of Power and Energy Engineering, 2(4), 161-168. https://doi.org/10.4236/jpee.2014.24023

García, M. D. C., Castellana, N., Rapelli, C., Koegel, L., y Catalano, M. (2014). Criterios de Información predictivos para la selección de un modelo lineal mixto. SaberEs, (6), 61-76. https://doi.org/10.35305/s.v0i6.98

Izquierdo, S., Hernández, C., y Pajares, J. (9 y 10 de septiembre de 2004). El espacio de estados en econometría [Discurso principal]. VIII Congreso de Ingeniería de Organización. Leganés.

Izzeldin, M., Hassan, M. K., Pappas, V., y Tsionas, M. (2019). Forecasting realised volatility using ARFIMA and HAR models. Quantitative Finance, 19(10), 1627-1638. https://doi.org/10.1080/14697688.2019.1600713

Kristjanpoller, W., y Minutolo, M. C. (2016). Forecasting volatility of oil price using an Artificial Neural Network-GARCH model. Expert Systems With Applications, 65, 233-241. https://doi.org/10.1016/j.eswa.2016.08.045

Lao-León, Y. O., Rivas-Méndez, A., Pérez-Pravia, M. C., y Marrero-Delgado, F. (2017). Procedimiento para el pronóstico de la demanda mediante redes neuronales artificiales. Ciencias Holguín, 23(1), 43-59.

Morales-Velázquez, M. I., Aparicio, J., y Valdés, J. B. (2014). Pronóstico de avenidas utilizando el filtro de Kalman discreto. Tecnología y Ciencias del Agua, V(2), 85-110.

Ortegón-Cortázar, L., y Gómez, A. (2016). Gestión del marketing sensorial sobre la experiencia del consumidor. Revista de Ciencias Sociales (Ve), XXII(3), 67-83.

Pardo, R. J. (2015). Comparación del Filtro de Kalman, el algoritmo Esperanza-Maximización (EM) y el Filtro de Información para la Estimación de Modelos en Representación Espacio-Estado [Tersis de maestría, Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/bitstream/handle/unal/56615/ricardopardor.2015.pdf?sequence=1&isAllowed=y

Qin, R., y Nembhard, D. A. (2012). Demand modeling of stochastic product diffusion over the life cycle. International Journal of Production Economics, 137(2), 201-210. https://doi.org/10.1016/j.ijpe.2012.01.027

Ramírez, L. N., Cristancho, S. L., y Cleves-Leguizamo, J-A. (2021). Modelos de fluctuaciones de precios agrícolas: Estudio comparativo de frutas tropicales frescas en Colombia. Revista de Ciencias Sociales (Ve), XXVII(E-4), 197-212. https://doi.org/10.31876/rcs.v27i.37002

Ramos, R., Clar, M., y Suriñach, J. (2000). Comparación de la capacidad predictiva de los modelos de coeficientes fijos frente a variables en los modelos econométricos regionales: Un análisis para Cataluña. Estudios de Economía Aplicada, (15), 125-162.

Salazar-Núñez, H. F., Venegas-Martínez, F., y Calderón-Villareal, C. (2017). ¿Existe memoria larga en mercados bursátiles, o depende del modelo, periodo o frecuencia? Ensayos. Revista de Economía, 36(1), 1-24.

Solera, Á. (2000). Criterios para la selección de modelos estadísticos. Departamento de Investigaciones Económicas, Banco Central de Costa Rica.

Soubdhan, T., Ndong, J., Ould-Baba, H., y Do, M-T. (2016). A robust forecasting framework based on the Kalman filtering approach with a twofold parameter tuning procedure: Application to solar and photovoltaic prediction. Solar Energy, 131, 246-259. https://doi.org/10.1016/j.solener.2016.02.036

Urdaneta, A., y Borgucci, E. (2018). Shocks petroleros y demanda de dinero en Venezuela 1988-2017. Revista de Ciencias Sociales (Ve), XXIV(3), 108-126.

Vásquez, F. A., Restrepo, S. I., y Lopera, J. F. (2010). Una revisión crítica de las técnicas de filtrado para la teoría de los ciclos económicos. Cuadernos de Economía, 29(53), 119-153.