Resultados DATAJAM 2022

Consulta información sobre la reglas del evento en el siguiente enlace

La Comisión de Regulación de Comunicaciones - CRC continúa ofreciendo a los ciudadanos la oportunidad de mostrar sus habilidades e iniciativas con los Datos Abiertos. Con este DataJam 2022 quisimos brindarle la posibilidad de implementar y fortalecer ese conocimiento en el análisis de datos mediante la solución a los retos propuestos.

DataJam 2022 es la tercera versión abierta a la participación de ciudadanos, en la que se utilizaron datos del sector de las Telecomunicaciones, Postal y Audiovisual para plantear soluciones a los tres retos propuestos; para desarrollar dichas soluciones, se tenía libertad de utilizar cualquier tecnología innovadora para la extracción, transformación, análisis y visualización de los datos.

Reto 1

Temática: Contenidos Audiovisuales
Enunciado del reto: ¿Qué estrategias pueden ser propuestas para promover la elección informada de los usuarios de televisión abierta a partir del contenido presentado en las parrillas de programación?
Descripción del reto: Proponer estrategias de visualización y comunicación de datos de los contenidos audiovisuales de la televisión abierta, buscando que los usuarios puedan tomar decisiones sobre los contenidos que desean consumir, tomando en consideración las similitudes o diferencias existentes entre las parrillas de programación presentadas.
Tipo de reto: Exploratorio
Datos sugeridos: Parrilla de programación televisión abierta

Reto 2

Temática: Telecomunicaciones
Enunciado del reto: ¿Cuáles son los patrones que permiten pronosticar la demanda de los servicios TIC en Colombia?
Descripción del reto: Pronosticar la demanda de los servicios TIC en Colombia. Para los servicios móviles, encontrar patrones temporales que permitan anticipar el comportamiento en la demanda futura. O para los servicios fijos, además de encontrar los posibles patrones temporales, encontrar los patrones espaciales y/o sociodemográficos que permitan pronosticar el comportamiento en la demanda futura. La solución más robusta permitiría a la CRC y a las empresas prestadoras de los respectivos servicios obtener un panorama sobre la demanda de los distintos servicios tanto de tipo móviles como fijos en los próximos meses y años.
Tipo de reto: Investigativo
Datos sugeridos:

Reto 3

Temática: Postales
Enunciado del reto: Realizar un análisis de la demanda potencial del servicio de mensajería expresa, dada la evolución del comercio electrónico, a nivel de municipios y número de envíos con el fin de identificar el aumento de cobertura, en términos de puntos de mensajería expresa.
Tipo de reto: Investigativo
Descripción del reto: Identificar y agrupar las zonas (municipios y departamentos) donde haya necesidad de puntos de mensajería expresa al tener en cuenta variables sociodemográficas y económicas.
Tipo de reto: Investigativo
Datos sugeridos: Ingresos y envíos de Mensajería Expresa

Participantes

El total de participantes inscritos fue de 112 personas, de las cuales 57 se inscribieron de manera individual y 55, con grupos ya establecidos, es decir, 18 grupos inscritos.


Ganadores reto 1

Santiago Gamboa

Reto 1 – Temática: Contenidos Audiovisuales – tipo exploratorio: ¿Qué estrategias pueden ser propuestas para promover la elección informada de los usuarios de televisión abierta a partir del contenido presentado en las parrillas de programación?

El participante desarrollo una visualización de la información televisiva para la elección de contenidos, para ello contemplo una transformación de datos, al tener en cuenta la hora de inicio de los programas televisivos, y una creación de gráficos a través de la herramienta de Power BI.

Equipos Los mejores amigos: Johan Macias, Sebastian Ospina, Nicolás Ospina

Reto 1 – Temática: Contenidos Audiovisuales – tipo exploratorio: ¿Qué estrategias pueden ser propuestas para promover la elección informada de los usuarios de televisión abierta a partir del contenido presentado en las parrillas de programación?

el equipo Los mejores amigos, a través de la plataforma Seekr presentó una propuesta para encontrar los programas de manera rapida y organizada, esto a través de variables de selección y busqueda.


Ganadores reto 2

Equipo: Semillero de Ciencia de Datos - Politecnico Grancolombiano. Integrantes: Oscar Leonardo Acevedo, Camilo Andrés Ramírez, Javier Eduardo Jaimes

Reto 2 – Temática: Telecomunicaciones – tipo investigativo: ¿Cuáles son los patrones que permiten pronosticar la demanda de los servicios TIC en Colombia?

El equipo a través de la herramienta Jupyter Notebooks utilizó la información disponible en Postdata de los servicios fijos de televisión, Internet y telefonía. Además, se utilizaron bases de datos del DANE sobre valor agregado y número de viviendas para cada municipio

Dentro de su análisis exploratorio resaltaron que la penetración de televisión por suscripción a marzo de 2023, se encuentra en las ciudades principales y sus áreas metropolitanas con alrededor del 50%. Con respecto al servicio de Internet fijo, se reflejo el mismo patron del servicio de televisión por suscripción, y además, que la penetración en áreas metropolitanas ronda el 70%. Frente a las cuotas de mercado, para el servicio de televisión por suscripción, el analisis arrojo que son relativamente estables, y que en marzo de 2023 los diez departamentos con más proporción tienen el 80,6% del total de mercado. Mientras que para el servicio de Internet fijo este porcentaje fue de 80,9%.

Frente a la relación con el nivel de urbanización y el valor agregado, en los tres servicios (televisión, telefonia e Internet) se encontró que existe mayor crecimiento cuanto más urbanizado esté el municipio. Este nivel se mide como el porcentaje de viviendas en la cabecera municipal. de viviendas en la cabecera municipal. El mercado de televisión es el que tiene un mejor potencial de crecimiento en niveles de urbanización intermedios con peso relativo significativo, pero sus predicciones lineales son las menos seguras.

Con respeto a la relación del crecimiento del valor agregado con el crecimiento del mercado de televisión, a partir de las regresiones lineales en función del tiempo de las tendencias de ambas variables, se encontró que la tendencia de correlación es muy clara en la región paisa y la región Cundinamarca - Opita. Frente al servicvio de Internet se resalta la tendencia de correlación de Boyacá y los Santanderes, y para el servicio de telefonia fija la región occidente.

Equipo: ANElitics - 3. Integrantes: Gerardo Moreno, Mauricio Quevedo, Andres Sanabria - Agencia Nacional del Espectro ANE.

Reto 2 – Temática: Telecomunicaciones – tipo investigativo: ¿Cuáles son los patrones que permiten pronosticar la demanda de los servicios TIC en Colombia?

El equipo presentó una propuesta de acuerdo con los procesos que desarrolla la ANE frente a la demanda de Internet móvil para los próximos 5 años, al tomar como referencia el conjunto de datos **Internet móvil demanda abonados.csv** disponible en Postdata. La solución al reto se realizó con el programa Python, contempla un primer paso relacioando con la exploración de los datos, un segundo paso en el cual se ejecutan tres modelos predictivos SARIMAX, XGBOOST y LINEAR REGRESSION, con el objetivo de encontrar la mejor predicción con relación a la realidad, y en un tercer paso se determina la precisión de cada modelo, se realizan predicciones basadas en los mismos y se propone un camino iterativo para mejorar la confiabilidad de cada uno.

Con respecto a las conclusiones, se resalta que la cantidad de abonados que realizaron algún tipo de pago para acceder al servicio de Internt móvil durante el periodo de reporte se incremento alrededor de 10 veces entre el primer trimestre de 2012 y el primer trimestre de 2022. Además, que desde la aparición de la tecnología 4G en los registros de las redes de los operadores de telefonía móvil en 2013, su uso para acceder a Internet móvil ha ido en aumento y superó el de la tecnología 3G en el cuarto trimestre de 2018. Por otra parte, con el desarrollo de este trabajo, el equipo manifiesta que es recomendable avanzar con varios modelos a la vez y probarlos con predicciones que incluyan diferentes conjuntos de entrenamiento y prueba, al tomar como referencia el margen de error, en la medida que este último disminuya, el modelo obtenido será más confiable.

Y finalmente, con respecto a los parámetros, algoritmos y datos de partida, el mejor resultado hasta ahora lo obtiene el modelo generado con el algoritmo XGBOOST. Con SARIMAX se empleo un autogerador de parámetros y LINEAR REGRESSION no utilizó parámetros, mientras que en XGBOOST se ajustaron manualmente a partir del conocimiento del algoritmo. Entre mayor adaptabilidad tenga el algoritmo se obtendrán mejores resultados.