35
USO DE TÉCNICAS DE MACHINE LEARNING PARA LA DETECCIÓN
DE FRAUDES EN LOS CONTRATOS DE OBRAS PÚBLICAS*
USE OF MACHINE LEARNING TECHNIQUES FOR DETECTION OF FRAUDS IN PUBLIC WORKS CONTRACTS
Jonathan Nabor López Espinosa **
Resumen
Propone un sistema de control y detección de fraudes en contratos de obras públicas que, aprovechando la revisión de actos administrativos que hace la Contraloría General de la República de Chile a través del trámite de toma de razón, sirva además como control de reemplazo. Se plantea, en primer lugar, un modelo de recopilación de datos críticos de proyectos de construcción con el fin de controlar las variables que podrían perjudicar su desarrollo. La segunda fase de la propuesta consiste en utilizar los datos obtenidos como fuente de información para implementar un sistema basado en técnicas de machine learning, que ayude en el proceso de toma de decisiones de auditoría y en la detección de irregularidades o anormalidades que sean indicios de algún tipo de fraude.
Palabras clave: machinelearning–deeplearning– contratos de obras públicas – detección de fraudes.
Abstract
It proposes a system of fraud control and detection in public works contracts, which takes advantage of the oversight of administrative acts performed by the
* Artículo ganador de concurso regional sobre buena gobernanza de la OLACEF, edición de 2019, que puede encontrarse en https://www.olacefs.com/primer-premio-jonathan-nabor-lopez- espinoza-efs-chile/ (consultada el 2 de diciembre de 2019). Se publica en esta ocasión una versión ampliada y revisada.
** Constructor civil de la Pontificia Universidad Católica de Chile; diplomado en «Especialización en técnicas para detección de fraude» de la Universidad de Chile; curso on line «Machine learning, tecnologías en la toma de decisiones», del Massachusetts Institute of Technology.
36
Jonathan Nabor López Espinosa
Comptroller General of the Republic of Chile through the legal control process to operate as alternative overseeing. First, it ponders over a method for collecting critical data on construction projects in order to control the variables that could harm their development. The second phase of the proposal consists in using the obtained data as a source of information to implement a system based on machine learning techniques, which helps in the process of making audit deci - sions and detecting irregularities or abnormalities that give hints on some sort of fraud.
Keywords: machine learning – deep learning – public works contracts – fraud detection.
Introducción
Cada cierto tiempo, los medios de comunicación nos informan sobre algún caso de fraude, dándonos a conocer los detalles de la forma en que se realizaba el ilícito, los involucrados y los montos defraudados que, al final de cuentas, es el factor que causa más impacto en la opinión pública. En efecto, la extensión y la magnitud de los fraudes y la corrupción asociada perjudican gravemente la confianza de la ciudadanía y pueden dañar a distintos sectores económicos.
En cualquier parte del mundo pueden ocurrir fraudes, nadie está exento, ni las instituciones privadas —como bancos, casas comerciales, inversionistas, gran - des empresas o pymes— ni las entidades del sector público, las que pueden verse afectadas por la acción de sujetos u organizaciones que buscan obtener beneficios a costa de los recursos del Estado.
Dentro de los esfuerzos para prevenir y detectar actos irregulares, podemos mencionar la teoría del triángulo del fraude. Propuesta por el sociólogo y crimi - nólogo estadounidense Donald Cressey, quien postuló que cualquier individuo podría llegar a cometer un fraude, dejando de lado su comportamiento ético, si se da la concurrencia de tres factores: presión, oportunidad y racionalización.
Ahora bien, en el nuevo milenio se ha planteado introducir nuevos factores a la teoría de Cressey, los que se justificarían debido a la evolución natural de las ins - tituciones y de los perfiles profesionales de los empleados. En efecto, los sujetos están cada vez mejor preparados y cuentan con acceso ilimitado a la informa - ción gracias a la globalización producida por internet. Ante este panorama, se propuso la incorporación como una nueva arista en la geometría del fraude, del factor «capacidad o conocimiento» de los individuos que cometen este tipo de delitos, extendiéndose la idea de Cressey a la «teoría del diamante del fraude».
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Gracias a estas conjeturas, las entidades de control han podido establecer medi - das de prevención y detección de fraudes, al considerar las variables que afectan a los individuos y analizando las zonas de riesgo que se pueden originar en los procesos de la institución. No obstante, estamos viviendo un cambio tecnológi - co importante, al punto que se reconoce como una cuarta revolución industrial, basada en los datos y la información. El futuro llegó hace rato.
Se denomina big data a todo lo relacionado con la gestión de volúmenes de datos descomunalmente grandes, tanto así que los métodos tradicionales de manejo de datos —minería de datos— ya quedaron obsoletos. Pero el big data es solo la punta de lanza de esta revolución informática, fue la señal de alerta para que todo tipo de organización se preocupara de gestionar los datos de una manera acorde a las dimensiones del big data y no desperdiciara esta nueva for - ma de generar información. Los datos deben ser considerados como un activo corporativo, quien no tenga datos quedará fuera del juego.
Aún es difícil dimensionar la importancia de la gestión de los datos, lo valioso de recopilar y registrar la mayor cantidad de datos desde distintas fuentes, aunque esto se convierta en una tarea engorrosa que entorpece la forma actual en que se realizan los procesos de la organización. Por el contrario, hay que ser optimis - ta y pensar que, de alguna u otra forma, los datos recolectados serán de utilidad en el futuro, pues son pequeñas piezas de un gran puzle que nos mostrará la información que necesitemos.
En efecto, esta visión futurista no es algo tan utópico. El desarrollo de la inteli - gencia artificial es la segunda oleada de esta cuarta revolución tecnológica que busca sacar provecho a todos los datos acumulados durante años, utilizándo - los para conseguir los propósitos de las organizaciones. Para esto, surge como respuesta a estos desafíos una rama de investigación de la inteligencia artificial denominada machine learning o aprendizaje automatizado, la que ayuda a crear programas de software capaces de generalizar comportamientos a partir de los datos por medio de procesos de aprendizaje, que pueden ser guiados o automá - ticos.
Una de las principales ventajas del big data y los avances en inteligencia arti - ficial, es que son de uso abierto —open source—, colaborativos y relativamente económicos. Por lo tanto, generar bases de datos o conseguir algoritmos no es algo imposible por restricciones económicas o tecnológicas, ya que están a disposición de cualquier persona, sin discriminar si el uso dado será en beneficio de la sociedad o para cometer un fraude. Consecuentemente, las entidades de fiscalización superiores tienen el deber de estar a la altura de las circunstancias, de lo contrario serán burladas y superadas por el fraude y la corrupción apoya - dos en los avances tecnológicos.
37
38
Jonathan Nabor López Espinosa
El presente trabajo trae consigo una propuesta para el uso práctico del machine learning en la prevención y detección de fraudes en contratos de obras públicas. El entorno de los contratos de construcción es uno de los más susceptibles de ser afectados por ese acto ilícito. Recordado es el caso de Odebrecht, una de las constructoras más grandes de Latinoamérica que, de acuerdo a lo publicado por el Departamento de Justicia de Estados Unidos, pagó aproximadamente unos USD 788.000.000 en sobornos para la obtención de contratos asociados a más de cien proyectos en doce países y recibiendo beneficios de USD 3.336.000.000.
Ahora bien, no es una quimera pretender prevenir y detectar estos ilícitos. Sobre todo si se consigue utilizar la capacidad de reconocimiento de patrones que tienen algunos algoritmos usados en el desarrollo de la inteligencia artificial, que aprovecha y se nutre de los datos obtenidos previamente. Es decir, la conjunción del big data y el estudio de la inteligencia artificial, pueden ser de utilidad para el propósito de evitar que ocurran fraudes.
Por otra parte, es del caso mencionar que por medio de la resolución Nº 7, de 2019, la Contraloría General fijó las nuevas normas sobre exención del trámite de toma de razón, incorporándose los controles de reemplazo en su artículo 22. Dichos controles se aplican de acuerdo a los montos señalados en la resolución Nº 8, de 2019, de esta misma entidad, que determina los montos a partir de los cuales los actos que se individualizan quedarán sujetos a toma de razón y a controles de reemplazo cuando corresponda.
Así, las resoluciones Nº 7 y Nº 8, definen, por ejemplo, que será sometida a toma de razón la resolución que apruebe el contrato de ejecución de una obra a través de licitación pública, cuyo monto supere las 15.000 UTM. En cambio, aquellas contrataciones que se encuentren entre las 10.000 y 15.000 UTM, solo serán sujetas a un control de reemplazo.
Considerando lo anterior, la Contraloría General de la República de Chile podría aprovechar el manejo de antecedentes de los proyectos de construcción para la recolección de datos por medio del trámite de toma de razón y establecer controles de reemplazo a una gran parte de las obras. Este trabajo plantea un modelo de recolección y registro de «datos críticos» de las etapas de adjudica - ción y liquidación de los proyectos, para luego efectuar el análisis de estos con herramientas de machine learning. De esta manera, sería posible establecer un tipo de control administrativo a distancia de los proyectos revisados y, cuando corresponda, generar señales de alerta de actos irregulares o fraudulentos por medio del uso del aprendizaje automatizado.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Objetivos de la investigación
• Presentar definiciones y teorías que nos permitan entender el concepto de fraude.
• Mostrar los esfuerzos institucionales para prevenir y detectar el fraude, a través del marco jurídico chileno que aborda esta problemática.
• Efectuar una breve reseña sobre la teoría del triángulo del fraude y la nueva arista que lo convierte en el diamante del fraude.
• Describir en qué consiste el campo de investigación de la inteligencia artificial. Presentar el machine learning y el deep learning como ramas de la inteligencia artificial que nos podrían ayudar en la prevención y detección de fraudes.
• Plantear una manera práctica de utilizar la tecnología de aprendizaje automatizado, para la detección de fraudes financieros en los contratos de obras públicas, por medio del análisis de datos recogidos en el trámite de toma de razón que efectúa la Contraloría General.
Revisión de literatura
La prevención y detección del fraude son un objetivo primordial en todo tipo de organización, pues evitan o aminoran los perjuicios que de él se derivan; mientras que para las entidades de fiscalización superiores se trata de una función encomendada por ley. Para abordar el tema, vamos a describir qué entienden por fraude distintos organismos internacionales (Zayas Mariscal, 2016).
Según la Association of Certified Fraud Examiners, fraude es cualquier actividad o acción con el propósito de enriquecimiento personal a través del uso inapro - piado de recursos o activos de una organización por parte de una persona.
Para el American Institute of Certified Public Accountants, el fraude es el uso de acciones que buscan presentar ante los inversionistas, analistas o mercado, una
39
40
Jonathan Nabor López Espinosa
situación no realista de la compañía con el fin de cumplir con las expectativas de alguno o algunos de los grupos de interés.
De acuerdo con The Institute of Internal Auditors, el fraude es cualquier acto ilegal caracterizado por el engaño, el ocultamiento o la violación de la confianza. Los fraudes son perpetrados por individuos y organizaciones para obtener dine - ro, propiedades o servicios, evitar pagos o pérdidas de servicios, asegurar una ventaja personal o del negocio.
En lo que se refiere a la auditoría en el sector público, la Organización Internacio - nal de Entidades Fiscalizadoras Superiores, INTOSAI, entrega directrices para la función del auditor por medio de la ISSAI 1240: Obligaciones del auditor en rela - ción con el fraude en una auditoría de estados financieros (Faura Llimós, 2016).
Ahora bien, respecto del impacto de las nuevas tecnologías, se tiene que el in - forme «Bots, machine learning, servicios cognitivos: realidad y perspectivas de la inteligencia artificial en España, 2018» de Alfonso Cossío (2018), menciona que la mayoría de negocios no tiene implantados sistemas de inteligencia artificial o se encuentran en fases de desarrollo poco maduras, pero casi todos los direc - tivos de las compañías perciben que la inteligencia artificial es una herramienta fundamental para obtener una ventaja competitiva. Por otra parte, se prevé que gracias al desarrollo de nuevos algoritmos, emergerán modelos de negocios disruptivos que forzarán a las empresas a comprender que la transformación digital no es tan solo una tendencia sino que es esencial para seguir siendo competitivo.
Por su parte, respecto de la relación de los avances tecnológicos y el sector público, el ensayo «Inteligencia artificial, robótica y modelos de Administración pública» de Carles Ramió Matas (2018), señala que es imprescindible que las instituciones públicas adopten estrategias proactivas, que aprovechen la revolu - ción tecnológica no solo para renovar su capacidad técnica sino para solventar la mayor parte de sus problemas conceptuales y organizativos. El objetivo es ir más allá de la simple digitalización e innovación tecnológica y aprovechar el paradigma tecnológico para ordenar los distintos modelos y culturas de la Admi - nistración, y así lograr una mayor fortaleza institucional.
En general, encontramos en la literatura una posición optimista respecto de implementar las nuevas tecnologías en las organizaciones y que estas deben definir sus aplicaciones de acuerdo a sus necesidades —entidades de fiscaliza - ción superiores: detección de fraudes—, consecuentemente al referido texto de Cossío, cuando indica que la inteligencia artificial deja de ser algo propio de las películas de ciencia ficción para convertirse en algo real y abre una nueva era de colaboración entre humanos y máquinas con el objetivo de predecir y satisfacer las necesidades.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Desarrollo de la investigación
41
1.
Regulación en la legislación chilena, la comisión de fraude y antece - dentes de impacto
1.1. Marco jurídico chileno en materia de fraude
Al entender el fraude como un engaño, son variadas las dimensiones afecta - das por este tipo de delito. En efecto, lo amplio de la definición provoca que en diversas actividades humanas existan personas que siempre usen el acto de engañar con la intención de obtener una ventaja, evitar una obligación o causar una pérdida a la otra parte. No obstante, el ordenamiento jurídico debe abarcar la mayor cantidad posible de situaciones vinculadas con el fraude, como las que a continuación serán presentadas y que guardan relación con el objetivo de este trabajo.
En primer lugar y en términos generales, el Código Penal chileno tipifica en su artículo 468 el delito de estafa como la defraudación económica y con ánimo lucrativo a otro, usando de nombre fingido, atribuyéndose poder, influencia o cré - ditos supuestos, aparentando bienes, crédito, comisión, empresa o negociación imaginarios, o valiéndose de cualquier otro engaño semejante. El título VIII del mismo código contempla penas de presidio y multas acordes con los montos asociados a la apropiación (Cavada Herrera, 2017).
Asimismo, los artículos 97 y siguientes del Código Tributario sancionan delitos de esa naturaleza con penas corporales, pecuniarias o administrativas. Por su parte, la ley Nº 18.045, Ley de Mercado de Valores, castiga los delitos indicados en el título XI de esta norma, entre los que se encuentran los de falsedad —di - vulgación de noticias falsas—, los relativos a la vulneración de requisitos para participar en el mercado de valores de oferta pública, los consistentes en revela - ción y uso de información privilegiada, y otros delitos relacionados con fraudes.
Dentro del marco jurídico que se describe, cabe destacar la Ley de Responsabi - lidad Penal de las Personas Jurídicas, ley Nº 20.393, la cual establece, tal como su nombre lo indica, la responsabilidad penal de las personas jurídicas en los delitos de lavado de activos, financiamiento de terrorismo y cohecho a un em - pleado público nacional o extranjero.
Otro importante cuerpo legal es la ley Nº 19.913, que crea la Unidad de Análisis Financiero y modifica diversas disposiciones en materia de lavado y blanqueo de activos, con el objetivo de prevenir e impedir la utilización del sistema financiero y de otros sectores de la actividad económica para la comisión de los delitos establecidos en el artículo 27 de esta ley, como la ocultación del origen ilícito de determinados bienes que provienen directa o indirectamente de la perpetración
42
Jonathan Nabor López Espinosa
de hechos constitutivos de alguno de los delitos contemplados en el título XI de la ley Nº 18.045 o en el artículo 97 del Código Tributario, entre otros.
La Unidad de Análisis Financiero posee atribuciones para solicitar, verificar, examinar y archivar la información proporcionada por bancos e instituciones financieras, corredores de bolsa y agentes de valores, entre otros, sobre operaciones sospechosas advertidas en el ejercicio de sus actividades. Asimismo, el artículo 2º de esta ley, obliga a las superintendencias y los servicios y órganos públicos señalados en el inciso segundo del artículo 1º de la ley Nº 18.575, a informar sobre operaciones sospechosas que adviertan en el ejercicio de sus funciones.
Para colaborar en la detección de la comisión de fraudes, la Unidad de Análisis Financiero publicó la «Guía de señales de alerta indiciarias de lavado o blanqueo de activos para el sistema financiero y otros sectores», con el propósito de que las entidades privadas y públicas en general adopten las medidas preventivas necesarias para evitar el lavado de activos para que sean reportadas las opera - ciones sospechosas.
De acuerdo a esta guía de señales de alerta, existen innumerables operaciones y transacciones que posibilitan el proceso de blanqueo de activos. Sin embargo, es posible sostener que el carácter sospechoso de una transacción proviene, ya sea, de la forma inusual en que se realiza, en relación al comportamiento habi - tual del cliente, o bien, de la naturaleza misma o de las características propias de la operación.
1.2. Estudio de caso de fraude en Chile. El escándalo MOP-GATE
Acabamos de describir, en parte, los esfuerzos que hace el Estado de Chile por medio de su legislación para prevenir y castigar los actos ilícitos. Estas nor - mativas han ido evolucionando conforme han salido a la luz pública casos de defraudación, tanto en el ámbito privado como en el sector público. A través de la historia se ha visto cómo entidades bancarias, sociedades de inversión, ministerios e incluso las fuerzas armadas han sido víctimas de fraudes llevados a cabo por empleados, operadores o altos funcionarios, demostrando así que el fraude puede ser perpetrado en cualquier institución pública o privada.
En septiembre de 2000, Sara Oliva, secretaria de la consultora Gestión Ambiental Territorial S.A., GATE, denunció que fue secuestrada por delincuentes y obligada a girar $ 190.000.000 de la cuenta de la empresa en la que trabajaba. Una vez iniciada la investigación policial, se advirtieron contradicciones en la versión de los hechos descritos por la afectada, restándole consistencia a su declaración, tanto así, que finalmente confesó que todo había sido un engaño que ella había planeado para quedarse con el dinero. Lo que no se esperaba fue que, tras ser detenida por la policía, Sara Oliva denunciara que GATE era una empresa ficticia
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
destinada a desviar fondos fiscales a campañas políticas, destapándose de esta forma uno de los escándalos de fraude más recordados en Chile, que incluso involucraría al candidato presidencial de ese entonces, Ricardo Lagos Escobar (La Tercera, 2002).
La investigación del caso reveló que efectivamente existían irregularidades en los contratos adjudicados por el Ministerio de Obras Públicas, MOP, a la empresa consultora GATE, llegando a sumar en total unos $ 1.700.000.000, dinero que, según lo explicado por las autoridades del ramo que fueron llamadas a declarar, fue usado para el pago de remuneraciones extra a ciertos funcionarios debido a un «error administrativo». Por su parte, también hubo acusaciones de que el dinero defraudado se utilizó para el financiamiento de campañas políticas, dado que la mayoría de los implicados pertenecían al Partido Socialista y al círculo cercano del otrora Presidente Ricardo Lagos, quien además había encabezado el Ministerio de Obras Públicas años antes.
El resultado de las indagaciones efectuadas determinó que el Ministerio de Obras Públicas había adjudicado a GATE un total de ocho contratos para aseso - rías y elaboración de manuales, llamando la atención que la empresa consultora solamente tuviera una secretaria como funcionaria de planta. Dos convenios resaltaron de forma inmediata, ambos adjudicados mediante trato directo: el primero firmado en septiembre de 1999 por $ 966.000.000 y el segundo, que correspondía a la ampliación del anterior por casi $ 500.000.000 más, suscrito en julio de 2000.
Los restantes seis contratos sumaban unos $ 270.000.000, y correspondían a estudios y diseños de manuales ambientales y a trabajo de apoyo administra - tivo para determinados tramos de carreteras concesionadas. Sin embargo, se verificó que estas labores no fueron realizadas o no cumplieron con el estándar que se esperaba para tales servicios. Luego, del análisis de los contratos suscri - tos entre el Ministerio de Obras Públicas y GATE, se observaron cláusulas poco frecuentes para este tipo de contrataciones: 1) se justificó la contratación de la consultoría de GATE como un caso excepcional para poder establecer condicio - nes distintas a las que rigen el reglamento ministerial; 2) se eximió a la empresa de las retenciones de los pagos pactados y de la obligación de entregar garan - tías por el fiel cumplimiento del contrato; y 3) se eliminó la formalidad de realizar los cobros mediante la presentación de estados de pago.
Otros hechos que dieron indicios de lo irregular de los contratos, tanto en su origen como en su ejecución, son los siguientes: 1) resultaba extraño que el Ministerio de Obras Públicas hubiese contratado la elaboración de manuales en temas abordados regularmente y que, por lo demás, ya existían; 2) no se justifi - caba la contratación de los denominados trabajos de apoyo, toda vez que, por lo general, lo que se contrataba como apoyo eran digitadores, quienes no cobraban una suma tan elevada por su oficio; 3) se contrató el servicio de «Estudio de
43
44
Jonathan Nabor López Espinosa
un modelo de capacitación para la prevención ambiental en la construcción de obras concesionadas», no obstante que el Ministerio de Obras Públicas contaba con unidades de capacitación para sus distintos departamentos; 4) el hecho de que se ordenase crear un manual de procedimientos en auditorías ambientales para un tramo de la ruta concesionada resulta sospechoso, dado que este tipo de manuales son generales y de uso extensivo para todas las carreteras, conce - sionadas o no.
Aunque la justicia no logró probar que los fondos defraudados se usaron para el financiamiento de campañas políticas, en especial la campaña presidencial de Ricardo Lagos, resultaron condenados el exministro de Obras Públicas, Carlos Cruz, el exjefe de finanzas de la Dirección de Vialidad, Sergio Cortez, y el dueño de la empresa GATE, Héctor Peña Véliz. Por otra parte, como a nivel nacional se había instalado en la palestra el tema del financiamiento de las campañas políticas, se aprobó la ley Nº 19.884 que buscaba regular los aportes financieros para las campañas políticas, así como también transparentar el origen de estos.
2. ¿En qué consiste la evolución de la teoría del fraude?
2.1. La teoría del triángulo del fraude
Buscando explicar los motivos por los cuales una persona sería capaz de reali - zar un fraude, el criminólogo norteamericano Donald Cressey, con base en entre - vistas efectuadas a unos 250 condenados por diversos delitos, propone como resultado de su investigación la teoría del triángulo del fraude.
Cressey señala que aquellos individuos que carecen de principios morales sim - plemente encuentran una excusa para justificar su actuar y no tendrían inconve - nientes en cometer un fraude. Sin embargo, ¿qué ocurre con las personas que tienen altos estándares de moralidad y que de igual manera se ven involucrados en actos fraudulentos?, ¿qué situaciones o motivos los llevarían a alejarse de su conducta ética y pasar al lado de lo ilegal?
Pues bien, como respuesta a lo anterior, Cressey concluye que: «las personas de confianza se convierten en violadores de confianza, cuando se conciben a sí mismos teniendo un problema financiero que no es compartible, son conscien - tes de que este problema puede ser resuelto en secreto, violando la posición de confianza financiera que tienen, y son capaces de aplicar a su propia conducta en esa situación, verbalizaciones que les permitan ajustar sus concepciones de sí mismos como usuarios de los fondos o propiedades encomendadas —el di - nero de los demás—». Complementa esta hipótesis proponiendo la teoría del triángulo del fraude como modelo para explicar los factores que hacen que una persona llegue a cometer actos ilícitos.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
La mencionada teoría consta de tres componentes que deben confluir de mane - ra simultánea para que un individuo tenga la disposición a cometer un fraude, estas son: presión, oportunidad y racionalización (Zayas Mariscal, 2016).
• Presión: también se relacionan los conceptos de incentivo o necesidad. Re - presenta el impulso o deseo material o psicológico del defraudador a come - ter un ilícito, entendiéndose generalmente como un problema financiero o una necesidad económica personal, real o imaginaria que el sujeto no puede resolver con medios legítimos y que no puede ser compartida. Esta nece - sidad tiene el carácter de apremiante, algo que supera los recursos o solu - ciones ya intentadas o al alcance del individuo; se trata de un requerimiento urgente que conlleva la percepción de una grave consecuencia personal o familiar, más grave que la de cometer un delito.
Si bien en la mayoría de los casos el incentivo por excelencia es el lucro, se podrían dar situaciones que producen necesidades legítimas o circuns - tancias personales, tales como dificultades económicas que no permiten el pago de la educación superior de los hijos o cubrir el costo de tratamientos de alguna enfermedad, casos que impulsarían a las personas a cometer un fraude.
Por otra parte, también se deben considerar las presiones generadas por mantener el estatus económico alcanzado, por mala administración de los recursos personales, deudas generadas por vicios, deudas comerciales. Así también, existen ejemplos en que la misma empresa instala un modelo de incentivo para los trabajadores, que a la larga se convierte en un factor de presión, tales como alcanzar metas de desempeño, conseguir un cierto volu - men de ventas, bonos en función de resultados o el temor a perder el puesto de trabajo por malos resultados, convirtiéndose en factores que presionan a algunos individuos a cometer fraudes.
• Oportunidad: se trata de encontrar un modo de solucionar un problema per - sonal de carácter financiero, aprovechándose de su posición en una organi - zación. El individuo percibe que existe un entorno favorable para cometer los actos irregulares pretendidos, como la ausencia de control interno, jefaturas ineptas, supervisión deficiente, la no utilización del control por oposición o la falta de revisiones jerárquicas en el flujo de un proceso.
Estas debilidades del sistema, facilitan la acción y posterior protección del individuo, quien siente que el riesgo de ser descubierto es bajo, más aún si logra coordinarse con otros directivos o empleados para cometer el fraude.
45
46
Jonathan Nabor López Espinosa
También se pueden señalar factores como el exceso de confianza o el acce - so privilegiado de algunos empleados, respecto de su labor en la empresa, como oportunidades percibidas para cometer un fraude.
• Racionalización: es la búsqueda de la justificación que permita superar el sentimiento de culpabilidad que siente el individuo, intentando convencerse a sí mismo, de forma consciente o inconsciente, de que existen razones válidas para su actuar impropio. Es la percepción de que lo que está haciendo es algo legítimo, prácticamente una reivindicación de lo que el sujeto cree merecer, por ejemplo, al estar disconforme con su salario o ante la falta de reconocimiento en la organización.
Otra forma de racionalización es cuando el individuo busca mantener su autoimagen de inocencia proyectando en otros la responsabilidad de sus actos, al convencerse de que si otros están cometiendo el fraude, este estaría justificado.
2.2. Una nueva arista, teoría del diamante del fraude
Si bien la teoría del triángulo del fraude se ha utilizado con éxito desde los años 50 para la prevención y detección de actos fraudulentos, los investigadores Da - vid Wolfe y Dana Hermanson proponen incorporar una nueva variable al modelo de Cressey (Galvis-Castañeda & Santos-Mera, 2017), debido a que encontraron que determinados actos de fraude solo ocurren porque son dirigidos por perso - nas dotadas de un nivel superior de habilidades.
Esta variable propuesta sería el conocimiento o capacidad, dado que en algu - nos casos no es suficiente con la concurrencia de la presión, la oportunidad y la racionalización para que un individuo pueda cometer un fraude, sino que además debe contar con la capacidad de aprovechar estas condiciones, no solo para cometer el ilícito sino que también para evitar ser descubierto (Fortunato, Santos, & Faroni, 2017).
Hay que comprender que los sistemas de prevención de fraude han mejorado a lo largo del tiempo gracias a la gestión de expertos en la materia. Por lo mis - mo, los sujetos que pretendan cometer un fraude deben ser capaces de burlar los sistemas de control interno haciendo uso de su experiencia, habilidades y competencias profesionales para conseguir su objetivo. Desde este punto de vista, se tiene entonces que en las instituciones existiría un reducido número de especialistas con el conocimiento suficiente para realizar operaciones ilícitas, diferenciándose de la gran mayoría de empleados en los que podrían concu - rrir: la presión, la oportunidad y la racionalización, pero que no contarían con la suficiente capacidad o conocimiento para no ser descubiertos en su intento de efectuar un fraude, lo que, en parte, lograría amedrentar sus intenciones.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
47
3.
¿Qué actitud debería tomar el auditor para prevenir o detectar un fraude?
En el amplio contexto de interesados y responsables en la prevención y detec - ción del fraude, los auditores cumplen un rol fundamental. Son los llamados a entregar lo mejor de sus habilidades para revisar los antecedentes de un de - terminado caso y garantizar que las actuaciones del auditado cuenten con una seguridad razonable. No obstante, es importante entender que el proceso de au - ditoría no se centra solamente en la detección de fraudes, sino que este último es uno de los tantos tipos de hallazgos que se podrían obtener de la auditoría (Fortunato et al., 2017).
En efecto, estos hallazgos vienen a ser cualquier hecho significativo que contra - venga algún criterio de auditoría establecido, el que además debe ser comproba - do mediante evidencia que permita perseguir las correspondientes responsabi - lidades penales o administrativas. En este sentido, se han hecho esfuerzos para apoyar la labor del auditor, estableciéndose normas internacionales de auditoría, por ejemplo, en el caso del sector público, la Organización Internacional de En - tidades Fiscalizadoras Superiores, INTOSAI, proporciona un marco institucional y normativo para la labor del auditor a través de las normas internacionales de entidades fiscalizadoras superiores, ISSAIS.
Ahora bien, pese al apoyo de estas normas, la labor del auditor es complicada, pues existe el riesgo de no detectar irregularidades en una investigación, dado que el fraude de por sí conlleva sofisticados planes para ocultar todo registro que pueda convertirse en evidencia. La dificultad aumenta si el ilícito va acom - pañado de colusión de dos o más personas u organizaciones trabajando coor - dinadamente con el fin de no ser descubiertos, utilizando todos los recursos, habilidades, conocimientos y poder jerárquico que estén a su alcance (Faura Llimós, 2016).
Frente a lo anterior, el auditor debe aplicar sus habilidades y conocimientos de la misma forma —de preferencia, mejor— que el defraudador, tener un impeca - ble juicio profesional y mantener un escepticismo durante todo el proceso de la auditoría, buscando identificar irregularidades debidas a errores o a fraude. Requiere lograr el conocimiento de la entidad y el entorno de esta, para diseñar pruebas de control que le permitan efectuar hallazgos trascendentes y sustenta - dos en evidencia convincente.
Sin embargo, sigue sin ser suficiente todo lo expuesto: el auditor tiene la des - ventaja de que el defraudador conoce sus métodos y los límites legales que tiene para acceder a la información privada —como las cuentas bancarias per - sonales—. Por esta razón, el auditor debe estar alerta para descubrir cada nueva manera de fraude, algunas insólitas, perpetradas por profesionales con altas capacidades que también cuentan con el apoyo de nuevas tecnologías.
48 Jonathan Nabor López Espinosa
4.
¿Cómo pueden utilizarse nuevas tecnologías para detectar fraudes financieros en las fiscalizaciones que realizan las entidades de fisca - lización superiores?
Aunque el panorama para el auditor pareciera ser desalentador, la sociedad espera de que las entidades de fiscalización superiores cumplan con la función asignada por ley de resguardar los recursos públicos. Por lo tanto, es primordial el desarrollo de mecanismos a la altura de los requerimientos actuales.
Estamos en la era del big data, se habla de la cuarta revolución industrial, la revolución de los datos, en donde las empresas y los servicios públicos manejan grandes volúmenes de datos. Pero los métodos de análisis y obtención de información de las entidades de fiscalización superiores no han evolucionado de acuerdo con la dimensión de datos que hoy en día es posible extraer.
Entonces, las entidades de fiscalización superiores como primera tarea deben tener claridad respecto de cuáles son los datos que manejan, de qué forma se organizan y si los están almacenando correctamente, para luego determinar cómo convertir los datos en información. Es decir, la organización debe reconocer en los datos un activo que debe comenzar a valorar, destinando recursos para contar con la capacidad para administrar dichos datos si quiere generar información a partir de ellos.
Se recomienda revisar las fuentes de datos internos, como los que se pueden obtener de los mismos procesos de la entidad —toma de razón, auditorías—, y también los externos, como todos aquellos datos generados por la gestión propia de los servicios públicos. Estos, independiente de su origen, nos podrían servir de insumo para una futura investigación de auditoría o fiscalización. Lue - go, es esencial que las entidades de fiscalización superiores dispongan de bases de datos, lo más completas posible y que estas sean administradas de forma eficiente y segura.
En el caso de la Contraloría General de la República de Chile, se podría generar un sistema de detección de conflictos de interés, al cruzar la base de datos de funcionarios públicos que posee y que es administrada por el Sistema de Infor - mación y Control del Personal de la Administración del Estado, SIAPER, con la base de datos del Servicio de Registro Civil e Identificación, en donde se encuen - tran la identificación de los ciudadanos, sus relaciones de parentesco, el registro de vehículos motorizados —patrimonio personal— y antecedentes penales.
Con este cruce de información se detectarían los posibles conflictos de interés de los funcionarios del Estado en las asignaciones de cargos públicos o en la participación de licitaciones de compras públicas. El modelo actual solamente contempla que los involucrados declaren no tener conflictos de interés, lo cual no es posible verificar de forma inmediata. Cabe destacar el potencial de esta idea, pues no solo se conocerían las relaciones directas de parentesco sancio -
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
nadas por la ley entre un funcionario público y un particular, o entre dos fun - cionarios públicos, sino que también sería posible conocer las ramificaciones entre sus familiares. De esta manera, se podrían establecer alertas de riesgo de fraudes para los casos en que, por ejemplo, la esposa de un funcionario público es pariente de un particular.
Ahora bien, para la implementación de este tipo de ideas se requiere que la enti - dad de fiscalización superior tenga un dominio en el manejo y análisis de datos masivos, contando con los profesionales idóneos y la tecnología necesaria para la obtención de los resultados esperados. Sin embargo, la detección de fraudes es un problema mucho más complejo que requiere la recopilación de datos que no solo provengan de las bases de datos ya establecidas, sino que también se deberían recolectar aquellos datos anexos a los actos administrativos que com - pleten los vacíos de la información. Esto porque, aunque al día de hoy pareciera ser que dichos datos no son de utilidad, se espera que con el avance de la tec - nología y las nuevas técnicas de análisis, en el futuro podrían ser la base para la detección de fraudes.
5. Tendencias respecto de la utilización, de acuerdo a la forma de administración, de los modelos de datos y beneficios que conlleva la utilización de tecnologías de información para detectar fraudes financieros. Evolución de los mismos
5.1. Inteligencia artificial al servicio de las entidades de fiscalización superiores
Se entiende por inteligencia artificial la que poseen aquellos sistemas informá - ticos que pueden percibir su entorno, pensar, aprender y actuar en respuesta a lo que detectan y a sus objetivos. Se trata de la simulación por parte de una má - quina de un proceso mental que le permite tomar decisiones y efectuar tareas propias de los seres humanos por medio de algoritmos, los cuales son capaces de ingerir y analizar datos para convertirlos en información relevante.
El concepto de inteligencia artificial no es nuevo. Ya en los años 50 se teorizaba sobre el tema, debido a que el estado de la tecnología no permitía su desarrollo y tampoco se contaba con los datos suficientes para hacer funcionar las máqui - nas. Sin embargo, la disponibilidad actual de datos permite la evolución de las capacidades de la inteligencia artificial.
Entonces, la importancia de que las entidades de fiscalización superiores ya estén adecuando su estructura organizacional en función de trabajar en torno al big data, radica en que la segunda etapa de esta revolución tecnológica se alimenta de los datos registrados, almacenados y ordenados con los que cuente. Esta tecnología requiere de una gran magnitud de datos para que los algoritmos puedan ejecutarse y así obtener un resultado cercano a la realidad.
49
50
Jonathan Nabor López Espinosa
Antes del trabajo de análisis de datos utilizando inteligencia artificial, es ne - cesario tener claro que los datos deben ser de calidad, en cuanto a su integri - dad, registro y organización. Por esto, se debe contar con la infraestructura y programas que ayuden en el procesamiento de grandes volúmenes de datos estructurados o no estructurados. Por datos estructurados se entiende aquellos que siguen las reglas de los datos relacionales y son fácilmente procesables —nombre, edad, sexo, por ejemplo—. Por otra parte, los datos no estructurados son los datos que carecen de valor hasta que se les ordena y clasifica, como comentarios, imágenes o audios.
5.2. Machine learning
Dentro del estudio de la inteligencia artificial, se encuentra una disciplina lla - mada machine learning o aprendizaje automatizado, la que consiste en crear sistemas que aprendan de forma automática y sean capaces de generalizar comportamientos a partir de los datos (Sunqu, 2016). Para esto se plantea el análisis como un proceso de aprendizaje, donde el programador proporciona una serie de reglas de partida que el algoritmo de aprendizaje ha de ir adaptando y creando otras nuevas, para de esta forma mejorar la tasa de acierto del modelo generado.
Un claro ejemplo para simplificar la comprensión del concepto de aprendizaje, es el enfrentamiento de Gari Kaspárov con la computadora de IBM, Deep Blue. Kaspárov menciona en una charla de TED Talks que nadie recuerda que él ganó el primer encuentro jugado en 1996, en donde de 6 partidas, ganó 3, empató 2 y perdió 1. Sino que, por el contrario, todo el mundo solo tiene en mente que fue derrotado al año siguiente, cuando la computadora había aprendido a jugar ajedrez al más alto nivel, gracias al mismo Kaspárov.
Estas capacidades de aprendizaje ya están siendo utilizadas para la implemen - tación de modelos predictivos, los que clasifican los datos de interés o los su - jetos en bandas de riesgo que conllevan las acciones a efectuar (Sunqu, 2016). Por ejemplo:
• Modelo de prevención de morosos: modelo basado en los datos históricos de pagos y valores de cuota, además de datos demográficos y socio- económicos. Los sujetos son clasificados en una pirámide de riesgo de morosidad, donde cada nivel tiene asociadas acciones encaminadas a disminuir oportunamente el riesgo de morosidad.
• Modelo predictivo de riesgo cardiovascular: modelo basado en los datos clínicos de pacientes que hayan sufrido alguna afección cardiovascular.
• Modelo de detección de intrusos: se obtienen datos del comportamiento de usuarios autorizados, entonces si hay alguna variación en el comportamiento
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
habitual, el sistema decide si se trata de una amenaza y genera alertas.
Las soluciones de machine learning se basan en distintos métodos que resuelven problemas de diversa índole y, por tanto, deben ser utilizados en el contexto ade - cuado. A continuación revisaremos de forma general tres métodos, advirtiendo que existen otros y que requieren de mayor estudio para su total entendimiento.
• Método de regresión: se utiliza para predecir un valor con base en los datos históricos. En términos matemáticos se refiere a encontrar la mejor ecua - ción que pase de forma óptima por un conjunto de puntos. Por ejemplo, un modelo de predicción de la temperatura basado en los registros de años anteriores.
• Método de clasificación: consiste en ordenar los registros históricos en tor - no a dos opciones, se clasifican los datos de entrada en opciones binarias, 1 o 0, sí o no. Este método se utiliza en la identificación de tumores cancerí - genos, considerando su tamaño y la edad del paciente.
• Método de agrupación: este método se utiliza cuando es necesario clasificar los datos, pero se desconocen previamente las categorías. Así se logra cons - truir grupos coherentes o clusters que tienen en cuenta las variables de los mismos datos, dando a conocer información no conocida ni esperada que residía en la base de datos. Permite una mejor interpretación de los datos, evitando prejuicios.
Presentados los métodos para generar modelos para análisis de datos, ahora cabe explicar cómo funcionan y para esto es necesario describir una pieza fundamental de esta tecnología: los algoritmos. Pues bien, se entiende por algoritmo a una secuencia de instrucciones que se llevan a cabo para representar un modelo de solución para un determinado problema. En el campo del machine learning, los algoritmos se clasifican de acuerdo al tipo de aprendizaje que realizan. En este estudio solo describiremos dos tipos:
• Algoritmos de aprendizaje supervisado: son aquellos que realizan prediccio - nes con base en conjuntos de datos de entrada para los cuales conocemos de antemano los datos correctos de salida. Consta de dos etapas, una de en - trenamiento y otra de prueba. En la primera etapa, se cuenta con un conjunto de datos que son utilizados para entrenar o enseñar al algoritmo a encontrar los patrones o relaciones buscadas. Se recomienda usar entre el 60 % y el 70 % del total de los datos disponibles en esta fase.
Una vez que el algoritmo entra en funcionamiento, comienza la segunda eta - pa de prueba, en donde se utilizan los datos antes reservados para validar el rendimiento del algoritmo. Si los resultados alcanzados son los esperados, entonces se decide utilizar el algoritmo con nuevos datos, de lo contrario se
51
52
Jonathan Nabor López Espinosa
deben hacer correcciones de sobreajuste —overfitting— o subajuste —under - fitting —.
Algunos algoritmos de aprendizaje supervisado son el de regresión, clasificación, reconocimiento de voz, árboles de decisión y support vector machine (SVM). O sea, sirven para la detección de anomalías cuando se busca identificar datos que no son habituales, es decir, difieren de los patrones identificados como actividad normal.
• Algoritmos de aprendizaje no supervisado: estos funcionan con base en un conjunto de datos de entrada del que no conocemos los datos de salida. Se utilizan para obtener agrupaciones coherentes de datos de las relaciones definidas en los mismos datos. Buscan los datos semejantes entre sí. Pertenecen a esta clase, los algoritmos k-means para generar clustering y los de análisis de componentes principales (PCA).
5.3. Una mirada al futuro. Deep learning y redes neuronales
En la última década, ha destacado la irrupción de un nuevo concepto relaciona - do con la inteligencia artificial, el cual ha logrado mejores resultados que otras técnicas de aprendizaje automático. El denominado deep learning consiste en el modelamiento de los datos a través de un elevado número de capas de transfor - mación, un modelo matemático compuesto por un gran número de elementos de procesamiento organizados en niveles. Se trata de una idea inspirada en la arquitectura y funcionamiento del cerebro humano, y por ello estas técnicas se conocen también con el nombre de redes neuronales artificiales, RNAs.
Como fue mencionado, el diseño de redes neuronales presenta característi - cas semejantes a las del cerebro, siendo estas redes capaces de aprender de la experiencia, de generalizar a partir de casos anteriores a nuevos casos, de abstraer características esenciales a partir de entradas que representan infor - mación irrelevante, solo por nombrar algunas. Las redes neuronales superan a los algoritmos vistos anteriormente, debido a que su gran número de capas de análisis logra generar modelos mucho más complejos y a que mientras más datos manejan, mejor es su desempeño, lo que se complementa a la perfección con el big data.
Fue Geoffrey Hinton quien desarrolló una forma más eficiente de entrenar mode - los de deep learning, utilizando el aprendizaje por capas. La denominada primera capa aprende características primitivas que son enviadas a la siguiente capa, la cual se entrena para reconocer características más complejas y así sucesiva - mente hasta entrenar todas las capas del modelo. De este modo, los algoritmos separan los factores de variación de los datos observados, siendo capaces de extraer características abstractas y de alto nivel de los datos en bruto, con las cuales pueden abordar eficientemente el problema objetivo. Las redes profun - das son modelos complejos obtenidos de la interconexión de un gran número
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
de unidades simples. Muchas operaciones simples permiten resolver problemas complejos (González-Muñiz, 2018).
El modelo de aprendizaje profundo por excelencia es el de perceptrones mul - ticapas (MLP) o redes feedforward. El perceptrón es la unidad básica de esta metodología y representa a una neurona artificial. Sin embargo, al igual que las neuronas, no tiene sentido el funcionamiento de solo una, por eso deben funcionar conformando redes. La arquitectura de redes neuronales artificiales está constituida por tres capas conectadas entre sí. Los datos ingresan por una primera capa de entrada, luego pasan a través de la capa oculta que contiene los cálculos, para finalmente pasar por la capa de salida, en donde se realiza la operación objetivo. Las capas de entrada y salida son únicas, no obstante, puede existir un gran número de capas ocultas, lo que hace que este tipo de aprendiza - je sea conocido como profundo.
La comunicación entre las neuronas de distintas capas se da a través de la fun - ción de activación, que es el elemento clave en las redes neuronales, puesto que es el que entrega la flexibilidad al modelo al proporcionarle la capacidad de estimar complejas relaciones no lineales en los datos. Cabe señalar que la elec - ción de la función de activación es una decisión trascendente, dado que cada función se ajusta de mejor forma a un problema que a otro. Se han propuesto métodos para iniciar el proceso basándose en el número de neuronas o en el tipo de función de activación.
El éxito de las redes neuronales reside en que no necesitan ser programadas para resolver un problema, sino que estas arquitecturas son capaces de apren - der por sí mismas la forma de resolverlo. Para ello, se recurre a un proceso de aprendizaje supervisado, en el cual se presenta a la red un conjunto de patrones de ejemplo, datos de entrada con sus correspondientes salidas esperadas. En - tonces, las neuronas se van modificando de manera proporcional al error que se produce entre la salida real y la salida esperada.
Este algoritmo es conocido como retroprogramación o backpropagation y consi - dera dos etapas. Una primera fase de propagación en donde se introduce el pa - trón de ejemplo en la red, que se propaga desde la entrada a la salida. A continua - ción se tiene la fase de aprendizaje, en la que los errores obtenidos a la salida de la red van propagándose hacia atrás, con el propósito de ajustar los cálculos que hace cada neurona al ir disminuyendo el error en el transcurso de las iteraciones.
Corresponde indicar que el aprendizaje se produce mediante la presentación sucesiva del conjunto de entrenamiento, donde cada presentación completa se llama época. Así, el proceso de aprendizaje se repite época tras época de acuer - do al algoritmo de retroprogramación, hasta que se encuentra la combinación óptima de cálculos en cada neurona y el rendimiento de la red converge a un valor aceptable.
53
54
Jonathan Nabor López Espinosa
Existen otros tipos de redes neuronales tales como las redes convolucionales, las deep autoencoders y las redes recurrentes, pero con la presentación de las redes feedforward es suficiente para entender grosso modo el funcionamiento de estas. Por otra parte, es del caso señalar que el deep learning actualmente se utiliza en el reconocimiento facial o reconocimiento de imágenes. Luego, ¿sería posible plantear un modelo de reconocimiento de fraudes utilizando esta tecno - logía? Lo que es seguro es que hay que usar la inteligencia artificial a favor de la prevención y detección de fraudes. La información existe, luego hay que usarla.
6. Metodología y procedimientos de auditoría mínimos que las entidades de fiscalización superiores deberán realizar mediante la utilización de tecnologías para detectar fraudes financieros
La implementación de los avances en tecnología big data y el desarrollo de inte - ligencia artificial obligarán a las entidades de fiscalización superiores a cambiar sus metodologías tradicionales de auditoría. El propio origen de los datos ya es distinto, qué decir sobre las tendencias para hacer el análisis de estos. Además, se debe analizar el cambio de paradigma que significa el uso de la inteligencia artificial, en cuanto a que su mayor potencial es ser un sistema predictivo de eventos, al contrario de la forma tradicional de auditoría que es más reactiva.
En efecto, se requiere una nueva estructuración de los procesos de fiscalización, que incluya una unidad de estudio de datos capaz de indicar los sectores con mayor probabilidad de riesgo de fraude. Con este propósito, las entidades de fiscalización superiores deberán incorporar nuevos perfiles profesionales con dominio en estadística, programación, ciencia de datos, entre otros, para refor - zar a los auditores en su labor de combatir contra los sujetos que cuentan con la capacidad y conocimiento para planear fraudes y no ser descubiertos.
6.1. Propuesta de sistema de control administrativo y detección de fraudes en contratos de obras públicas: CENTINELA
La Constitución Política de la República de Chile dispone, en lo que atañe, que la Contraloría General ejercerá el control de legalidad de los actos de la Admi - nistración y que, en el ejercicio de esa función, tomará razón de los decretos y resoluciones que, en conformidad a la ley, deben tramitarse por la Contraloría. Lo anterior implica que, en el ámbito de las obras públicas, los servicios del Estado deben enviar los antecedentes de sus respectivos proyectos para la revi - sión de la Contraloría, la que cuenta con quince días para efectuar el estudio de legalidad del acto administrativo y determinar si lo aprueba, lo representa o lo aprueba con alcances.
Entonces, aprovechando la revisión de los antecedentes de las resoluciones, es posible extraer un conjunto de datos o data set de cada proyecto que es ingre - sado a la Contraloría, para usarlo como insumo de modelos de aprendizaje auto - matizado que adviertan irregularidades de cualquiera de los factores o variables
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
que afectan a los contratos —empresas, servicios, funcionarios, plazos, montos, etcétera—.
En la práctica podemos definir dos etapas de acuerdo al momento en que se hace la recolección de los datos. Tendremos primero los datos registrados que se pueden obtener gracias a la revisión de los documentos que acompañan la resolución de adjudicación del contrato. Posteriormente, se podrán recoger los datos relacionados con la resolución de liquidación final del contrato, cerrando el ciclo de vida del proyecto.
55
Adjudicación Liquidación Proyecto
Se describen a continuación los datos de interés seleccionados para extraerlos de las resoluciones:
Tabla Nº 1: Datos recopilados en la etapa
de adjudicación del contrato
Concepto
Criterio o valores registrados
Concepto
Criterio o valores registrados
Identificación del proyecto
• Nº BIP
• Nº ID Mercado Público • Nombre del proyecto
Servicio público asociado
(Listado de servicios públicos, origen de la resolución: Vialidad- servicio de salud, etcétera)
Tipo de licitación
• Licitación pública • Licitación privada • Trato directo
Tipo de contrato
• Suma alzada
• Serie de precios unitarios
• Combinación
Monto disponible
(Monto original disponible para el proyecto)
Normativa aplicable
(Marco regulatorio del contrato, MOP 75, MOP 108, MOP 265)
Tipo de proyecto
• Edificación • Obras viales • Obras civiles
Tipo de reajuste económico
• Polinómico • IPC
• Ninguno
Comisión de evaluación
(Identificación de los funcionarios públicos designados para evaluar las ofertas)
• Nombre completo • RUT
• Cargo
Evaluación del resultado de la adjudicación
(Datos de cada oferta ingresada)
• Empresa contratista • RUT empresa
• Estatus (adjudicada/ admisible/fuera de bases)
• Plazo ofertado • Monto ofertado
Inspector fiscal
(Identificación del funcionario público designado como inspector fiscal)
• Nombre completo • RUT
• Cargo
Archivos adjuntos de respaldo
(Archivos formato pdf) • Aviso Diario Oficial
• Anexo complementario
• Informe de evaluación de adjudicación
Fuente: elaboración propia.
56
Jonathan Nabor López Espinosa
Tabla Nº 2: Datos recopilados en la etapa de liquidación del contrato
Concepto
Criterio o valores registrados
Concepto
Criterio o valores registrados
Comisión de recepción de obras
(Identificación de los funcionarios públicos designados)
• Nombre completo • RUT
• Cargo
Residente de obras
(Identificación del profesional a cargo de las obras)
• Nombre completo • RUT
• Cargo
Estados de pago
• Nº EEPP • Fecha
• Monto facturado
Modificaciones del contrato
• Resolución que aprueba
• Montos modificados • Plazos modificados
Control de plazos
• Fecha de inicio de obras
• Fecha de término de obras
• Fecha de liquidación del contrato
Registro de multas
• Motivo
• Monto de multa
Georreferenciación
• GEO-CGR
Archivos adjuntos de respaldo
• Acta de entrega de terreno
• Recepción provisoria de obras
• Recepción definitiva
Fuente: elaboración propia.
Cabe agregar que este sistema de registro de datos de proyectos de construc - ción, también está pensado para ser de utilidad en la gestión de las resoluciones que componen cada contrato. La lógica del sistema es que cada proyecto está integrado por varias resoluciones y que la suma de estas formará una imagen completa del proyecto.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Tabla Nº 3: Datos recopilados del trámite
de toma de razón - resoluciones
57
Concepto
Criterio o valores registrados
Concepto
Criterio o valores registrados
Identificación de la resolución
(Acto administrativo) • Nº resolución
• Fecha de emisión • Región de origen
Autoridad que suscribe la resolución
(Identificación del funcionario público) • Nombre completo • RUT
• Cargo
Control de plazos trámite de toma de razón
• Fecha de ingreso a CGR • Fecha de salida CGR
Materia de la resolución
(A qué se refiere el acto administrativo)
• Adjudicación
• Aprobación de bases administrativas
• Liquidación de contrato
• Pago de indemnizaciones
• Término anticipado
Resultado del estudio
• Cursada
• Cursada con alcances • Representada
• Retirada
Registro de observaciones
(Repositorio de las observaciones hechas a las resoluciones)
• Categoría
• Origen (obras- jurídica)
• Texto
Oficio de respuesta
• Nº de oficio • Fecha
Productos CGR asociados
(Registro de otros productos que se relacionan con la resolución)
• Tipo (referencia- INVE-auditoría-IOP) • Nº de informe
• Observaciones
Analista CGR
(Funcionario CGR responsable del estudio)
Archivos adjuntos de respaldo
• Minuta UCE
• Oficio de salida
Fuente: elaboración propia.
Con la recolección de los datos descritos anteriormente, será posible, en primer lugar, contar con una base de datos de proyectos de obras públicas supervigila - dos administrativamente por la Contraloría General. Por otra parte, los analistas tendrán los datos de entrada para el entrenamiento de algoritmos y el uso de téc - nicas de aprendizaje automatizado que, por medio de la búsqueda de patrones, sean capaces de detectar anormalidades o comportamientos sospechosos que, con cierto nivel de probabilidad, nos indiquen dónde auditar.
58
Jonathan Nabor López Espinosa
Al cierre de cada proyecto, este podrá ser evaluado al determinar indicadores o parámetros de medición de rendimiento o eficacia, según cómo se desarrolle el contrato durante su vigencia. Por ejemplo, se pueden clasificar las empresas constructoras de acuerdo al nivel de multas que pagan en cada proyecto, o en cuanto a su comportamiento en el cumplimiento de los plazos del contrato. A partir de la información de los estados de pago se conocerá el flujo financiero real y puede ser comparado con el flujo inicial proyectado. En el caso de los tér - minos anticipados de contratos, se podría buscar si existe alguna relación entre la mala gestión del proyecto con el inspector técnico, el profesional a cargo o la empresa constructora.
Entonces, si lo que se busca es la detección de fraudes, debemos aprender a interpretar los datos recogidos de los proyectos para compararlos con actos irregulares conocidos, como los siguientes mecanismos comunes y recurrentes observados en fraudes cometidos en contratos de obras públicas.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Tabla Nº 4: Indicios para detectar fraudes en
contratos de obra pública
59
Mecanismo Definición Señales de alerta
Corrupción, sobornos y comisiones ilegales
Consiste en dar o recibir alguna cosa de valor para influir en un acto administrativo o decisión
El contratista paga parte de los sobornos en cada factura. Se abultan los montos o se disminuye la calidad de la obra para compensar
• Trato favorable falto de explicación • Relación social estrecha entre un funcionario y el contratista
• Aumento del patrimonio del funcionario público
• El funcionario público tiene un negocio externo encubierto
• Cambios injustificados, indocumentados o frecuentes en los contratos
Conflicto de interés encubierto
El funcionario posee una empresa que se beneficia del contrato público
• Favoritismo inexplicado por cierto contratista
• Se adjudica la oferta más cara
• Se aceptan trabajos de mala calidad
Licitación colusoria
Contratistas de una región determinada conspiran para vencer a la competencia, afectando los valores de los contratos
• La oferta ganadora es demasiado alta o baja si se compara con el monto disponible
• Se observa una rotación de ganadores
• Ciertas empresas compiten entre sí y con otras no
• Los otros licitadores no presentan reclamos
Especificaciones pactadas
Las convocatorias presentan especificaciones técnicas adaptadas a un solo oferente, excesivamente restrictivas para excluir a otros licitadores, evitando la competencia
• Se presenta solo un oferente siempre • Se presentan reclamos de otros
contratistas
• Especificaciones técnicas más estrictas que en otros proyectos similares
Filtración de datos
El personal encargado del diseño, licitación o evaluación de las ofertas filtra información para ayudar a un oferente
• No se respetan los plazos de los procesos de licitación
• Disminución del plazo otorgado para el estudio de la propuesta
• Se rechazan todas las ofertas, se declaran desiertas sin justificación
Manipulación de ofertas
En una licitación, algún funcionario puede alterar una oferta para beneficiar a cierto oferente
• Se invalidan ofertas por cometer errores
• Ofertas quedan fuera de base por razones cuestionables
Adquisiciones injustificadas a un único oferente
Muy asociado con la corrupción, se hacen tratos directos o división de contratos para burlar revisiones. Prórrogas de contratos previos sin convocar una nueva licitación
• Contratos asignados por trato directo por montos inferiores a los umbrales de la toma de razón
• Se informa de las licitaciones a algunos contratistas
División de compras o proyectos por etapas
Se divide el contrato por etapas para evitar la competencia
• Adquisiciones consecutivas de contratos de un contratista
• División injustificada de proyectos
Prestadores de servicios fantasmas
Se pagan servicios ficticios para malversar fondos. Se crean empresas fantasmas para generar facturas falsas
• Solo hay un funcionario a cargo de la recepción, inspección y pago
• La planta de la empresa es muy acotada o no cuenta con recursos físicos propios
Fuente: elaboración propia.
60
Jonathan Nabor López Espinosa
De esta manera, si le asignamos valores numéricos a estas señales de alerta, es posible parametrizar estos actos para generar una pirámide de riesgo de fraude en la cual podemos ubicar los factores y variables que circundan a los proyec - tos. Estos podrían ser estudiados y analizados para determinar qué componente es el que afectó negativamente al proyecto y causó una mala gestión del contra - to, por ejemplo, que obligó a efectuar un aumento de obras.
6.2. Aplicación de herramientas de machine learning
En vista de todo lo anterior, una vez que se cuente con la base de datos que administre la información recopilada de las resoluciones sujetas al trámite de toma de razón —y los proyectos susceptibles de control de reemplazo—, será po - sible alcanzar una visión general de los resultados de la gestión de las empresas constructoras y los servicios públicos, sobre la base de la información obtenida del análisis de cada proyecto en que estén involucrados.
P1
P4
P2
Servicio 1 P5
P3
P6
P1
P4
P2
Empresa 1 P5
P3
P6
Entonces, con la información recopilada y su posterior análisis por medio de un modelo de evaluación de resultados de la gestión, se proponen los siguientes indicadores:
· Evaluación del cumplimiento del desempeño de sus funciones
Servicio 1: Σ(P1 + P2 + P3…+Pn)/n; donde P representa la evaluación de la gestión del contrato obtenida por el servicio para un proyecto en particular y n
es el número de proyectos analizados.
· Evaluación del cumplimiento de contrato
Empresa 1: Σ(P1 + P2 + P3…+Pn)/n; donde P representa la evaluación del cumpli - miento del contrato por parte de la empresa en un proyecto en particular y n es
el número de proyectos analizados.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Los indicadores serán extraídos para la totalidad de servicios públicos y empre - sas que cuenten con proyectos que, de alguna forma, estén bajo la mirada de la Contraloría General, ya sea por la revisión de sus resoluciones en el trámite de toma de razón o por la vía de los controles de reemplazo, en donde se dejará registro de los proyectos y se recolectarán los datos requeridos que alimenten el modelo. Con base en los resultados obtenidos por los servicios o las empresas, será posible enfocar de mejor manera las entidades sujetas a la fiscalización de este organismo de control.
Del modelo propuesto, se espera predecir el resultado de la gestión de un con - trato o proyecto, permitiendo generar alertas tempranas para prevenir toda si - tuación que perjudique la calidad de las obras o un mal uso de los recursos públicos.
La predicción obtenida del modelo, corresponderá a la probabilidad que existe de que el proyecto cumpla con el contrato, es decir, se ciña a las especifica - ciones técnicas, dentro del plazo establecido, sin sobrecostos ni aumentos de obras excesivos, que puedan delatar actos irregulares. Esta predicción permitirá clasificar los proyectos que se encuentran en ejecución y tenerlos en custodia hasta que finalmente se tenga que efectuar la liquidación del contrato.
Luego, una vez que se liquida el contrato, es posible contar con los datos reales del proyecto, con los cuales se debe medir la efectividad del modelo por medio de las métricas más adecuadas al caso. Alcanzada la efectividad del modelo, este deberá ser ajustado para que sus predicciones sean cada vez más acertadas.
61
62 Jonathan Nabor López Espinosa
7.
Ventajas en la utilización de nuevas tecnologías para detectar frau - des financieros en el proceso de auditoría realizada por una entidad de fiscalización superior
Contar con la información completa de los proyectos por medio de estos sets de datos, se vuelve una herramienta muy poderosa de control a distancia de los contratos de obras públicas, que si bien no son el 100 % de las obras del Estado, el valor económico abarcado justifica plenamente la incorporación de un siste - ma como este. Además, por tratarse de un sistema propio, también ayuda en la gestión interna de las resoluciones de toma de razón, generando una subbase de datos de observaciones hechas a las resoluciones representadas, con lo que se conseguiría proporcionar directrices para la integración y coherencia de los criterios aplicados.
Otra ventaja de este sistema, es que, a medida que se registre información, se crearán subbases de datos de empresas constructoras y funcionarios públicos, de manera que aumentará el conocimiento sobre ellos. Cabe recordar la idea planteada anteriormente para la detección de conflictos de interés, la que se complementa a la perfección con el sistema de control de obras propuesto, en donde se registran los datos de los funcionarios públicos, profesional de obras y la planta gerencial de las empresas contratistas. Esto se podría hacer en tiempo real, dado que el acceso a la información es instantáneo, detectando de inme - diato los conflictos de interés.
Corresponde indicar que la Contraloría General es la única entidad que tiene la posibilidad de tener una visión panorámica del comportamiento de ciertos fac - tores propios de las obras públicas. En efecto, la organización político-adminis - trativa y la falta de coordinación en el traspaso de información de los proyectos entre los servicios públicos, actúa en desmedro de la capacidad de detectar rápidamente si una empresa actúa de forma irregular. Esto se debe a que, a di - ferencia de los entes públicos, el actuar de las empresas constructoras no está restringido a límites regionales o a trabajar solo con ciertos servicios públicos.
Entonces, ante lo recién expuesto, el sistema de control de obras públicas permi - tiría conocer el comportamiento de las empresas constructoras, consiguiendo por ejemplo generar alertas a nivel nacional —e incluso internacional— de riesgo de fraude, simplemente por contar con la información adecuada de manera or - denada y coordinada en todo el país. Ahora bien, si a lo anterior le sumamos la conectividad, el sistema propuesto podría estar disponible en tiempo real para quienes quieran utilizarlo por medio de plataformas web o aplicaciones para dispositivos móviles.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Además, se podría incorporar un dron para fiscalizar las obras. Por medio de las fotografías aéreas, sería posible constatar el avance de los proyectos bajo supervisión del modelo, determinando grados de avance, como por ejemplo: obra en etapa de excavaciones, proyecto en etapa de obra gruesa o proyecto sin avances. En este último caso, si tenemos la fecha estimada de inicio y se realiza una visita del dron con la cual se verifica que no hay avance, sería un proyecto susceptible de una fiscalización inmediata por tener una alta probabilidad de presentar problemas de gestión. Asimismo, se pueden fiscalizar y auditar los contratos de conservación global de carreteras, aprovechando la tecnología de georreferenciación.
Por otra parte, con el set de datos de obras públicas propuesto, sería posible comenzar a experimentar con el machine learning e incluso con el deep learning . Una vez que se cuente con un volumen suficiente de datos de proyectos finali - zados, se podría iniciar un proceso de aprendizaje supervisado utilizando algo - ritmos de aprendizaje automatizado. Conocida la gestión de los contratos, al término de estos, sus factores o variables que los afectan podrían ser evaluados y clasificados, proporcionándonos de esta forma el resultado del proceso. Así, se generarían los datos de entrada y los datos de salida que permitirían entrenar un algoritmo que pudiera reconocer la probabilidad de ocurrencia de las señales de fraude, en virtud de las combinaciones de datos ya conocidas.
El siguiente paso sería el uso de estos datos de obras públicas para el entrena - miento de algoritmos de deep learning con el objetivo de que este efectúe pre - dicciones sobre la gestión del contrato. Por ejemplo, si el programa detecta que en cierta combinación de circunstancias —determinada empresa o inspector fiscal—, la probabilidad de que el contrato sufra aumentos de obra injustificados es alta. Sin embargo, aún falta maduración de los sistemas basados en redes neuronales para su implementación, pero la idea está.
La posibilidad de análisis posibles con el data set propuesto es proporcional a la capacidad del analista, por lo que se podrán incorporar nuevos análisis en la me - dida que a alguien se le ocurran. A continuación se indicarán algunos ejemplos:
63
64
Jonathan Nabor López Espinosa
Tabla Nº 5: Análisis de datos propuestos
Indicador
Análisis
Datos requeridos
Señal de alerta de fraude
Índice de eficiencia de la licitación
Revisar si el sistema de licitación pública es
realmente eficiente para los intereses del Estado, optimizar el ahorro en la inversión pública
• Monto disponible para la contratación
• Monto adjudicado
• Monto de otras ofertas • Monto final del contrato
• División injustificada de proyectos
• La oferta ganadora es demasiada alta o baja si se la compara con el monto disponible
Control de plazos de ejecución
Por medio del estudio del cumplimiento de los plazos del contrato y sus modificaciones, analizar la gestión del IFO y la empresa
• Fecha de inicio de obras
• Plazo contractual
• Fecha de término de obras
• Aumentos de plazo
• Cambios injustificados, indocumentados o frecuentes en los contratos
Control de la inversión pública
Análisis de la diferencia entre valor inicial y final del contrato
Ofertas adjudicadas subvaloradas se compensan por medio de aumentos de obra
• Empresas
• Monto adjudicado
• Monto final del contrato • Monto de
modificaciones
• Cambios injustificados, indocumentados o frecuentes en los contratos
• Trato favorable falto de explicación
Conflictos de interés
Relaciones de parentesco indebidas
• Registro de empresas • Profesional a cargo de las obras
• Inspector fiscal
• Comisión de evaluación • Autoridad vigente del
servicio
• Comisión de recepción de obras
• Trato favorable falto de explicación
• Relación social estrecha entre un funcionario y el contratista
• Aumento del patrimonio del funcionario público
Fuente: elaboración propia.
Con la implementación de este sistema, las entidades de fiscalización superio - res tendrían una herramienta fundamental para establecer una política de co - nocimiento del entorno de los proyectos de inversión en obras públicas, lo que permitiría determinar un marco de comportamiento normal que servirá de refe - rencia en la detección de circunstancias sospechosas de fraude.
Con el data set propuesto, es posible obtener distintas métricas para los indi - cadores que se generen, los cuales, por medio del análisis de las curvas ROC o precision-recall, nos permiten establecer umbrales de decisión que nos señalen dónde enfocar los esfuerzos de fiscalización, de acuerdo con los recursos dis - ponibles y la cobertura deseada de servicios a fiscalizar, buscando optimizar los hallazgos relevantes o indicios de fraude.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Métricas
Para efectos del presente trabajo, solamente se considerarán algunos datos para la obtención de indicadores; esto quiere decir que aún faltan métricas por lograr, que en la medida que este proyecto lo requiera, serán propuestas y estudiadas.
Antes de continuar, es necesario establecer qué se entenderá por una «buena» o «mala» gestión del contrato. Es decir, de dónde se obtienen los valores «p» de cada proyecto y qué significa dicho número. Para esto, hay que entender que un proyecto posee un ciclo de desarrollo desde que nace la idea de hacer algo hasta que se obtiene lo que se busca.
En este caso, lo que buscaremos será medir la efectividad del servicio en la ge - neración y estimación de costos de proyectos versus el resultado final obtenido. Consideraremos los datos de un «proyecto original» frente a los datos extraídos del «proyecto real o final» que se producen al término del contrato. A continua - ción, se describirán los datos utilizados:
Tabla Nº 6
65
Nombre Etapa Descripción
Monto disponible
Adjudicación
Costo estimado por el servicio para realizar el proyecto
Monto adjudicado
Adjudicación
Oferta aceptada para contratación del proyecto
Monto final Liquidación Costo real del proyecto
Plazo original
Adjudicación
Tiempo estimado por el servicio para realizar el proyecto
Plazo oferta
Adjudicación
Tiempo aceptado para contratación del proyecto
Plazo final Liquidación Tiempo real que demoró el proyecto
Monto obras extraordinarias
Liquidación
Aumento del valor del contrato por la incorporación de partidas no incluidas en el proyecto original
Monto aumento de obras
Liquidación
Aumento del valor del contrato por aumento en la cantidad de algunas partidas
Monto disminución de obras
Liquidación
Disminución del valor del contrato por disminución de la cantidad de algunas partidas
Fuente: elaboración propia.
66 Jonathan Nabor López Espinosa
Tabla Nº 7
A partir de estos datos, se alcanzarán indicadores de gestión que nos permitirán evaluar la gestión del servicio o la empresa constructora, en función de cuanto se «aleja» o «acerca» el valor obtenido al valor del proyecto original.
Indicador Descripción Fórmula
Eficiencia del servicio en la estimación del costo del proyecto
Valor igual a 1, óptimo Valor mayor a 1, proyecto
subestimado por el servicio o sobreestimación coordinada de empresas
Valor menor a 1, proyecto sobrevalorado por el servicio
Monto adjudicado Monto disponible
Gestión económica del contrato
Valor igual a 1, óptimo
Valor mayor a 1, proyecto con sobrecostos
Valor menor a 1, proyecto con disminuciones
Monto final Monto adjudicado
Eficiencia del servicio en la estimación de los plazos
Valor igual a 1, óptimo
Valor mayor a 1, proyecto subestimado por el servicio
Valor menor a 1, proyecto sobrevalorado por el servicio
Plazo oferta Plazo original
Gestión del plazo del contrato
Valor igual a 1, óptimo
Valor mayor a 1, proyecto con aumentos de plazo
Plazo final
Valor menor a 1, proyecto con disminuciones de plazo
Plazo oferta
Eficiencia del servicio en la estimación de partidas
Valor igual a 0, óptimo
Valor mayor a 0, proyecto con variaciones en las partidas
Monto obras extraordinarias Monto adjudicado
Eficiencia del servicio en la estimación de las cantidades de obras (sobrecosto)
Valor igual a 0, óptimo
Valor mayor a 0, proyecto con variaciones en las partidas
Monto aumento de obras Monto adjudicado
Eficiencia del servicio en la estimación de las cantidades de obras (sobreestimación)
Valor igual a 0, óptimo
Valor mayor a 0, proyecto con variaciones en las partidas
Monto disminuciones de obras Monto adjudicado
Fuente: elaboración propia.
El siguiente paso es determinar los umbrales de decisión para los indicadores definidos anteriormente. Cabe señalar que hay que hacer un estudio para lograr un consenso respecto de qué valores serán considerados «altos» o «bajos» para un proyecto. Por ejemplo, qué valor de obras extraordinarias es aceptable para un proyecto o qué valor no es aceptable para el atraso en la entrega del proyecto.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Tabla Nº 8
Se recomienda establecer bandas de criterios, las que se deben definir acordes a los factores o ponderadores que afecten a cada proyecto.
67
Buena gestión
0,8 a 1
Se cumple el plazo ofertado
Óptimo
1
Se cumple el plazo ofertado
Gestión del plazo del contrato
Mala gestión
1 a 1,5
Se sobrepasa el plazo ofertado. Caso normal
Alerta
1,5 a 2
Se sobrepasa el plazo ofertado por sobre un 50 %
Mala gestión
0,8 a 1
Disminución del monto-variación del proyecto original. Caso normal
Óptimo
1
Se cumple el monto ofertado
Gestión económica del contrato
Mala gestión
1 a 1,5
Se sobrepasa el monto ofertado. Caso normal
Alerta
1,5 a 2
Se sobrepasa el monto ofertado por sobre un 50 %. Excesivo sobrecosto del proyecto
Fuente: elaboración propia.
Aprendizaje supervisado
Como se describió anteriormente, para la obtención de los factores «p» que evalúan la gestión de los servicios públicos y las empresas constructoras, se deben definir los criterios que serán los que determinen el valor de «p» de cada proyecto. De esta manera, se tendrán que seleccionar una serie de factores que se puedan extraer directamente de los datos o indirectamente a través de la creación de indicadores.
Desde la perspectiva del machine learning, la propuesta hecha cuenta con la opción de sacar todos los datos requeridos a través de la revisión que se hace de las resoluciones sujetas al trámite de toma de razón o en aquellos casos en que los proyectos serán supervigilados por medio del control de reemplazo que se propone.
68
Jonathan Nabor López Espinosa
Por otra parte, es del caso mencionar que esta Contraloría General cuenta con los antecedentes de proyectos antiguos desde donde se pueden obtener los da - tos requeridos por el modelo. Es decir, se dispone de datos de entrenamiento para el modelo, donde ya conocemos los resultados de la gestión de cada pro - yecto, sin embargo, no se ha podido consolidar dicha información para evaluar el desempeño de las empresas constructoras y los servicios públicos.
Al ingresar la información de proyectos antiguos, el modelo sería capaz de, en primera instancia, leerlos como valores acordes a los criterios establecidos, con lo cual se pueden generar interesantes análisis de gestión de los proyectos de obras públicas.
Tabla Nº 9
Pregunta Descripción/análisis Datos/indicador
¿Qué servicio público tiene el índice más alto de sobrecosto en sus proyectos?
¿Qué empresa constructora es la que más presenta proyectos con sobrecostos excesivos?
• Comparar entre distintos servicios públicos dentro de una misma región
• Comparar el desempeño de distintas direcciones regionales de un mismo servicio
• Existe una relación de esa empresa con un servicio en particular
• Gestión económica del contrato • Eficiencia del servicio en la estimación de las cantidades de obras (sobrecosto)
Fuente: elaboración propia.
La cantidad de análisis posibles es desconocida y depende de la capacidad que tengan los profesionales que realizarán dicha función. Hay que jugar con los datos para obtener información.
No obstante, lo que se espera del modelo es que realice predicciones de la ges - tión de un servicio y de una empresa constructora respecto de la ejecución de un proyecto. Entonces, con base en los datos de los proyectos antiguos, el modelo podría clasificar todo nuevo proyecto ingresado a la base de datos según el ries - go que exista en cuanto al cumplimiento del contrato. Luego, con esta clasifica - ción sería posible planificar las fiscalizaciones de obras públicas, anticipándose a posibles perjuicios provocados por mala gestión en el uso de recursos públi - cos, además de aumentar la probabilidad de alcanzar resultados relevantes en los informes que haga la Contraloría.
Tabla Nº 10
Matriz de confusión
Proyecto resulta mal evaluado
Proyecto presenta una gestión aceptable
Predicción de proyecto riesgoso OK -1
Predicción de proyecto no riesgoso
-100
OK
Fuente: elaboración propia.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Ahora bien, se deberá considerar que los proyectos previstos como riesgo - sos por el modelo, en los cuales se determine una inspección de obra pública —IOP— o fiscalización por parte de la Contraloría, alterarán el resultado espe - rado. Ello no debe ser interpretado como una falla del modelo, sino como una mejora debido a la intervención de la Contraloría.
En definitiva, la aplicación de estas técnicas de análisis de datos permitirá mejo - rar la eficacia de las auditorías. Esto debido a la capacidad de generar mejores hipótesis de hallazgos relevantes, respaldándose en una alta probabilidad de ocurrencia. Asimismo, la información obtenida, basada en análisis matemáti - cos y estadísticos, podría ser utilizada como medio de prueba para comprobar los actos ilícitos cometidos. Esto toma relevancia si pensamos que el auditor no solo está en permanente lucha con el defraudador, quien como ya vimos cuenta con un alto nivel de conocimiento y capacidades, sino que también se debe considerar que durante el proceso judicial, el defraudador tendrá el apoyo de abogados para establecer su defensa y desestimar los hechos, por lo tanto, contar con evidencia irrefutable es de suma importancia.
Conclusiones
En el estudio de las teorías propuestas para explicar la comisión de fraudes, quedó claro que el conocimiento y la capacidad de los sujetos defraudadores es un factor relevante a considerar, que obliga a las entidades de fiscalización superiores y a sus funcionarios a estar al mismo nivel o superior, para generar pruebas de control y procedimientos que logren prevenir o detectar los fraudes. Por otra parte, hay que tener en cuenta que estamos atravesando una revolución industrial. Una primera etapa fue el big data o tratamiento de datos masivos, los que ahora son la base para la implementación de sistemas de control, reconocimiento de patrones y predicción de eventos, que las entidades de fiscalización superiores deben incorporar en su estructura orgánica.
Hay que advertir que las tecnologías descritas en este trabajo, machine learning o deep learning, están disponibles para cualquier persona en el mundo —open source— y no son extremadamente costosas. Por lo tanto, con facilidad pueden ser utilizadas para cometer ilícitos no detectables y, en consecuencia, es recomendable que las entidades de fiscalización superiores capaciten a sus funcionarios en aprendizaje automatizado y en lenguajes de programación como Python.
El sistema de control y prevención de fraudes en contratos de obras públicas —CENTINELA— es una opción sencilla y viable que se puede implementar para, en una primera etapa, captar datos de los proyectos de inversión pública y tener una visión completa de los factores y variables que pueden afectar el desarrollo de estos. En la segunda etapa, al contar con suficientes proyectos finalizados y
69
70
Jonathan Nabor López Espinosa
evaluados, será posible implementar alguna técnica de machine learning para detectar fraudes. La etapa final sería el uso de sistemas basados en redes neu - ronales, para predecir el riesgo de fraudes o la probabilidad de éxito del proyecto respecto del buen uso de los recursos públicos, solamente con los datos de entrada obtenidos en la adjudicación.
Esta última máxima permitirá en el futuro profundizar respecto de la eficiencia de los servicios públicos en el gasto de sus proyectos para evitar el despilfarro. Se podrán determinar los sobrecostos, el abultamiento de presupuestos, la efi - ciencia de la licitación pública o el abuso de las modificaciones de contratos para aumentar el valor final del contrato.
En general, el modelo propuesto permitiría realizar un control administrativo de un gran número de proyectos, que pueden ser aquellos sujetos a toma de razón y todos aquellos que queden exentos debido a las nuevas disposiciones de las resoluciones Nºs. 7 y 8, de 2019, de la Contraloría General, pueden ser registra - dos a modo de control de reemplazo para no perder la información sobre estos. Si a esto le agregamos la acción de un dron que vaya a «ver» cada proyecto para obtener fotografías aéreas, con las cuales podríamos determinar el grado de avance de cada proyecto en tiempo real, se tendría un sistema completo de supervisión de obras públicas, a un reducido costo y con beneficios que aún no es posible determinar totalmente.
Por medio de un dron, no solo se puede constatar el avance de obras de proyec - tos de edificación, sino que también el estado de avance de las conservaciones globales de carreteras, pudiéndose verificar los cambios al obtener fotografías en dos momentos distintos, por ejemplo, con diferencia de dos semanas. Así se tendría que apreciar la realización de partidas como limpieza de faja, riegos asfálticos o reperfilados. Incluso es posible medir cotas o diferencias de alturas debido a las capas de material agregado y revisar el estado de los caminos.
Uso de técnicas de machine learning para la detección de fraudes en los contratos de obras públicas
Referencias
• Cavada Herrera, J. (2017). Delitos económicos: problemas y propuestas. Asesoría técnica parlamentaria, Biblioteca del Congreso Nacional de Chile. Obtenido de https://www.bcn.cl/asesoriasparlamentarias/ buscar?texto=delitos+economicos
• Cossío, A. (10 de mayo de 2018). Bots, machine learning, servicios cognitivos: realidad y perspectivas de la inteligencia artificial en España, 2018. Obtenido de PwC.es: https://www.pwc.es/es/publicaciones/ tecnologia/assets/pwc-ia-en-espana-2018.pdf
• Faura Llimós, D. (2016). El papel del auditor externo en la detección de fraudes. Revista de Contabilidad y Dirección (23), 97-110. Obtenido de https://accid.org/wp-content/uploads/2018/11/El_papel_del_auditor_ externo_en_la_deteccion_de_fraudes.pdf
• Fortunato, J., Santos, N., & Faroni, W. (2017). Diamante da fraude: um estudo descritivo nos relatórios de demandas externas do Ministério da Transparência e Controladoria Geral da União. VIII Congreso Internacional de Gobierno, Administración y Política.
• Galvis-Castañeda, I., & Santos-Mera, J. (2017). Geometría del fraude. Cuadernos de Contabilidad, 17(45), 74-85. Obtenido de http://www.scielo. org.co/pdf/cuco/v18n45/0123-1472-cuco-18-45-00074.pdf
• González-Muñiz, A. (2018). Aplicación de técnicas de inteligencia artificial basadas en aprendizaje profundo (deep learning) al análisis y mejora de la eficiencia de procesos industriales. Tesis de maestría, Universidad de Oviedo. Obtenido de https://www.researchgate.net/ publication/334328255_Aplicaciones_de_tecnicas_de_inteligencia_ artificial_basadas_en_aprendizaje_profundo_deep_learning_al_analisis_y_ mejora_de_la_eficiencia_de_procesos_industriales
• La Tercera. (1 de noviembre de 2002). Documentos revelan nuevos contratos de escándalo MOP-GATE. La Tercera. Obtenido de http://agv.cl/ cidhchilefigueroa/pe03sczaranski.pdf
• Sunqu. (2016). Introducción a machine learning. Obtenido de https:// sunqu.net/machine-learning-sectores-beneficio/
• Zayas Mariscal, L. (2016). Señales de alerta para la detección de fraude en las empresas. Revista de Contabilidad y Dirección (23), 61-68. Obtenido de https://accid.org/wp-content/uploads/2018/11/Senales_de_alerta_para_ la_deteccion_de_fraude_en_las_empresas
71
72 Jonathan Nabor López Espinosa
Anexo
Recursos matemáticos básicos utilizados en machine learning
a) Álgebra lineal: se utilizan operaciones entre matrices. Al definir una hipótesis h(x1,x2,x3,…..xn) en función de las características o variables que se quieren manejar. Por ejemplo, la asignación de valores creada para determinar bandas de selección.
Variable escogida: multas.
Criterio para asignación de puntajes: relación entre el monto de la multa con el monto total del contrato.
Bandas de clasificación: 0 % a 0,5 % bueno – 0,5 % a 1 % regular – 1 % a 5 % malo – sobre 5 % muy malo.
Puntajes asignados: el proyecto con un alto valor en multas castigará a los factores empresa e inspector fiscal. Bueno de 1 a 25 – regular 25 a 50 – malo 50 a 75 – muy malo 75 a 100.
Entonces, definidas todas las variables a evaluar, se obtiene la función:

b) Definir una función de costos con base en la hipótesis J(T1, T2, T3,….Tn). La función debe cumplir con ser convexa para que tenga un único mínimo global.
Función de costo:

c) Definir un algoritmo para minimizar la función de costos —encontrar la derivada de la función de costos para encontrar el mínimo—
Algoritmo de descenso del gradiente

para j:= 0 a (n)