Maximiza la colaboración mediante el intercambio seguro de datos
1 Octubre 2019
1 Octubre 2019
Ante el reto de competir en un mundo cada vez más impulsado por la IA, las empresas son cada vez más conscientes de la importancia de ampliar su acceso a los datos a través de ecosistemas de asociación con terceros para crear nuevas ventajas y oportunidades de crecimiento. El carácter cada vez más distribuido de los datos sobre consumidores hace que muchas empresas no generen por sí mismas los niveles de datos necesarios para obtener los conocimientos imparciales que se requieren para proporcionar nuevas experiencias, abrir nuevas corrientes de ingresos y aplicar nuevos modelos comerciales.
Esta creciente necesidad de compartir datos se refleja en una reciente encuesta de Accenture a altos ejecutivos, en la que el 36% indica que el número de organizaciones con las que se asociaron al menos se ha duplicado o en los últimos dos años. La misma encuesta también reveló que el 71% de los ejecutivos prevee que el volumen de datos intercambiados con los ecosistemas aumentará.
Asimismo, según una reciente encuesta de los servicios analíticos de Harvard Business Review, el 78% de las empresas destacó la capacidad de acceder fácilmente a los datos de diversas fuentes externas y de combinarlos como algo muy importante para una empresa basada en datos. Sin embargo, sólo el 23% dijo que actualmente es muy eficaz en este ámbito, y el 15% compartía los datos con los principales proveedores y vendedores. ¿Por qué las empresas no logran desbloquear el valor cautivo de sus datos y el de sus socios del ecosistema?
Una nueva familia de técnicas de computación para preservar la privacidad (PPC), con 30 años de preparación, está lista para interrumpir significativamente el espacio de intercambio de datos de la empresa.
Si bien muchos señalan con razón las dificultades para superar los obstáculos jurídicos y técnicos, estos desafíos no son insuperables. Entre los principales obstáculos para el intercambio eficaz de datos que existen hoy en día se encuentra el hecho de que:
Sin embargo, una nueva familia de técnicas de computación para preservar la privacidad (PPC), con 30 años de preparación, está a punto de perturbar significativamente el espacio de intercambio de datos de la empresa. Estas técnicas se han establecido para hacer frente a las dos barreras clave, permitiendo que los datos sean analizados conjuntamente sin compartir todos los aspectos de esos datos. Al hacerlo, las empresas pueden recuperar el control de sus datos y los riesgos asociados a su intercambio, incluso cuando se utilizan más allá de sus fronteras.
Una nueva familia de técnicas de computación para la preservación de la privacidad (PPC) está lista para interrumpir significativamente el espacio de intercambio de datos de la empresa.
Las técnicas de computación para preservar la privacidad (PPC) son una familia de técnicas de ciberseguridad muy modernas que, en lugar de centrarse en la protección de los datos contra el acceso de partes no autorizadas, estudian la forma de representar los datos de manera que puedan ser compartidos, analizados y operados sin exponer la información en bruto. Las técnicas de encriptación suelen constituir el núcleo de la forma en que las técnicas de la PPC proporcionan estas capacidades, pero se utilizan de una forma ligeramente diferente a la habitual.
Tradicionalmente, la encriptación se utilizaba para garantizar la seguridad e integridad de los datos confidenciales contra el acceso no autorizado durante el tránsito entre las partes. Aunque la encriptación proporciona un grado razonable de protección contra las interferencias externas en el tránsito, para poder procesar los datos, el receptor de los mismos debe tener acceso a las claves para descifrarlos. Sin embargo, hay dos riesgos durante este proceso que deben ser considerados:
Estos riesgos podrían limitar el valor de negocio que las empresas pueden extraer de sus datos sensibles porque dificultan las posibles colaboraciones de intercambio de datos.
Las técnicas de PPC utilizan la encriptación de manera diferente para proporcionar un mecanismo para compartir datos con otras partes, limitando al mismo tiempo cómo o dónde las otras partes pueden acceder a los datos, qué partes de los datos pueden ver o qué pueden inferir de los datos. Existen diferentes esquemas adoptados por las distintas técnicas de PPC para lograr esto, pero normalmente hacen una o más de las siguientes cosas:
Podrías pensar en esto como cocinar una comida sin ver los ingredientes o armar un rompecabezas sin ver la imagen del resultado deseado.
Más allá de la trazabilidad y el control de las consideraciones de datos, las tecnologías [PPC] permiten a los asociados trabajar de manera descentralizada, dándoles la oportunidad de investigar conjuntamente cuestiones comerciales comunes o compartidas.
A continuación se presentan algunas de las principales técnicas de PPC que están ganando importancia hoy en día. (También puedes profundizar en los detalles de cada técnica en nuestro informe completo).
Aunque estas técnicas y tecnologías de PPC son todavía nuevas, están madurando rápidamente y se encuentran ahora en un punto en el que pueden utilizarse en casos de uso comercial reales. La seguridad de los datos en reposo, en tránsito e incluso durante la computación es ahora posible utilizando Entornos de Ejecución Confiable. Compartir públicamente los datos estadísticos sin comprometer la privacidad de los registros individuales es ahora posible con la Privacidad Diferencial. El análisis de datos encriptados es ahora posible gracias al desarrollo de esquemas de encriptación, como la Encriptación Homomórfica. A través de estas tecnologías, los datos sensibles pueden ser encriptados y protegidos en todas las etapas y pueden ser utilizados por un número de partes confiables o no confiables para generar conocimientos sin exponer los datos involuntariamente.
Con esta tranquilidad, las técnicas de PPC abren muchas nuevas oportunidades de colaboración empresarial que antes no eran posibles debido al riesgo o la regulación. Más allá de la trazabilidad y el control de las consideraciones de datos, estas tecnologías permiten a los asociados trabajar de manera descentralizada, dándoles la oportunidad de investigar conjuntamente cuestiones comerciales comunes o compartidas. Las empresas también pueden aplicar la inteligencia artificial y métodos mejorados de análisis a conjuntos de datos a los que no habían tenido acceso anteriormente. Esto significa que las colaboraciones con partes externas -incluso con competidores- son ahora posibles y, en algunos casos, están muy avanzadas.
Las técnicas de PPC abren muchas nuevas oportunidades de colaboración empresarial que antes no eran posibles debido al riesgo o a la regulación.
Tras un largo período de incubación, las técnicas de PPC están en la cúspide de una nueva fase de adopción por parte de la industria gracias a la alineación de las capacidades tecnológicas con las necesidades del mercado. La posible oportunidad ha llevado a la creación de un ecosistema inicial de rápida evolución y fuertemente financiado. Y las empresas e instituciones innovadoras están invirtiendo y experimentando con estas técnicas para comprender el arte de lo posible.
Por ejemplo, Google lanzó su protocolo de código abierto Private Join and Compute este año, aprovechando la Encriptación Homomórfica y MPC. Aunque todavía está en una etapa temprana en términos de solidez empresarial, el protocolo sirve para ilustrar la creciente importancia de las técnicas de PPC.
Las técnicas de PPC también se utilizan hoy en día para ayudar a los competidores que operan en el mismo mercado o para permitir colaboraciones en campos muy regulados, como el descubrimiento de medicamentos. En una de las primeras implementaciones comerciales de MPC, la industria azucarera danesa colaboró con Partisia® para desarrollar un intercambio confidencial de contratos de producción entre los cultivadores de remolacha azucarera, lo que permitió a la industria reajustarse a las nuevas situaciones del mercado. Por otra parte, en 2019, 10 grandes empresas farmacéuticas desarrollaron el consorcio Melloddy, que utiliza blockchain y el aprendizaje federado* para entrenar un algoritmo de aprendizaje de máquinas de descubrimiento de medicamentos utilizando datos compartidos.
Además, las técnicas de PPC están permitiendo que las empresas desarrollen nuevas relaciones de intercambio de datos fiables con los consumidores. Por ejemplo, Kara es una nube de datos que preserva la privacidad, aprovechando los entornos de ejecución de confianza y la privacidad diferencial para crear una forma segura de que los pacientes compartan y moneticen sus datos médicos con los investigadores, manteniendo al mismo tiempo el control total de sus datos. Kara funciona en la plataforma basada en blockchain de Oasis Labs y es la base de un ensayo médico que se está llevando a cabo actualmente en la Universidad de Stanford. Los investigadores médicos pueden someter los sistemas de IA para su entrenamiento, sin ver nunca los datos subyacentes.
Las técnicas de PPC también se utilizan hoy en día para ayudar a los competidores que operan en el mismo mercado o para permitir colaboraciones en campos muy regulados, como el descubrimiento de medicamentos.
Las técnicas de PPC también se están utilizando para abordar muchos problemas de reglamentación de los mercados, como la banca, mediante el acceso y el procesamiento de datos sensibles en forma codificada para obtener únicamente información. Por ejemplo, ING Bélgica utiliza el motor de computación secreto XOR de Inpher para construir modelos analíticos utilizando datos de múltiples países como Suiza y Luxemburgo que tienen normas estrictas de seguridad de datos y de privacidad. Los algoritmos patentados generados por los equipos de ciencia de datos de ING se compilan con XOR y son computados secretamente por todos los centros de datos regionales y/o proveedores de servicios de nube sin revelar ninguna información sensible; no se exporta ninguna información de identificación personal de ninguna jurisdicción.
Además, las técnicas de PPC ya han sido utilizadas por los gobiernos. En 2015, el gobierno estonio trabajó con Sharemind® para desarrollar el Proyecto de Estadísticas Privadas, que realizó un análisis de una combinación de registros fiscales y educativos identificables utilizando PPC. El proyecto PRACTICE de la Comisión Europea analizó este proyecto y estuvo de acuerdo con las conclusiones de la Agencia de Protección de Datos de Estonia de que no se habían procesado datos personales.
Incluso hay planes para usar técnicas de PPC en las próximas elecciones: El condado de Travis, Texas, está a punto de implementar STAR-Vote, un sistema de votación seguro, transparente, auditable y fiable, que utiliza el cifrado homomórfico, para supervisar el proceso de votación verificado antes de las elecciones presidenciales de 2020.
Accenture ha estado ayudando a las empresas a adoptar la IA y blockchain, y estamos buscando técnicas de PPC para reducir las barreras para que la IA pueda acceder a más datos.
Si bien la capacidad de compartir de forma segura datos sensibles presenta oportunidades inmediatas, también hay nuevas oportunidades de disrupción de los mercados existentes mediante el efecto combinado de las técnicas de PPC y otras tecnologías como blockchain y el IoT. Actualmente, varias empresas y organizaciones están considerando estas tecnologías en áreas como:
Las técnicas PPC son un disruptor mayor, y Accenture está trabajando con los bancos para entender cómo las tecnologías como el cifrado homomórfico podrían ayudar en los casos transfronterizos contra el lavado de dinero y el fraude.
En Accenture, estamos trabajando a través de múltiples industrias para llevar a cabo un intercambio seguro de datos y permitir una mayor colaboración.
En primer lugar, los equipos a través de Accenture Tech Labs, Liquid Studios y The Dock Innovation Centre en Dublin están calibrando nuestra comprensión para evaluar los diversos marcos de Cifrado Homomórfico y MPC y si pueden abordar los tipos de computación que cada caso de uso requiere. En este campo incipiente, los diferentes marcos se especializan en diferentes tipos de cómputo, es decir, aritmética, regresión lineal o modelos forestales aleatorios, lo que los hace muy adecuados para ciertos casos de uso y menos adecuados para otros. Estamos evaluando las diversas compensaciones con cada técnica de PPC, especialmente en términos de su impacto en el rendimiento y cómo los nuevos estilos de diseño de hardware -como los chips Field Programmable Gate Array* (FPGAs) y las CPUs de propósito general (GPGPUs)*- pueden reducir los impactos en el tiempo y el costo del uso de estas tecnologías.
A medida que identificamos oportunidades, miramos a las técnicas PPC para expandir la apertura de los datos disponibles para IA. Accenture ha estado ayudando a las compañías a adoptar la IA y Blockchain, y estamos buscando técnicas de PPC para reducir las barreras para que la IA pueda acceder a más datos, incluyendo datos de alto riesgo y confidenciales.
Por ejemplo, estamos trabajando con las partes del ecosistema de semiconductores para crear una forma confiable y distribuida de compartir datos usando MPC y blockchain. Los fabricantes de equipos necesitan datos para ofrecer mejores soluciones para sus equipos, piezas y servicios, y los proveedores necesitan proteger sus datos, así como los de los proveedores de nivel inferior y los datos restringidos a los clientes (es decir, los datos relacionados con la metrología e integración en línea y fuera de línea). Si bien blockchain permite la rastreabilidad y el control de las vistas de datos, los problemas de la propiedad intelectual son tan graves que el fabricante de equipo que opera con datos en bruto suele ser reacio a compartir los datos, incluso si el procesamiento analítico nunca sale de la red. MPC podrá resolver este problema y permitir un análisis de datos fiable y seguro.
Con el creciente argumento a favor de la colaboración de los ecosistemas y la necesidad de métodos eficaces y seguros de intercambio de datos y colaboración, las técnicas de PPC y sus sucesores serán fundamentales para un intercambio de datos eficaz y seguro.
Específicamente construyendo a partir de bolckchain, estamos personalizando las técnicas de PPC para las empresas que cooperan en un sistema de contabilidad de blockchain u otro libro de contabilidad distribuido similar. Esta combinación tiene aplicaciones en las que las empresas tienen requisitos para tratar con la privacidad y la auditabilidad al mismo tiempo. También hemos lanzado recientemente un nuevo proyecto de código abierto llamado PyHeal para ayudar a que el uso de algunos de estos marcos, como Microsoft SEAL, sea más ampliamente accesible y adoptable por los usuarios en un contexto empresarial.
Las técnicas de PPC son un gran disruptor, y Accenture está trabajando con los bancos para entender cómo tecnologías como la Encriptación Homomórfica podrían ayudar en casos de uso transfronterizo contra el lavado de dinero y el fraude. Podría ser muy beneficioso para los bancos poder hacer preguntas sobre transacciones potencialmente fraudulentas a otros bancos sin tener que exponer los datos de sus clientes o solicitar datos al otro banco, lo que a menudo es imposible debido a las leyes de confidencialidad bancaria y otras legislaciones similares. Tecnologías como el MPC y la Encriptación Homomórfica permitirían a los bancos responder a las preguntas en un conjunto de datos virtuales compartidos sin necesidad de compartir los datos reales entre sí.
Como lo discutimos, las empresas de innovación ya han comenzado a desplegar técnicas de PPC en escenarios del mundo real, combinando las capacidades internas con la experiencia externa de PPC. Las empresas que buscan abrazar estas posibilidades necesitan hacerlo:
Con el creciente argumento a favor de la colaboración de los ecosistemas y la necesidad de métodos eficaces y seguros de intercambio de datos y colaboración, las técnicas de PPC y sus sucesores serán fundamentales para un intercambio de datos eficaz y seguro. Esto, a su vez, será fundamental para que las empresas obtengan valor de sus datos y proporcionen nuevas vías de interrupción. Estamos en el camino de industrializar las ofertas de PPC para que nuestros clientes puedan aprovechar nuevas oportunidades a corto y largo plazo. Hablemos de lo que eso podría significar para su negocio.
Glosario de términos:
Ofuscación de datos: El proceso de ocultar los datos originales modificando el contenido, es decir, sustituyendo ciertas partes del contenido por un contenido sin sentido y manteniendo los datos utilizables. Normalmente se utiliza para proteger datos sensibles o identificables personalmente y también se denomina "Data Masking".
Anonimización o desidentificación: Se refiere a los tipos de ofuscación que tienen por objeto mantener la privacidad sustituyendo el contenido de identificación personal, es decir, los nombres, direcciones, números de teléfono, etc., por valores que no tienen relación directa con esa persona.
Internet de las cosas (IoT): Se refiere a la incrustación de sistemas y sensores en dispositivos y objetos físicos que les permiten interconectarse entre sí y con la Internet más amplia sin intervención humana.
Field Programmable Gate arrays: Tipos de microchips que permiten que su propia configuración interna sea configurada por los usuarios finales o integradores que permiten que los chips se configuren de una manera que se ajuste y se adapte al caso de uso exacto del propietario. Esto permite lograr un mayor rendimiento utilizando hardware adaptado para un propósito determinado sin necesidad de poner en marcha hardware personalizado.
CPUs de propósito general (GPGPUs): Chips de hardware diseñados específicamente para manejar las tareas altamente paralelas de renderizar y refrescar gráficos complejos (2D y 3D) en una pantalla. Se descubrió que estos mismos chips eran mucho más eficientes que las CPU estándar para realizar otras tareas de procesamiento con cargas paralelas. Las GPGPU son una extensión de los mismos tipos de chips pero adaptadas más hacia un procesamiento de datos paralelo más general que el procesamiento de gráficos.
Aprendizaje federado: Un enfoque de aprendizaje de máquinas para la formación de un modelo central y compartido utilizando datos que se distribuyen en múltiples lugares en lugar de estar disponibles centralmente. Tiene aplicación cuando no se dispone de todos los datos de capacitación en el mismo lugar o al mismo tiempo o cuando no es posible o conveniente llevar los datos de capacitación a un lugar central. Permite utilizar los datos donde existen sin necesidad de retirarlos de su ubicación (es decir, un teléfono móvil u otro dispositivo) y luego vincula los aprendizajes al modelo central sin tener que enviar de vuelta los datos reales.