Google recopila voces de niños, matrículas de coches y direcciones de usuarios de forma accidental, según una filtración

Una ilustración del logo de Google en el iris de una persona.

ktsimage/Getty; Tyler Le/Business Insider

  • Google está teniendo unos días especialmente complicados en lo que a filtraciones se refiere. 
  • La semana pasada, el gigante de las búsquedas online tuvo que afrontar una filtración que dejaba entrever cómo funcionaba su algoritmo. Esta semana, una base de datos interna ha revelado miles de incidentes relacionados con la privacidad.

La grandes compañías tecnológicas acostumbran a tener bastantes problemas para que no se filtre ningún tipo de información interna relacionada con su actividad. Y es que, puede tratarse de una tarea complicada teniendo en cuenta que el producto con el que trabajan suele ser precisamente la información que generan los usuarios de sus plataformas. 

Sea como fuere, las empresas del sector tecnológico tienen que hacer frente de vez en cuando a la filtración de información. Sin embargo, en el caso de Google, los últimos días están siendo especialmente complicados en ese sentido. 

La firma de Mountain View, que ya de por sí no atraviesa su mejor momento a nivel reputacional (con incidentes como el de la pizza con pegamento en sus resultados de búsqueda generados por inteligencia artificial), tuvo que afrontar la semana pasada una filtración masiva que dejó ver a los más curiosos la forma en la que funciona su algoritmo de manera interna. 

"Durante más de una década, nos han mentido", denunció entonces Erfan Azimi, CEO de EA Eagle Digital (una agencia de SEO), que dijo haber encontrado por primera vez la documentación filtrada y que dio a entender que Google podría no haber sido del todo honesta sobre las métricas más importantes que determinan qué webs aparecen en la mitad superior de su página de resultados.

Google en tablet

Aun así, el calvario de la compañía tecnológica no acabó ahí. Y es que, tal y como ha publicado en exclusiva 404 Media, esta semana se ha vuelto a filtrar información confidencial de Google. Concretamente, el medio de comunicación especializado en tecnología ha tenido acceso a una base de datos que recoge miles de incidentes de privacidad registrados durante años por la empresa de Sundar Pichai.

Según una copia de una base de datos interna de Google (que cuenta con registros de al menos seis años), el gigante de las búsquedas online ha recopilado accidentalmente datos de voz de niños, ha filtrado los viajes y las direcciones de los usuarios de coches compartidos y ha hecho recomendaciones en YouTube basadas en el historial de visionados de los usuarios. 

Desde 404 Media matizan que es posible que cada uno de estos incidentes, la mayoría de los cuales no se habían hecho públicos anteriormente, solo afectase a un número relativamente pequeño de personas o se solucionase rápidamente. Sin embargo, dejan ver cómo una de las compañías más poderosas del mundo gestiona —y a menudo no lo hace correctamente— una cantidad asombrosa de datos personales.

Entre los datos a los que ha tenido acceso el medio tecnológico se encuentran incidentes de todo tipo, desde problemas con los propios productos de Google o con las prácticas de recopilación de datos; vulnerabilidades en proveedores externos utilizados por Google; o errores cometidos por el personal de Google, subcontratas u otras personas que han afectado a los sistemas o datos de Google. 

Por ejemplo, en un caso de 2016, un empleado de Google denunció que los sistemas de Google Street View transcribían y almacenaban números de matrícula de las fotos

"Desafortunadamente, el contenido de las matrículas también es texto y, aparentemente, se ha transcrito en muchos casos", detallaba el trabajador. "Como resultado, nuestra base de datos de objetos detectados desde Street View ahora contiene de forma involuntaria una base de datos de números de matrícula geolocalizados y fragmentos de números de matrícula".

 

"Quiero enfatizar que esto fue un accidente. El sistema que transcribe estos fragmentos de texto debería haber estado evitando las imágenes identificadas por nuestros detectores de matrículas, pero, por razones aún desconocidas, no fue así", añadía el empleado. 

En otro ejemplo destacado por 404 Media, un servicio de voz de Google registró por error todo el audio que recibió —incluidos unos 1.000 datos de voz de niños— durante aproximadamente una hora. "Se recopilaron aproximadamente 1.000 conversaciones de niños. El equipo eliminó todos los datos de voz registrados durante el periodo de tiempo afectado", rezaba el informe.

Google ha declarado a través de un comunicado que sus trabajadores "pueden señalar rápidamente posibles problemas de producto para que los revisen los equipos pertinentes" y ha añadido que "cuando un empleado envía el aviso, se sugiere el nivel de prioridad al revisor".

"Los informes obtenidos por 404 se remontan a hace más de seis años y son ejemplos de estos avisos, los cuales se revisaron y resolvieron en su momento. En algunos casos, estas alertas de los trabajadores resultaron no ser problemas en absoluto o eran problemas que los empleados encontraron en servicios de terceros", ha valorado la empresa.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.