La persuasión y la otra cosa: Una crítica de metodologías de datos grandes en la política


A principios de este año, una compañía llamada Cambridge Analytica saltó a la vanguardia del debate sobre grandes volúmenes de datos y las elecciones cuando se adjudicó la responsabilidad por las victorias malestar tanto de Donald Trump y la Campaña Brexit. Los informes han puesto en la empresa como un titiritero “máquina de propaganda”Capaz de votantes de menta a través de una mezcla patentada de datos psicométricos, principalmente Facebook “le gusta” y dirigido empujones. En esta historia, repetido por Mother Jones y The Guardian, entre otros, Cambridge Analytica [trabajando en conjunto con una firma de “administración electoral” denominado Grupo SCL] es a la vez un fabricante de rey y un Pied Piper: los votantes son incapaces de resistir los intentos de manipulación política, a medida que se integran a la perfección con los votantes’ entorno en línea y tirado por cuerdas demasiado profundamente anclados en los votantes’ psiques a ser ignorados.

dibujo parodia de aceite de serpiente de la marca de la estrella

elixir de aceite de serpiente, CC-BY Mike Licht

Estoy interesado en el contenido de serpiente real de aceite de serpiente de Cambridge Analytica. Como se ha señalado por la Technology Review del MIT y BuzzFeed, la compañía ha hecho algunas grandes afirmaciones y ha estado dispuesto a tomar el crédito por varios de los resultados electorales sorprendentes de 2016. Pero Cambridge Analytica basa en gran medida en el tecno-magia de la psicografía de datos grandes insuficientemente descrito y empuje algorítmica. Tanto el examen Tech y BuzzFeed señalan que la cantidad y el tipo de datos que la empresa parece utilizar no son muy diferentes de los tipos de adquisición y análisis de datos ya comúnmente en uso.

En lugar de ello estoy interesado en las formas en que argumento de venta de Cambridge Analytica refleja cómo los temas de estos proyectos de análisis de datos grandes son vistos por los que realizan la investigación, y los derechos en manos de los anunciantes, empresas de alta tecnología, e investigadores que implementan análisis de grandes volúmenes de datos en apoyo de las campañas políticas u otros proyectos políticos. Este sentido de la materia de ayuda social. Me gustaría plantear que el uso de “grandes datos” en la política despoja de sus objetivos de la subjetividad, convertir a los individuos en “objetos de datos lista para leer,”Y lo que es más fácil para aquellos en posiciones de poder justificar la manipulación agresiva e inferencia invasiva. Me gustaría sugerir además que cuando la metodología de datos grande se utiliza en el ámbito público, es razonable que estos “objetos de datos” a, sucesivamente, uso de tácticas como la ofuscación, hasta el punto de sabotear activamente la eficacia de la metodología en general, para resistir los intentos de ser leídos, conocido, y manipulado.

la disposición de Cambridge Analytica para lanzar su marca detrás hace que algunos podrían considerar que el mal cacklingly, junto con incidentes muy publicitados como el experimento de “contagio emocional” en Facebook 2014, han dramatizado estos temas para el público en general, pero muchos investigadores, particularmente Zeynep Tufekci, han sido la voz de alarma para las implicaciones metodológicas específicas grandes de datos en la arena política desde hace bastante tiempo. En 2014, Tufekci describió el problema de asimetría de información de la metodología de datos de gran, que no se trata simplemente de que los sujetos no saben tanto de los investigadores como los investigadores saben acerca de ellos, pero que, como un aspecto central de la metodología, sujetos a menudo ni siquiera saben que están siendo estudiados. Mientras que los modelos anteriores de la recolección de datos permitidos para el modelado de las poblaciones ásperas, Tufekci señala que permiten análisis de datos grandes para el modelado de las personas sin que el investigador tener que encontrarse con esa persona, o el individuo que está siendo consciente de sus acciones se están tomando en la esfera política.

Es razonable que los individuos utilizan tácticas como la ofuscación para resistir los intentos de ser leído, conocido, y manipulado como objetos de datos.

Al evitar cualquier responsabilidad a encontrarse con los sujetos de investigación en sus propios contextos, investigadores son libres de imaginar que los individuos en sus conjuntos de datos, sus objetos de datos, perfectamente alineados con las categorías analíticas pre-hechos del investigador, y aún más a imaginar que estas categorías describen la totalidad de ese individuo. Este es un problema familiar con metodologías de estudio a gran N, pero en la esfera política, vamos a sustituir “constituyentes” para los sujetos de investigación, y “funcionarios elegidos” para los investigadores. Mientras, como notas Tüfekçi, votación y el modelado población aproximada inferencial han sido durante mucho tiempo parte de la esfera política, el atractivo de modelado de datos tan grande es su supuesta capacidad para modelar específicamente a los individuos con un alto grado de exactitud de reflexión y predictivo. La retórica de metodologías de datos grandes como desplegado por Cambridge Analytica y otros proporciona la matemática, justificación metodológica para las campañas políticas y los gobiernos a ignorar constituyentes en favor de modelos de datos de los constituyentes.

La retórica de datos tan grande es el eco de la voz de adelantamiento, superando el mapa del territorio.

Este es el "doppelganger de datos" (un término acuñado por el crítico Sara Marie Watson) superando a la persona que es ostensiblemente su fuente, el eco de la voz de adelantamiento, superando el mapa del territorio. En tanto que estos duplis de datos se utilizan para impactar directamente, directo, e influir en la vida de las personas de cuyas acciones se derivan, el sentido en que su cognoscibilidad es a la vez asumido y construido únicamente a partir de bloques de construcción proporcionados por (poderoso) y otros prestados máquina legible, tienen un efecto de disminución potencial de estos individuos’ subjetividad y la agencia. El investigador (o el administrador anunciante o campaña) Ya no se trata de una persona poseedora de su propia agencia de auto-determinación y la subjetividad no se puede medir, sino más bien la manipulación de un objeto de datos totalmente comprensible.

Cathy O'Neil libro Las armas de destrucción de la matemáticas crudamente describe las formas en que las metodologías de grandes volúmenes de datos se utilizan para modelar y luego influir en las vidas individuales, ya sea a través leves empujones como el lento goteo de anuncios dirigidos, o el empujón más contundente de no conseguir un trabajo o de no poder calificar para un préstamo. O'Neil ha destacado hábilmente los peligros de la sustitución suites de comportamientos legibles por máquina o características para los encuentros reales con las personas como son, llamar a este tipo de modelado algorítmico “opiniones incrustados en las matemáticas” (p. 21). Matematizar el conocimiento subjetivo puede hacer que parezca objetivo, En este contexto, creando la impresión de que algorítmicamente el modelado de una persona es una manera útil o beneficioso o incluso superior a conocerlos.

Este modelo de agarrar otra persona únicamente a través de categorizaciones preestablecidas y acciones legibles por máquina no significa estar obligado a encontrar la diferencia. Pre-establecidos y categorías y acciones legibles por máquina son fundamentalmente aspectos que ya están familiarizados: son reconocidos como importantes por la persona que recoge los datos, por lo tanto, casi tautológica, su inclusión. Pero la diferencia de que incumple los límites del conjunto de datos se vuelve invisible. Kelly Oliver analiza la limitaciones de este “reconocimiento” modelo basado:

Cualquier contacto real con la diferencia o alteridad se hace imposible porque el reconocimiento requiere la asimilación de la diferencia en algo familiar… Sólo cuando empezamos a pensar en el reconocimiento de lo que es irreconocible podemos empezar a pensar en el reconocimiento de la diferencia. (p. 9)

La asunción de cognoscibilidad, que una persona puede ser captado con integridad matemática a través de sus sombras-yos digitales, está acoplado con un problema paradójico, un cierto derecho de la inferencia.

Tufekci ha proporcionado una descripción básica de este problema en la cita anterior, “Este tipo de modelos permite la adquisición de respuestas acerca de un individuo sin pedir directamente preguntas a la persona ...” Tufekci afirma que se ocupa principalmente de la implementación opaca de influencia o empujar técnicas en la esfera política, y, obviamente, estos efectos se refieren a mí, así. Soy, además, preocupado por el sentido del derecho necesario para deducir datos personales que haya quedado pendiente intencionalmente por los usuarios para los que la capacidad, la capacidad de no revelar, puede ser uno de los pocos verdaderos protección de la privacidad disponibles.

Tüfekçi destacados 2013 documento publicado por Michal Kosinski, David Stillwell, y Thore Graepel, intitulado, “Rasgos privadas y atributos son predecibles a partir de los registros digitales de la conducta humana.” Kosinski y sus colaboradores utilizan Facebook “como” los datos para modelar los individuos, la predicción de la “orientación sexual, etnicidad, puntos de vista religiosos y políticos, rasgos de personalidad, inteligencia, felicidad, uso de sustancias adictivas, separación de los padres, edad, y el género” (Kosinski, et al., 2013):

modelos de los investigadores, que únicamente utilizan Facebook ‘me gusta’ - una fracción de los datos disponibles para cualquier corredor de datos - discriminó correctamente si el usuario de Facebook es heterosexual o no en aproximadamente 88 por ciento de los casos; y predijo carrera con alrededor 95 por ciento del tiempo y de los partidos políticos sobre la afiliación 85 por ciento del tiempo (Kosinski, et al., 2013). En otras palabras, acaba de acceder a una fracción de los datos de Facebook, procesado a través de un modelo computacional, permite una gran parte delinear correctamente republicanos y demócratas sin mirar en cualquier otra base de datos, archivo de registro de votantes, las transacciones financieras o la pertenencia a organizaciones.

Tüfekçi señala además que estos rasgos se infieren aunque los datos disponibles y los algoritmos de modelado, no “se les pida o se observa desde el usuario,”Señalando que este tipo de modelado podría ser desplegado en espacios donde el comportamiento anónima o bajo seudónimo es común. La combinación de la separación de la facilidad de uso sujeto, junto con el supuesto de que ese mismo usuario-sujeto es totalmente asible desde el punto de vista del investigador, ocasiona el colapso de los derechos de privacidad de ese usuario-sujeto en la cara del derecho a saber por parte del investigador, el derecho de la inferencia en exhibición en el proyecto Kosinski y en otros muchos, comercial, político, y académica.

Es un salto corto de pensar conoces a alguien a pensar que saben lo que quieren o lo que es bueno para ellos, sin ninguna necesidad de persuadir o incluso pedir. Y la eliminación de la persuasión como un paso necesario de la esfera política elimina el consentimiento de la esfera política, así.

Hay dos riesgos para el despliegue de metodologías de grandes volúmenes de datos en la esfera política: el primero se ha articulado en varias ocasiones por Tufekci y otros, que las grandes metodologías de datos permitirán técnicas secretas u opacas de influencia que se desataron en el electorado, creando una tormenta de la propaganda personal a medida que se funde con la alimentación de los medios de comunicación de un usuario. Tufekci señala que este tipo de focalización “privatizado” permite que las campañas políticas para jugar directamente en los temores e impulsos reaccionarios de un cierto conjunto de los votantes, o hacer promesas sin revelar a otros con los que esas promesas podrían ser contraproducente. Esto crea una estructura política nacional menor de amplias comunidades de múltiples puntos de dirección y el compromiso de ser gobernados de manera integral, pero de individuos y grupos schism-ed, cada uno creyendo que son el conjunto de la comunidad que debe ser abordado, y cualquier otra persona es un intruso. turnos democracia de una forma de gobierno preocupados por lo menos teóricamente, con el debate público y la persuasión a uno centrado en privado, la manipulación opaca y la coacción emocional.

Se produce el segundo riesgo cuando los políticos y los gobiernos, rellena con los datos psicográficos y modelos algorítmicos, ya no sienten la necesidad de encontrar a los gobernados en absoluto.

Si creemos que el modelado de datos grande basada en los medios sociales generalizada plantea verdaderos riesgos para la democracia, ¿cuál es la mejor manera de mitigar estos riesgos?

Ambas situaciones retirar el consentimiento de los gobernados de la esfera política. Los métodos de observación invisibles intrínsecas a grandes volúmenes de datos basados ​​en los medios sociales impiden consentimiento significativo, al igual que el modelado inferencial destinado a recopilar información no divulgada. Y mientras que las elecciones aún, de una manera imperfecta, permitir a los individuos una voz en su gobierno, la mayor parte del negocio de las democracias representativas modernas tiene lugar en los tiempos en los períodos entre elecciones. Ya alejado de su voto a través gerrymandering, lobby corporativo, y los fracasos de la campaña de reforma financiera, podrían ser empujados a los votantes más lejos de sus representantes elegidos por sus datos doppelgangers? Podría ruidosos ayuntamientos, que requieren los representantes elegidos para viajar, que son vulnerables a las manifestaciones perturbadoras en persona, y que muchos republicanos han llevado a activamente (y cómicamente) esquivando desde enero, ser reemplazado por Cambridge / estilo Kosinski Analytica silencio, modelos constitutivos aquiescentes?

Si reconocemos que los riesgos para la democracia que plantea el modelado de grandes datos basados ​​en los medios sociales generalizada son genuinos, ¿cuál es la mejor manera de mitigar estos riesgos? Corto de demostrar que se, como una cuestión de ética política, este tipo de modelado constituyente no es ético y anti-democrático, o empresas de medios sociales convincentes para no vender “Me gusta” otros datos psicográficos, ¿Qué formas de resistencia podría ser desplegado a nivel individual o local?

excluirse, o la abstinencia medios de comunicación social se dirige de inmediato a la mente. Si no desea ser modelado u orugas, simplemente no participar en los sistemas que lo expongan a estos algoritmos de seguimiento y modelización. Sin embargo, esta estrategia no es efectiva en un número de niveles. Primero, que sólo protege a aquellos que son capaces de optar por estos sistemas de seguimiento y modelización; Dado el papel central jugadas de medios sociales en la vida social y profesional de muchas personas, optando a cabo simplemente no es una opción viable para todos. Segundo, con respecto a la cuestión específica de la modelización constitutiva, optando a cabo a nivel individual sería eliminar incluso la sombra representación ofrecida por el doppelganger de datos. Mientras suficientes personas participan en los sistemas que permiten este tipo de modelado, los que optan a cabo habrá simplemente no representados, y con toda probabilidad, no se perdió.

Ofuscación, como se describe por Finn Brunton y Helen Nissenbaum en su 2015 libro del mismo nombre, puede ser la mejor forma de resistencia a los sistemas de vigilancia y de modelización generalizados que son poco probable que sea rechazado por aquellos en el poder (o los que buscan el poder) debido a la percepción de su eficacia y rentabilidad. Mediante la utilización de métodos ofuscador, sistemas de estilo Analytica Cambridge de perfiles y la manipulación constituyente se pueden hacen ineficaz para la población objetivo en su conjunto, desalentar su uso.

Brunton y Nissenbaum destacan varios ejemplos diferentes de confusiones que podrían ser desplegados para hacer este tipo de modelado constituyente menos eficaz. Algunos de estos métodos ofuscador también muestran formas de modelado constituyente podía ser fácil de engañar por aquellos que desean influir en la percepción de votación o de un político de sus constituyentes, lo que subraya aún más los peligros planteados democráticos mediante el fomento de una separación entre el pueblo y sus representantes.

Eventualmente, tratando de encontrar su flujo de datos “verdadero” entre su mafia de clones de datos sería como tratar de encontrar una aguja en un pajar de otras agujas.

Varios de estos métodos crean ruido, ya sea en el nivel de la plataforma o el perfil individual.

  • la generación de ruido nivel de la plataforma podría ser como el apilamiento de una canal de datos grande, como Twitter o Facebook, con los robots ruidosos que comparten características sólo lo suficiente con el conjunto de datos específica que se incluirán.
  • Otro método, “-Agricultura como,”Implica el pago de los individuos a productos‘similares’o marcas en Facebook, a menudo miles a la vez. Este comportamiento podría devaluar “le gusta” como datos psicográficos.
  • A nivel de ofuscación individuo, Brunton y Nissenbaum nota varios complementos o experimentos que operan en la lógica de su extensión del navegador TrackMeNot, lo que ofusca verdadero problema con la búsqueda de un individuo mediante la generación de un zumbido de fondo de “falsas” las solicitudes de búsqueda para cada uno “real”.
  • argumento ad nauseam que funciona en el fondo de su navegador web, invisiblemente clic en cada anuncio en cada página que visite. Esta actividad inunda las redes de seguimiento de anuncios con los datos inútiles e inexacta, y también permite que los sitios web que visita para recoger los ingresos de los anuncios de pago por clic que cuentan.
  • FaceCloak crea una red dentro de la red de Facebook, permitiendo a los usuarios almacenar datos personales con FaceCloak en lugar de Facebook. Los usuarios de la FaceCloak add-on puede ver sus datos personales como integrado con su página de Facebook, pero Facebook no la posee.
  • Brunton y Nissenbaum también discutir “inundaciones bayesiano,”, Que involucra a individuos que alimentan activamente información falsa en sus perfiles de Facebook: “El truco es poblar su Facebook con sólo suficientes mentiras como para destruir el valor y comprometer la capacidad de Facebook para vender” (Cho citado en Brunton + Nissenbaum, p. 39).
  • Una táctica que implica tanto la ofuscación individuo y la plataforma es una patente, suficientemente interesante, por Apple, titulado “Técnicas para contaminar perfiles electrónico.”Brunton y Nissenbaum lo describen como un“servicio de clonación,”Destinada a“automatizar y aumentar el proceso de producción de información personal engañosa, la orientación recolectores de datos en línea.”Este servicio clonación sería imitar los ritmos y los comportamientos personales de un usuario, pero “puede comenzar a divergir de los intereses de una forma gradual, de manera incremental," (p. 36) navegar de forma automática, clic, suscribirse a sitios web y boletines, chatear con otros clones, tal vez el pedido pequeños elementos físicos de vez en cuando. Eventualmente, en teoría, tratando de encontrar su flujo de datos “verdadero” entre su mafia de clones de datos sería como tratar de encontrar una aguja en un pajar de otras agujas.

Para Brunton y Nissenbaum, ofuscación es de particular utilidad en los casos de las asimetrías de información y de poder, que, como se señaló anteriormente, son cuestiones fundamentales con analítica de grandes datos y el modelado inferencial. En cuanto a las acusaciones inevitables de la “contaminación de datos” o daño, Brunton y Nissenbaum concluir

[Yo]orden n para una carga de contaminación de datos para pegar, un conjunto de datos se debe demostrar que cuentan con un mayor valor que cualquiera que sea el Ofuscador tiene como objetivo proteger la contaminación ... .Data es ético sólo cuando éticamente se requiere la integridad del flujo de datos o conjunto de datos en cuestión. Por otra parte si la integridad de los datos supera otros valores e intereses en juego debe ser resuelta de forma explícita. (p. 69)

En las implementaciones de políticas de análisis de datos grandes y modelado inferencial, lo que está en juego es la capacidad de los poderosos para ver y significativamente comprometerse con un electorado consintiendo. Una afirmación puede hacerse que si continúa la tendencia actual, y metodologías de datos psicográficos grandes se convierten en un medio primario de la campaña electoral y gobernabilidad, activamente el intento de reducir la eficacia de ese conjunto de datos sería un movimiento poco ético. Pero hay otras maneras para que los gobiernos y las campañas para encontrar su electorado, de averiguar la mejor manera de representar a sus constituyentes. Un ayuntamiento puede tener el potencial para ser un poco incómodo, ruidoso, e impredecible, pero permite un encuentro entre el pueblo y sus representantes elegidos. Referendos sobre temas específicos, dado al público por votación directa, no puede revelar información privada: su voto sobre la legalización de la marihuana medicinal no revelará si eres gay.

Como democracia moderna, los EE.UU. sobresale en el desarrollo de nuevos mecanismos para distanciar al individuo del poder de su voto. metodologías de grandes volúmenes de datos y los análisis inferencial en que se conecta como desplegadas en las elecciones presentan otro movimiento para empujar a la gente, en toda su ruidosa, sucio, mutabilidad exigente, fuera de la política. Pero a diferencia de gerrymandering o el colegio electoral, este movimiento se puede resistir activamente en el nivel individual.

Etiquetas: , , , , , , ,

Trackbacks / Pingbacks

  1. 5.24: travesura; moderación secreto; aceite de serpiente || Datos & Sociedad - Mayo 31, 2017

    […] La persuasión y la otra cosa: Una crítica de metodologías de datos grandes en la política […]

  2. La persuasión y la otra cosa: Una crítica de metodologías de datos grandes en la política | Cuestiones Etnografía | Nota al uno mismo - Junio 4, 2017

    […] saltar; La persuasión y la otra cosa: Una crítica de metodologías de datos grandes en la política; En materia Etnografía; […]

Deja un comentario