En la próxima entrada de ‘La persona en el (Grande) Datos‘ edición, Chris Birchall @birchallchris nos habla a través de una variedad de métodos – grande, pequeña y mezclado – que usó para estudiar la ciudadanía en el Reino Unido. El uso de algunas de las herramientas dominantes para el estudio de las grandes fuentes de datos en una parte del estudio, Chris se dio cuenta de que las herramientas utilizadas tenían un impacto significativo en lo que puede ser (y se está) descubrió y que esto es bastante diferente de los resultados alcanzados por más profunda, análisis de métodos mixtos. En este post, Chris hace preguntas importantes acerca de si las herramientas de investigación de datos grandes están creando algunas de las condiciones de la ciudadanía hoy y lo, exactamente, más profundo, análisis más matizado puede decirnos.
La gente habla de la política en línea de muchas maneras diferentes y para muchos propósitos diferentes. La forma en que los investigadores analizan y entienden estas conversaciones pueden influir en la forma en que representamos opinión política pública y la ciudadanía. En dos proyectos recientes he investigado la naturaleza de esta conversación y las fuerzas que influyen en ella, así como las redes, espacios y recursos que tienen enlaces que hablar con la acción política. Al hacerlo, Me encontré con un distanciamiento metodológico en el que cuidado, manual, enfoques que requieren mucho tiempo producen diferentes tipos de conclusiones a partir de los datos de grandes enfoques que son impulsados generalizado en la industria comercial de análisis de redes sociales. Ambos enfoques se podría enmarcar como una ilustración de la conducta humana en el Internet, pero sus diferencias muestran que la forma en que abrazamos grandes volúmenes de datos o métodos digitales influye en la comprensión de los públicos digitales y ciudadanía que obtenemos de la conversión de datos en línea de masas.
Mi estudio de doctorado presentada recientemente investigó conversación política pública en línea en el Reino Unido. Basándose en el trabajo de eruditos anteriores que se han centrado en el ámbito de deliberación pública en línea (tales como Coleman y Götze, 2001; Coleman y Moss, 2012; Mutz, 2006; Wright y la calle, 2007; Graham, 2012), el estudio reconoció la importancia del intercambio interpersonal entre los participantes y la exposición a diversos puntos de vista opuestos y en la formación de las preferencias y la opinión informada. Mi motivación inicial fue a preguntar cómo podría influir en el diseño de interfaces, ya que las personas hablan de política en los espacios en línea, pero esto requiere un examen de la más humana, factores tecnológicamente menos determinadas que son también, y a menudo más significativamente, involucrados en la expresión política.
En el transcurso del estudio se hizo evidente que la metodología utilizada para investigar estos conceptos influye en la visión obtenida; algo que muchos investigadores han discutido en el contexto de los métodos digitales dentro de las ciencias sociales (Baym, 2013; Boyd y Crawford, 2012; Clough et al., 2015; Gitelman y Jackson, 2013; Kitchin y Lauriault, 2014; Kitchin, 2014; Manovich, 2011; Van Dijck, 2014). Tecnológicamente mediadas preguntas pueden ser respondidas a través de métodos centradas en la tecnología para dar respuestas tecnológicamente se centraron, mientras que las cuestiones que implican la naturaleza humana, la motivación y la interacción pueden ser respondidas por cualitativa, métodos centrados en humanos con el fin de dar respuestas centradas en humanos. Estos enfoques representan la brecha entre el gran escala, análisis cuantitativo de los métodos de grandes volúmenes de datos y enfoques cualitativos a pequeña escala. Con el fin de abordar esta cuestión, I empleado una metodología que fue diseñado para combinar estos enfoques a través de iteraciones dirigidas de análisis que era inicialmente gran escala y cuantitativa, pero cada vez más pequeña escala y cualitativa.
La comprensión de los orígenes, la naturaleza y el desarrollo de la conversación en línea emergente en el Reino Unido requieren una vista inicialmente muy gran escala, situándola dentro del paradigma de datos grande. Por lo tanto, he creado software a medida para la recogida y análisis de datos de conversación automaticé. Texto fue raspada de páginas web, pero los datos también se cosechó sobre las conexiones entre las contribuciones incluidas las respuestas y las cotizaciones realizadas en estructuras de interfaz de usuario específica, y los gustos, y recomienda que los acompañó. Estos datos fueron traducidos a la métrica para la conexión y la dominancia cuantitativa – medidas que proporcionaron cifras principales generales para los diferentes espacios en línea, la cual se describe en líneas generales la naturaleza de la conversación que ocurre allí.
Sin embargo, evaluación manual de estas métricas ilustra defectos dentro de este método, como he encontrado que los detalles de las conversaciones a menudo mal representado por las estructuras de interfaz que los contenían. Por ejemplo, respuestas a menudo estaban presentes en el contenido textual de un mensaje, mientras que las contribuciones marcadas como respuestas eran a menudo sólo declaraciones de opinión o preferencia. Sin embargo, mientras tanto impreciso, las generalizaciones obtenidos en este primer paso resultaron útiles para el propósito de dirigir análisis adicional en forma de investigación más cualitativa de las estadísticas de titular significativas, tal como la codificación manual de las muestras, mapeo de discusión y análisis de redes sociales. Los hallazgos resultantes revelaron patrones detalladas dentro de las conversaciones, incluyendo los modelos participativos distintivos dentro de espacios particulares (dos se ilustran a continuación). Finalmente, encuestas y entrevistas con los participantes siempre y cuando el nivel de comprensión humana que carecía de las dos etapas anteriores, lo que permite comprender por qué la participación se produjo en la forma en que lo hizo.

Dos mapas de conversación que ilustran dos modos muy diferentes de participación: a la izquierda, una conversación en un foro está muy conectada con diversa opinión actual – caracterizado por largas cadenas de mensajes, acuerdos (nodos verdes) y desacuerdos (nodos rojos); a la derecha, una conversación más desconectados en Twitter, llena de expresiones individuales con sólo una pequeña proporción de las interacciones. [Imagen creada por el autor, CC BY-NC-SA 3.0]
Usada para estimular un análisis más detallado de esta manera, métodos de datos grandes pueden proporcionar un valor significativo para la investigación social. Sin embargo, esto está lejos del método predominante para la comprensión de los públicos digitales. enfoques convencionales suelen estar dominadas por las herramientas de análisis de redes sociales comerciales que proporcionan datos que son difíciles, o imposible, para acceder como investigador independiente (tales como datos de Facebook Tema, uno de los desarrollos de marketing más calientes 2015 que proporciona despojados de elementos identificatorios, Acceso agregada a las contribuciones personales privados). Estas herramientas se utilizan no solamente por las empresas para entender a los clientes, sino también cada vez más por los medios de comunicación, ONG y las instituciones políticas para comprender las formas contemporáneas de expresión política, como se describe por Ceron et al. (2013) y Roginsky y Jeanne-Perrier (2014).
Un estudio posterior, investigar la naturaleza interconectada de espacios de participación en línea y enlaces entre la conversación y la acción política la aplicación de estos métodos para acceder a datos de medios sociales relacionados con diversos acontecimientos políticos recientes. La gran mayoría de los datos resultantes consistía en mensajes de redes sociales en las que los enlaces a espacios de acción política - tales como peticiones en línea - se compartieron junto con enlaces a la corriente principal relacionada medios de comunicación. Estos resultados podrían interpretarse para describir los ciudadanos en línea que responden principalmente a medios de comunicación, pero este juicio se basa en mediciones cuantitativas que carecen de los matices de los métodos mixtos enfoque descrito anteriormente, ofreciendo sólo una imagen de qué sucedido, sin ningún conocimiento real por qué ocurrió. El estudio hace describir una forma de ciudadanía en línea, pero también pone de relieve algunas de las implicaciones de la dependencia de la corriente principal de herramientas de análisis digitales.
Nuestra comprensión de la ciudadanía digital, y las intervenciones en este entorno digital dependen cada vez más de tales métodos, en parte debido a la naturaleza de los ‘caja negra’ de las redes sociales y nuestras capacidades limitadas para acceder a determinados aspectos de la misma, pero también debido a la escala a la que existe que puede hacer análisis más práctico. Tales métodos son a menudo exclusiva (Baym, 2013; Boyd y Crawford, 2012; Kennedy et al., 2014), y generar conocimiento cuantitativo crudo, o lo que Gillespie llama “públicos calculado” (2014). ¡Por supuesto, todas estas limitaciones pueden tenerse en cuenta durante la investigación, pero grandes volúmenes de datos y análisis de medios sociales a menudo se promociona como responder a las preguntas sobre el público, o ciudadanos, en su propia.
La ciudadanía demostrado por estos estudios es una construcción mediada digitalmente de la cultura de corriente, expresado a través de la producción de medios digitales diaria y el consumo, en lugar de una imagen precisa del significado de la ciudadanía, ya que es experimentado por las personas. No es la imagen completa, pero es la imagen fácilmente pintado a través de medios algorítmicos y analíticos. Esta ciudadanía calculada repercute favorablemente en el proceso político, proporcionando una ilustración accesible y creíble de la opinión pública, reacción y la preferencia. La tecnología no es la causa necesariamente un cambio a la ciudadanía, sino que ha catalizado cambios en nuestros métodos de entendimiento ciudadanía dentro de la ecología social y política del mundo digital. Como Clough et al. discutir, métodos de datos grandes no son simplemente una nueva forma de generalizar a través de poblaciones en mayor escala, pero en realidad son una forma de realización metodológica de una concepción emergente de la sociabilidad (2015).
Referencias:
Baym, N.K. 2013. Los datos no visto: los usos y las deficiencias de las métricas de medios sociales. Primer lunes. 18(10).
Benkler, Y., Roberts, H., Faris, R., Solow-Niederman, La. y Etling, B. 2015. La movilización social y la esfera pública en Red: Mapeo del debate SOPA-PIPA. Comunicación política. 32(4),pp.594-624.
boyd, danah m y Crawford, K. 2012. cuestiones críticas para grandes volúmenes de datos – Provocaciones de carácter cultural, tecnológica, y el fenómeno de estudiante. Informacios Társadalom. 12(2).
Ceron, A., Curini, L., iacus, S.M. y Porro, T. 2013. Cada recuento pío? ¿Cómo análisis de los sentimientos de los medios sociales puede mejorar nuestro conocimiento de las preferencias políticas de los ciudadanos con una aplicación a Italia y Francia. Nuevos Medios & Sociedad. 16(2),pp.340-358.
Clough, P., Gregory, K., noticias, B. y Scannel, R.J.. 2015. Otra vuelta Datalogical. sin publicar el artículo. Academia.edu.,pp.1-26.
Coleman, S. y Götze, J. 2001. ruedan junto: la participación del público en línea en la deliberación política. Londres: Hansard Society.
Coleman, S. y Moss, G.S.. 2012. En construcción: el Campo de la Investigación en línea Deliberación. Revista de Tecnología de la Información & Política. 9(1),pp.1-15.
Van Dijck, J. 2014. Datafication, dataism y el velo de datos de lanza: Grandes de datos entre paradigma científico y la ideología. Vigilancia & Sociedad. 12(2),pp.197-208.
Gillespie, -. 2014. La relevancia de Algoritmos En: -. Gillespie, P. J. Boczkowski y K. La. Pie, eds. Media Technologies: Ensayos sobre Comunicación, Materialidad, y Sociedad. MIT Press.
Gitelman, La. y Jackson, En. 2013. Introducción, Los datos en bruto es un oxímoron. (Gitelman, ed.). Cambridge, Massachusetts: CON.
Graham, -. 2012. Más allá de espacios comunicativos ‘políticos’: Hablando sobre la Política Wife Swap foro de discusión. Revista de Tecnología de la Información & Política.
Kennedy, H., Musgo, G. S., Birchall, C. y Moshonas, S. 2014. Equilibrar el potencial y los problemas de los métodos digitales a través de la investigación-acción: reflexiones metodológicas. Información, Comunicación & Sociedad. 18(2),pp.172-186.
Kitchin, R. 2014. Big Data, epistemologías y los cambios de paradigma nuevo. Big Data & Sociedad. 1(1).
Kitchin, R. y Lauriault, T.P. 2014. datos pequeñas en la era de los grandes datos. GeoJournal. 80(4),pp.463-475.
Manovich, La. 2011. Tendencias: las promesas y los desafíos de grandes datos sociales. http://manovich.net/index.php/projects/trending-the-promises-and-the-challenges-of-big-social-data.
Mutz, D.C. 2006. Al oír el Otro Lado: Deliberativa frente Democracia Participativa. Nueva York: Cambridge University Press.
Roginska, S. y Jeanne-Perrier, En. 2014. La fabricación de los eurodiputados de comunicación: 'Pia su MP' y 'talleres MP 2.0'”. políticas de comunicación. 1,pp.85-123.
Wright, S. y la calle, J. 2007. Democracia, Deliberación y Diseño: El caso de los foros de discusión en línea. Nuevos Medios y Sociedad. 9(5),pp.849-869.