Guía Completa del etnógrafo para Big Data: Respuestas (parte 2 de 3)


Estadísticas Casa, Kampala, Uganda

He llegado lejos de la DataEdge conferenciacon algunas respuestas ... y algunas más preguntas. Aunque no tengo la intención de recapitular la propia conferencia, Yo quiero aprovechar el tiempo que pasa con este grupo diverso de participantes y sus perspectivas variadas para tratar de ofrecer el mayor sentido de imagen que estoy empezando a desarrollar de la gran análisis de datos / datos de tendencia.

La idea de que los grandes datos podrían marcar el comienzo de una nueva era de la investigación automática y junto con ella el investigador descualificación o que lo haría hacer que el método científico obsoleto no resultó ser un sentimiento popular (*uf * suspiro de alivio). El punto de que los datos no se explica por sí, que necesita ser interpretada fue reafirmado muchas veces durante la conferencia que viene de personas que ocupan un papel muy diferente en este mundo de la ciencia de datos. No hay necesidad de pánico, vamos a pasar a lo largo de algunas respuestas a esas preguntas que planteé en parte I.

¿Qué es el Big Data? Bueno, esto no era una pregunta que hice entrar en la conferencia, pero debería tener. Tal como era de esperar no hubo un consenso claro o una definición coherente que lleva a través de las conversaciones. Me encontré a mí mismo en ciertos puntos preguntándose, “seguimos hablando de 'big data' o estamos hablando sólo de su nivel, estadísticas comunes y corrientes ahora?” De todos modos, esta confusión fue productivo y me llevó a identificar tres cosas que parecen ser nuevos en esta discusión de los datos, estadística, y análisis.

(1) Tipo de los datos- Estamos hablando de un montón de nuevos datos sobre el comportamiento, registrar los datos siguientes de digitalización generalizada. Una parte de ello es la tendencia a la Internet no anónimo. Lawrence Lessig señala, "A medida que Internet ha madurado, las tecnologías para vincular el comportamiento con una identidad han aumentado dramáticamente "... (vamos a un lado por ahora cómo se utiliza / abusado en esa cita la palabra "identidad"). Ampliación de esta tendencia es la más reciente difusión de los teléfonos inteligentes y los servicios basados ​​en la localización. Estamos recibiendo un registro potencialmente más fina de grano de donde va la gente y sus patrones de movimiento a través de y habitar el espacio (tanto en línea como fuera de línea). Se recoge toda una gran cantidad de estos datos sin conocimiento consciente por parte de los individuos que generan que los datos. (y por supuesto, esto plantea algunos problemas de privacidad – un tema que ha recibido algún debate centrado, específicamente en una charla de Danah Boyd)

En relación a esto era algo Mateo Salganik (Asistente de Profesor en Princeton) dijo en una sesión sobre la forma sociólogos estudian las cosas que les afectan – sobre la desigualdad y la, por ejemplo, su relación con la raza. Uno (de muchos) Los sociólogos maneras de hacer esto es mediante la identificación de donde Europeo, Afroamericana, Asiático, Los hispanos viven mirando a domicilio y la categoría étnica de los habitantes para mostrar el agrupamiento y espacios de segregación. Posibilidades de datos mucho más fina que están surgiendo ahora - que puede ser capaz de responder a una pregunta como: ¿cómo la gente se segregan a través del tiempo y el espacio en el transcurso de días o semanas?

(2) cantidad de los datos - Después del hecho de que tales datos se registran automáticamente de plataformas que pueden tener millones de usuarios (como mensajes de twitter o búsquedas de Google), estamos hablando tera- o petabytes en lugar de simplemente mega-- o gigabytes. Significa que la cantidad absoluta de que el procesamiento (limpieza, analizar) dichos datos requerirán trabajo algorítmico. El uso de mano de obra humana que pasar por esa línea de datos por línea o entrada por entrada es demasiado costo prohibitivo y lento. Además, la "crudeza" de muchos de estos datos significa que incluso un muestreo de los datos y entonces ir a la línea por línea el análisis todavía no es realmente la respuesta al desafío. Puede necesitar los datos que se monté de nuevo juntos primero - por ejemplo relacionar coordenadas de ubicaciones semánticamente comprensible, o para unir comportamientos medidos a individuos.

(3) gama y variedad de los datos - donde los datos se registran automáticamente, el trabajo de reunir (ciertos tipos de) información puede ser mínimo (en comparación con el envío de un ejército de trabajadores para obtener los 1000 de los cuestionarios completados). Eso significa que los analistas están empezando a considerar las posibilidades de ver montones y montones de posibles correlaciones, en lugar de conducir tal exploración de una sólida base teórica con unas pocas variables cuidadosamente elegidos (con advertencias de curso sobre el aumento del riesgo de encontrar correlaciones espurias). Si estos datos se pueden procesar de forma algorítmica, entonces es posible analizar de una enumeración total de una población determinada en lugar de una muestra de esa población.

¡Por supuesto, Me paso aquí señalar que este tipo de procesos de registro capturan algunos tipos de cosas sin rodeos, pero no otros – todo el reino de la opinión, intención, y el significado…las cosas que se leen generalmente interpretativamente como el lenguaje corporal, o la semántica más sutiles en muchas de las prácticas del lenguaje. One participant at the conference when pressed could only come up with ’emotion’ como el tipo de cosa que le queda a los seres humanos para interpretar y analizar…pero el dominio que está más allá del alcance de la mano de 'Big Data’ Creo que es mucho más vasta.

Entonces, ¿dónde estamos en relación a este fenómeno como etnógrafos, o, más generalmente, como investigadores con una inclinación hacia los enfoques cualitativos y interpretivist?

Hay algo que los etnógrafos tienen en común con los entusiastas de datos grandes, aunque ninguno de los grupos tal vez se da cuenta de esta. Aunque la etnografía ha inaptly veces ha equiparado en el resto del mundo con los estudios de la entrevista, es la inmersión del etnógrafo en un mundo social y el intento de observar el fenómeno de interés ya que se desarrolla que caracteriza más claramente esta postura metodológica. Estados Howard Becker sobre el valor atribuido a esta observación estrecha por los etnógrafos, "La más nos acerquemos a las condiciones en la que [las personas que estamos estudiando] en realidad no atribuir significados a los objetos y eventos, la más precisa la descripción de los significados es probable que sean " (Becker 1996). Es esta la cercanía con el fenómeno de interés que es una preocupación compartida. Hay un entendimiento común de que lo que la gente decir (fuera de contexto, en una entrevista privada o encuesta) no es una representación transparente de lo que de. Los etnógrafos obtiene en esto de la forma de mano de obra, colgando alrededor y ser testigo de las cosas de primera mano. Personas de grandes datos hacen de una manera diferente, por averiguar maneras de capturar las acciones en el momento, es decir. alguien ha hecho clic en este enlace, establecer que la preferencia, movido desde este punto de acceso inalámbrico para que uno en un momento determinado.

Por supuesto, un punto importante y muy importante aquí - observaciones etnógrafos no son equivalentes a qué registro registros de datos ... y un punto crítico es que los etnógrafos no se detienen con la observación o la tratan como intrínsecamente significativa, pero hacer un montón de trabajo complementario para intentar conectar comportamiento evidente para significado subyacente. A menudo lo hacen a través de ocasionales in situ conversaciones o entrevistas más formales. Problemáticamente, hay una noción de que los datos de registro, porque es tan cerca del fenómeno, porque se captura automáticamente, es transparente veraz en comparación con el tipo de información que la percepción subjetiva de que se reunió con el escepticismo y gritos de ... “la gente miente! se olvidan! estiman mal!” Un panelista (que permanecerá sin nombre) comentado al principio de la conferencia "Los datos se ha convertido en la fuente de la verdad." Pero 'big data' sigue siendo igual de propensos a la mala interpretación que otros tipos de datos capturados. Los errores de interpretación se puede llegar a diferente, pero siguen siendo muy posible.

  • Ahora a una pregunta que hice antes de la conferencia "¿Cómo analistas 'grandes' de datos se conectan los datos sobre el comportamiento con el significado / intención subyacente de que el comportamiento? ¿Cómo se evitan (o ¿cómo creen que pueden evitar) conseguir este mal?"No encuentro profundas o nuevas respuestas a esta pregunta de la conferencia. Es un reto espinoso y de difícil solución. Esos datos deben interpretarse y que este trabajo puede ser complicado era un estribillo recurrente. La escasez de datos científicos se lamentó. Mucha charla se centró en maneras de simplificar y automatizar algunas de las aplicaciones más simples de datos grande, sobre todo para la comercialización y otros usos de negocio. En el espinoso de llegar a «significado» de huellas digitales, Danah Boyd, en su charla, trazó una conexión entre las pretensiones de privacidad y las prácticas de la comunicación codificada entre los adolescentes en las redes sociales. Sus trazas de comportamiento e incluso los tweets, Actualizaciones de estado de Facebook, etc. llegar a ser tan imposible de descifrar las runas como antiguas. ¿Cómo hacer frente a las poblaciones marginalidad, la gestión límite cuidadosa de grupos subculturales es algo que estoy bastante familiarizado con de tiempo pasado con los estafadores de Internet en Ghana cuyo lenguaje codificado sacar de pidgin, Twi, Hausa, e Inglés. Libro de Jay-Zs Descifrado en la que página tras página de la música rap letras se analizan y pacientemente explicó en relación con las experiencias de la pobreza y la lucha urbana también viene a la mente.
  • Otra pregunta que planteé es un seguimiento pertinente sobre: "La discusión analítica de datos parece ser un debate centrado en Estados Unidos ... que tan bien están los investigadores lidiando con el análisis del 'big data' cuando se trata de datos recogidos de todo heterogéneo, poblaciones internacionales?"Esta cuestión se planteó brevemente en Hal Varian hablar, en el contexto de una explicación de cómo utilizar los datos de búsqueda de Google para desarrollar modelos que hacen mejores predicciones económicas. Señaló, de algún trabajo relacionado en Chile, donde sólo 30% o así de la población accede a Internet, que estos usuarios no son por cualquier tramo de la imaginación "representante". Sin embargo,, para las predicciones económicas, como los miembros más ricos de la sociedad que así llevan las tendencias económicas, que son suficientes. Siempre debemos tener en cuenta, incluso cuando tenemos datos que son muy, muy, muy grande, que algunas personas, algunas experiencias, algunas formas de expresión se han perdido y pueden necesitar ser contabilizados. Tapan Parikh en el "desarrollo global" sesión de trabajo señaló que las poblaciones a menudo blanco de la ayuda al desarrollo, los más pobres de los pobres, a menudo son aquellos la mayoría no es probable a aparecer en los datos.

Parece ahora que una tercera parte será necesario terminar mis pensamientos sobre los métodos, epistemología, (grande) datos, estadística, y donde la etnografía encaja en esta discusión. Espero que reconsidere si tiene sentido hablar de lo que hacemos como "datos pequeños." Por último, me gustaría contestar a las preguntas que yo empecé con acerca de las aplicaciones de datos grande. Para qué usos se le está poniendo, ¿cuáles son algunas aplicaciones clave? Y ¿cómo podrían estos proyectos complementan el trabajo que son principalmente etnográfico?

___________________________________________________________________
Leer el resto de los puestos de la “Guía Completa del etnógrafo para Big Data” serie:
Guía Completa del etnógrafo para Big Data: Personas Pequeñas de datos en un Mundial de Datos Grandes (parte 1 de 3)
Guía Completa del etnógrafo para Big Data: Conclusiones (parte 3 de 3)

Etiquetas: , , , ,

8 Las respuestas a las “Guía Completa del etnógrafo para Big Data: Respuestas (parte 2 de 3)”

  1. Junio 12, 2012 en 8:52 al #

    Jenna,

    Gran conjunto de mensajes (y gran sitio)!!

    Como UX / Tipo de diseño en una compañía Fortune 500 empresa, Yo empleo diferentes métodos para comprender un dominio dado. La forma en que he estado describiendo esto internamente es que hay dos tipos de investigación: Cualitativo & Cuantitativo (obviamente).

    Durante una reciente presentación llamada “El uso de la investigación para informar Diseño” que he enseñado a la gente en nuestra I.T. departamento, He utilizado la vieja frase de Henry Ford como el punto de saltar de un ejemplo: “Si le preguntara a mis clientes lo que querían, habrían dicho un caballo más rápido”.

    El cualitativo nos ayudará a entender las cosas como:
    1.) ¿Por qué la gente viaja del punto A al punto B
    2..) Lo que la gente como / gusta de viajar
    3.) Lo que los retos de los viajes son
    4.) ¿Qué se puede mejorar
    5.) Etc.

    El cuantitativo nos ayudará a entender:
    1.) ¿Cuánto tiempo tarda el viaje toma (para diferentes métodos de transporte)
    2.) Ofrece maneras de comparar la velocidad de las diferentes formas de viajar
    3.) ¿Con qué frecuencia viaja la gente
    4.) Etc.

    Ninguno de los métodos hará el trabajo de diseño para usted, que se introducen.

    El problema para mí es que muy pocas personas utilizan tanto Quant & Qual juntos para conseguir una verdadera comprensión. Para la mayoría de los proyectos que me gusta empezar con el Qual y luego valide con el Quant… la gente decía X, y los datos se pueden probar o refutar que.

    De nuevo, grandes mensajes & sitio!!

    Gracias!

    Jon

  2. Junio 14, 2012 en 4:33 pm #

    Hola Jenna,

    Soy otro diseñador UX – Seguí un enlace de Twitter desde David Travis (@ Userfocus) a su artículo reflexivo. He disfrutado leyendo mucho.

    Yo realmente no tengo un UX, o incluso enthnography,-comentario relacionado. Su artículo en realidad me hizo pensar en la gran de datos (sí, terabytes y petabytes) que mis colegas trabajan con. Esto incluye, y gran cantidad de datos genómicos de diferentes especies, y tratando de hacer sentido de que es un trabajo BIG.

    Una de las formas en que los biólogos hacen uso de ella, aunque, es lo que un amigo mío llama “descubrimiento hipótesis”: buscan preguntas que debe hacer.

    Así, hay una exploradora, área algorítmica de la investigación cuantitativa seguida de experimentación y comprobación de hipótesis más centrado.

    Creo que esto es como lo que usted describe como estar inmerso en los datos; en lo que está pasando, y luego haciendo preguntas detalladas para ayudar a unir los puntos y hacer descubrimientos.

    Independientemente de la naturaleza de los datos, en el ojo de mi mente, Yo lo veo como el zoom de forma continua en el e investigar las áreas que parecen importantes. Clic. Ampliar. Clic. Ampliar.

    gracias,
    Francis

Trackbacks / Pingbacks

  1. Etnografía importa el blog | Pensando en la cultura - Junio 12, 2012

    […] es un nuevo blog colaborativo llamado asuntos etnografía. Y aquí es una. Interesante post acerca de los grandes datos y la etnografía (incluyendo una referencia a Jay-z, mi papel el tratamiento de jay-z como sociólogo será a finales de este […]

  2. 3×5: Cultura, Neurociencia, y Psiquiatría Resumen Semanal (Junio 19) | thefpr.org Blog - Junio 18, 2012

    […] La guía del etnógrafo para grandes datos, parte 1 y parte 2. Despacho de Jenna Burrell de la conferencia organizada por la Escuela DataEdge de UC Berkeley […]

  3. Guía Completa del etnógrafo para Big Data: Conclusiones (parte 3 de 3) | Cuestiones Etnografía - Julio 2, 2012

    […] Guía Completa del etnógrafo para Big Data: Respuestas (parte 2 de 3) […]

  4. Guía Completa del etnógrafo para Big Data: Personas Pequeñas de datos en un Mundial de Datos Grandes (parte 1 de 3) | Cuestiones Etnografía - Julio 2, 2012

    […] resto de los puestos de la “Guía Completa del etnógrafo para Big Data” serie: Guía Completa del etnógrafo para Big Data: Respuestas (parte 2 de 3) Guía Completa del etnógrafo para Big Data: Conclusiones (parte 3 de […]

  5. En Etnografía digital: mapeo como un modo de descubrimiento de datos (Parte 2 de 4) | Cuestiones Etnografía - Diciembre 5, 2012

    […] a nuestra investigación la investigación en línea. Pero, ¿qué hacemos con todos estos datos? ¿Cómo podemos hacer sentido de ella? Jenna Burrell ha levantado algunas preocupaciones con respecto a la cantidad y calidad de los datos a la luz de los datos recientes grande […]

  6. En Etnografía digital, magnificar la importancia de la cultura (parte 3 de 4) | Cuestiones Etnografía - Enero 30, 2013

    […] precisión empírica una forma de inmersión, un punto que Jenna Burrell plantea en uno de sus mensajes en los datos grande. Ella cita la declaración de Howard Becker para evocar el interés etnográfico en empírica […]

Deja un comentario