Crowdssourcing y Computación humana
Patricia Pérez 2016-8-85-IV-306
Una ciencia emergente nace del crowdsourcing: la Computación Humana
Pretende dar solución a problemas complejos, difíciles o costosos para una máquina. El crowdsourcing como recurso de sabiduría colectiva se ha convertido en una herramienta valiosa y muy demandada en diversos ámbitos, pues permite desarrollar proyectos que, de otra forma, requerirían mucho tiempo, esfuerzo y recursos. Expertos en la materia ya lo sitúan como una ciencia emergente, la Computación Humana, y debaten sobre los éxitos presentes y los retos que están por llegar. Pero también sobre las implicaciones éticas, legales y sociales que comporta. La sabiduría colectiva se ha convertido en un recurso tan poderoso y accesible a través de Internet que no es de extrañar que grandes y pequeñas compañías quieran sacarle provecho, pues permite desarrollar proyectos que, de otra forma, requerirían mucho tiempo, esfuerzo y recursos. Ese esfuerzo colaborativo utilizado para generar conocimiento es la base de servicios tan dispares como la Wikipedia, Duolingo o Amazon Mechanical Turk. Tan importante es este recurso que los científicos ya le han dado un nombre: Computación Humana. El segundo paso es cuestionarse sobre la mejor manera de explotarlo a nivel global. Un grupo de científicos de la computación, pioneros del crowdsourcing y visionarios ha creado una hoja de ruta para la investigación de la Computación Humana. Fuente: http://www.tendencias21.net/Una-ciencia-emergente-nace-del-crowdsourcing-la-Computacion-Humana_a40599.html.
Tomado del Boletín de la Academia Nacional de Medicina, Enero, (85) 2016.
Crowdsourcing
Wikipedia
No debe confundirse con Crowdfunding.
Crowdsourcing (del inglés crowd –multitud– y outsourcing –recursos externos–) se podría traducir al español como colaboración abierta distribuida o externalización abierta de tareas, y consiste en externalizar tareas que, tradicionalmente, realizaban empleados o contratistas, dejándolas a cargo de un grupo numeroso de personas o una comunidad, a través de una convocatoria abierta.
Jeff Howe, uno de los primeros autores en emplear el término, estableció que el concepto de "crowdsourcing" depende esencialmente del hecho de que, debido a que es una convocatoria abierta a un grupo indeterminado de personas, reúne a los más aptos para ejercer las tareas, para responder ante problemas complejos, y para así contribuir aportando las ideas más frescas y relevantes.
Por ejemplo, se podría invitar al público a desarrollar una nueva tecnología, o a llevar a cabo una tarea de diseño (diseño basado en la comunidad' 1 o diseño participativo distribuido), o a mejorar e implementar los pasos de un algoritmo (véase computación basada en humanos), o a ayudar a capturar, sistematizar y analizar grandes cantidades de datos (ciencia ciudadana).
El término se ha hecho popular entre las empresas, autores y periodistas, como forma abreviada de la tendencia a impulsar la colaboración en masa, posibilitada por las nuevas tecnologías (como la Web 2.0), para así lograr objetivos de negocios o eventualmente propuestas sociales. Sin embargo, el término y sus modelos de negocio han generado controversia y críticas.
Índice
El problema de la definición
El crowdsourcing se ha definido en multitud de ocasiones, siendo Jeff Howe el primero en hacerlo y acuñar el término. Este autor lo definió como
"Externalización, por parte de una empresa o institución, de una función realizada por un empleado, a un grupo indefinido (y normalmente grande) de personas, mediante una convocatoria abierta. Esta externalización puede tomar la forma de una producción-de-iguales (peer-production) cuando el trabajo se realiza de forma colaborativa, pero también puede llevarse a cabo de forma individual".2
Otros autores han dado su versión de la definición. Daren Brabham por ejemplo, afirma que el crowdsourcing es "un modelo estratégico para atraer una multitud interesada y motivada de individuos, capaces de proporcionar soluciones superiores en calidad y cantidad a aquellas que podrían proporcionar formas de negocio tradicionales".3
Por su parte, Kazai et al. afirman que el crowdsourcing consiste en "una convocatoria abierta para recibir contribuciones de miembros de la multitud, para resolver un problema o llevar a cabo tareas inteligentes, normalmente a cambio de micro-pagos, o reconocimiento social (micromecenazgo), o entretenimiento".4
Debido a la cantidad de definiciones que se pueden encontrar, y a las imprecisiones que aparecen, se ha llegado al punto en el que multitud de actividades colaborativas, en línea o no, han pasado a identificarse con el crowdsourcing de manera equivocada. Aparte de la falencia o incertidumbre en cuanto a una definición, también surge el problema de que en la literatura científica de crowdsourcing existen actualmente más de 40 definiciones distintas del término. Distintos autores dan definiciones del crowdsourcing basándose en sus especialidades, perdiéndose de esta manera la visión global del término.
Estellés y González (2012), tras estudiar más de 40 definiciones de crowdsourcing, proponen una nueva definición integradora:
"El crowdsourcing es un tipo de actividad en línea participativa en la que una persona, institución, organización sin ánimo de lucro, o empresa, propone a un grupo de individuos, mediante una convocatoria abierta y flexible, la realización libre y voluntaria de una tarea. La realización de la tarea, de complejidad y modularidad variable, y en la que la multitud debe participar aportando su trabajo, dinero, conocimiento, y/o experiencia, siempre implica un beneficio mutuo. El usuario recibirá la satisfacción de una necesidad concreta, ya sea esa económica, de reconocimiento social, de auto-estima, o de desarrollo de aptitudes personales, mientras que el crowdsourcer obtendrá y utilizará en su beneficio la aportación del usuario, cuya forma dependerá del tipo de actividad realizada." 5
Historia
El término "'crowdsourcing'" es una contracción y un neologismo de la palabra inglesa crowd (masa de gente o multitud) y outsourcing ("externalización"), acuñado por Jeff Howe en junio de 2006 en un artículo de la revista Wired "The Rise of Crowdsourcing" ("El ascenso del crowdsourcing"). [2] [4] Howe explica que, debido a los avances tecnológicos que han permitido el consumo de electrónica a bajo coste, la diferencia entre profesionales y aficionados ha disminuido. En consecuencia, las empresas pueden aprovechar el talento de la gente, por eso Howe afirma que "No es la externalización (outsourcing), es el crowdsourcing".
Proyectos que hacen uso de grupos de inteligencia, como el LazyWeb o el ESP Game(Juego ESP) de Luis von Ahn, preceden la invención de la palabra desde hace varios años. Recientemente, Internet ha sido utilizado para dar a conocer y gestionar proyectos de "crowdsourcing".
Computación basada en humanos
La computación basada en humanos es una técnica informática en la que un proceso computacional desempeña su función mediante la externalización de ciertos pasos hacia el ser humano Este enfoque utiliza las diferencias en las capacidades y los costos alternativos entre los seres humanos y los agentes informáticos para lograr una interacción simbiótica humano-ordenador.
En la informática tradicional, un ser humano emplea un ordenador para resolver un problema, un humano proporciona una descripción formal del problema a un ordenador, y recibe una solución para interpretarla. La computación basada en humanos con frecuencia invierte los papeles: el ordenador le pide a una persona o un grupo grande de personas que resuelvan un problema, a continuación, recopila, interpreta e integra sus soluciones.
Índice
Primeros trabajos
La computación basada en humanos tiene sus orígenes en los primeros trabajos sobre computación evolutiva interactiva. La idea detrás de algoritmos interactivos evolutivos se debe a Richard Dawkins. En el software Biomorphs (Biomorfos) que acompaña al libro El relojero ciego, [[The Blind Watchmakehpolahvdblo estético para efectuar algo que un algoritmo evolutivo normal no puede hacer. Sin embargo, es difícil obtener suficientes evaluaciones de un solo humano si queremos evolucionar hacia formas más complejas. Victor Johnston y Karl Sims ampliaron este concepto mediante el aprovechamiento de la energía de muchas personas para realizar evaluaciones de aptitud (Caldwell y Johnston, 1991; Sims, 1991). Como resultado, los programas podrían evolucionar hacia rostros hermosos y obras de arte atractivas para el público. Estos programas invirtieron de forma efectiva la interacción común entre los ordenadores y los seres humanos. En estos programas, el ordenador ya no es un agente de su usuario, sino, en cambio, un coordinador de la agregación de esfuerzos de muchos evaluadores humanos. Estos y otros esfuerzos similares de investigación se convirtieron en tema de investigación de la computación evolutiva interactiva o selección estética; sin embargo, el alcance de la presente investigación se limitó a la evaluación externa y, como resultado, no estaba explorando totalmente el potencial completo de la externalización.
El algoritmo genético basado en humanos (AGBH) alienta la participación humana en múltiples roles diferentes. Los seres humanos no se limitan al papel de evaluadores, sino que pueden optar por realizar un conjunto más diverso de funciones. En particular, pueden contribuir a soluciones innovadoras en el proceso evolutivo, hacer cambios incrementales a las soluciones existentes, y llevar a cabo una recombinación inteligente. En resumen, el AGBH externaliza a los seres humanos todas las operaciones de un algoritmo genético típico. Como resultado de esta externalización, el AGBH puede procesar las representaciones para las cuales no hay disponibles operadores de innovación computacional; por ejemplo, los lenguajes naturales. Por lo tanto, el AGBH ha retirado la necesidad de un esquema fijo de representación, que era un factor limitante de la computación evolutiva (CE) estándar, e interactiva. Estos algoritmos también se pueden ver como novedosas formas de organización social coordinada por un programa de ordenador (Kosorukoff y Goldberg, 2002).
Clases de computación basada en humanos
Los métodos de computación basada en humanos combinan ordenadores y seres humanos en diferentes roles. Kosorukoff (2000) propone una manera de describir la división del trabajo en computación, que agrupa a los métodos basados en humanos en tres clases. En la tabla siguiente, se utiliza el modelo de computación evolutiva para describir cuatro clases de computación, tres de los cuales dependen de los seres humanos en algún papel. Para cada clase, se muestra un ejemplo representativo. La clasificación es en términos de los papeles (innovación o selección) realizados en cada caso por seres humanos y procesos computacionales. Esta tabla es una porción de una tabla tridimensional. La tercera dimensión define si la función de la organización se realiza por seres humanos o un ordenador. Aquí, se asume que es realizada por un ordenador.
|
Las clases de computación basada en humanos de esta tabla pueden ser referidos por abreviaturas de dos letras: HO, OH, HH. Aquí la primera letra identifica el tipo de agentes que realizan la innovación, la segunda letra indica el tipo de agentes de selección. En algunas implementaciones (wiki es el ejemplo más común), basadas en humanos la funcionalidad de selección puede ser limitada, se puede mostrar con una h minúscula.
BLOG DE COMPUTACIÓN HUMANA
Blo3
Recupero hoy un artículo que escribí allá por septiembre de 2012 sobre la "Computación Humana" ("Human Computation"), porque es indudable el creciente protagonismo que está teniendo esta disciplina en algunos enfoques sobre la Inteligencia Colectiva. Esto se ha puesto de manifiesto, una vez más, en la 3ra Conferencia que sobre el tema se celebró esta semana en Santa Clara, California.
La "Computación Humana" es una técnica que deriva o externaliza a grupos masivos de personas ciertos pasos del proceso computacional que los ordenadores no hacen bien, en una especie de simbiosis que busca optimizar el ratio de habilidades/costes en la interacción hombre-ordenador. En la computación clásica el hombre utiliza a los ordenadores para resolver problemas, le asigna tareas; mientras que aquí se produce un cambio de roles dado que es la computadora la que "asigna" tareas a grupos de personas, y después colecta, interpreta e integra los resultados que éstas les envían.
Pondré un ejemplo sencillo para que esto se entienda. Una empresa necesita procesar y agregar metadatos de miles de imágenes para extraer conclusiones en un estudio que está haciendo. Esas imágenes están en bruto, y los metadatos que se buscan no pueden ser obtenidos de forma automática por un ordenador. Lo que se hace, entonces, es diseñar un programa que convierta el análisis de las imágenes en "microtareas" realizables por personas, y ofrecerlas en una plataforma (marketplace) a cambio de "micropagos". Los trabajadores interesados se bajan las imágenes, las analizan y suben a la plataforma los metadatos. Después el programa de ordenador procesa y agrega toda la información aportada por los participantes para conseguir el resultado que buscaba la empresa.
¿Qué sentido tiene esto? Pues bien, hay ciertas tareas en las que los humanos, afortunadamente (y de momento), seguimos siendo más eficaces que las máquinas. Por ejemplo: clasificar fotos, detectar errores, taxonomizar documentos con fines archivísticos, introducir tags, realizar dibujos, buscar información (p.ej. precios) sobre determinados productos, verificar direcciones en guías de negocios, definir relevancia o rankings en resultados de búsquedas por Internet, transcribir a ordenador textos escritos a mano alzada, realizar traducciones, y por supuesto, generar contenidos (por ejemplo, posts) sobre determinados temas. Podríamos incluir en este listado, incluso, tareas aún más subjetivas como valorar los sentimientos o emociones que generan tuits, blogs, comentarios, películas o programas políticos.
Ya debes imaginarte que los procesos de Human Computation son también una modalidad de "Crowdsourcing", que consiste (como ya expliqué en un post anterior) en proponer actividades, desafíos y problemas a cantidades masivas de colaboradores externos para que los solucionen a cambio de algún beneficio. Ésta es una práctica muy empleada dentro de las lógicas de Innovación Abierta, y tiene su parte positiva en la medida que facilita procesos de creatividad y aprendizaje colectivos; pero también ha sido objeto de muchas críticas (cada vez más justificadas) porque funciona a veces como una estrategia encubierta de las empresas para generar mecanismos de autoexplotación de los voluntarios que participan en estos procesos sin darse cuenta que la verdadera intención es abaratar la mano de obra.
Estos avances de la Computación Humana no son mera ciencia ficción, sino que ya tienen un reflejo real en la prestación de nuevos servicios. Me consta que hay varias plataformas disputándose este mercado. Amazon Mechanical Turk es, con diferencia, la más conocida y mediática. Pero también destacan CrowdFlower (ver lo que Wikipedia dice de esta iniciativa) y Samasource, entre otras. Estas plataformas lo que hacen, como ya he dicho, es descomponer proyectos complejos en pequeñas tareas simples ("micro-tareas") que ofertan a trabajadores digitales del Crowd a cambio de bajas remuneraciones.
Amazon Mechanical Turk (AMT) es el ejemplo paradigmático en esta categoría. Veamos como ellos mismos se presentan:
"Mechanical Turk tiene como objetivo que el acceso a la inteligencia humana sea sencillo, escalable y rentable. Las empresas o los desarrolladores que necesiten que les hagan tareas (denominadas "Tareas de Inteligencia Humana" o "HITs" según sus siglas en inglés) pueden utilizar las potentes API de Mechanical Turk para acceder a miles de empleados a medida, de calidad alta, a bajo coste y de todo el mundo y, a continuación, integrar mediante programación los resultados de dicho trabajo directamente en sus procesos y sistemas empresariales" [por cierto, si quieres hacerte una idea más concreta de lo que son los "HITs", échale un vistazo a este listado de microtareas que publicaba ayer AMT en su plataforma].
Como ves, más claro que el agua… así que cada cual saque sus conclusiones. Por eso en la conferencias de Inteligencia Colectiva a las que suelo asistir hay una presencia tan significativa de expertos en Mechanical Turk a los que les preocupa fundamentalmente cómo optimizar los procesos de Crowdsourcing que esa plataforma promueve para mejorar los rendimientos que generan a sus clientes, es decir, las empresas.
Pero entre tanto esfuerzo por flexibilizar la relación laboral y acceder a mano de obra barata, también hay ejemplos muy positivos que abren oportunidades para reinventar la naturaleza de esta paradójica relación hombre-máquina. Uno de ellos es el proyecto de Harvard Tuberculosis Lab, que utilizó la plataforma CrowdFlower para pedir a un millar de estudiantes de postgrado de Medicina que analizaran imágenes de la corteza para identificar células de tuberculosis resistentes a los fármacos anti-tuberculosos, lo que permitió recortar en gran medida el tiempo del proyecto sin afectar su fiabilidad. Samasource, por su parte, pretende dar trabajo a personas del Tercer Mundo a través de estas microtareas, pero desconozco todavía si esta intención se enmarca dentro de una relación de simetría o no.
Por resumir, hay dos tipos de debates. Uno estrictamente técnico que se centra en cómo mejorar variables críticas que condicionan la eficacia y eficiencia de estos sistemas como el control de calidad o la detección de errores, los incentivos a la participación y los modelos de interacción según el tipo de tareas, entre otras. Y otro que tiene que ver con los aspectos éticos, laborales y sociales que se derivan de estas prácticas, y en qué medida son o no asimétricos para el "digital worker" que participa.
Hay mucha discusión alrededor de esto, y con posturas bastante encontradas. Algunos creen que hay un exceso de expectativas en relación con modelos computacionales basados en el crowdsourcing. Hay cada vez más sensibilidad acerca de la importancia de que exista un código de buenas prácticas éticas y laborales que regulen esta actividad. Esto se enmarca dentro de una corriente que exige a los expertos computacionales que vean más su trabajo como diseñadores de sistemas que implican valores éticos. Por ejemplo, que tengan en cuenta el significado de devaluar el trabajo humano a tareas que no aportan ningún sentido de autonomía y desarrollo personal. Esa crítica es razonable, porque buena parte de las microtareas que se externalizan desde estas plataformas buscan optimizar a la vez costes y calidad, y eso plantea un balance delicado.
Dicho eso, sería un error demonizar la herramienta. Todo depende de cómo y para qué se utilice. Soy de los que creen que la Computación Humana es una disciplina que puede abrir grandes oportunidades, y que incluso puede contribuir a una Inteligencia Colectiva de calidad. Tendremos ejemplos positivos y negativos, pero es un campo que dará mucho que hablar en el futuro, con sus luces y sus sombras.
Nota: La imagen del post pertenece al album de Steve Jurvetson en Flickr
__._,_.___
.
__,_._,___
No hay comentarios:
Publicar un comentario