Antes de compartir mis comentarios, quiero revisar el concepto general.

Jhon Weathington (2012) propone la siguiente definición: grandes cantidades de datos que fluyen con rapidez.

·         Para ser competitivo con los clientes, los grandes volúmenes de datos deben crear productos que sean valiosos y únicos.

·         Para ser competitivo con los proveedores, los grandes volúmenes de datos deben estar disponibles gratuitamente, sin obligaciones o limitaciones.

·         Para ser competitivos con los nuevos operadores, grandes volúmenes de datos son difíciles para los recién llegados a probar.

·         Para ser competitivo con sustitutos, los grandes volúmenes de datos deben crear productos que excluyan a otros productos que pueden satisfacer la misma necesidad.

En resumen: Big data es gran cantidad de datos en movimiento rápido y con libre disposición que potencialmente sirve a una necesidad valiosa y única en el mercado, pero es extremadamente caro y difícil de extraer por medios tradicionales.

Ajustes en la gestión de proyectos

Jhon Googpasture (2012) revisa un ensayo de Cukier y Mayer- Schoenberger en la Revista Foreign Affairs que señala que usar grandes volúmenes de información requiere tres cambios profundos respecto a proyectos tradicionales:

1.      Recopilar y utilizar una gran cantidad de datos en lugar de conformarse con pequeñas cantidades o muestras, al contrario de cómo se han hecho estadísticas en el último siglo.

2.      Cambiar nuestra preferencia por los datos muy procesados en lugar de aceptar el desorden.

3.      En muchos casos, tendremos que abandonar nuestra búsqueda por descubrir la causa de las cosas, a cambio de aceptar las correlaciones.

2

Jhon considera que “olvidar muestras económicamente viables, aceptar desorden sobre la exactitud, y ser felices sin entender la causalidad de la correlación” son las bases de la definición de “Terminado” para el patrocinador del proyecto.

Según una reciente encuesta de Infochimps, el 58% de los encuestados indicó que la causa principal del fracaso de los proyectos de BigData fue tener un alcance impreciso (Gilchrist, 2013).

La gestión de requisitos es una preocupación importante en estos proyectos, ya que el alcance inexacto es una de las tres principales causas de fracaso de acuerdo con la opinión de directores de TI encuestados.

Considerando estas estadísticas sombrías para los proyectos de Big Data, es evidente que algo hay que hacer para solucionar este problema. Y algo debe cambiar en la manera de gestionar los requisitos.

5d9e52d2-c5de-451d-8d43-6c31b19392bd-original

Los consejos que se pueden aplicar para ayudar a planear para el éxito de los proyectos de BigData, según Patti Gilchrist (op cit.) son:

1.      Identificar las metas y objetivos de negocio. ¿Con qué frecuencia los equipos de trabajo del proyecto no están conscientes de la misión general o cómo el proyecto encaja en la estrategia general de la empresa? Hay que recordar que los datos sólo valen algo si los puede usar alguien que entiende la misión de la empresa y puede explicar por qué se necesita un proyecto Big Data en primer lugar.

2.      Definir el problema. En el entorno actual de negocios de ritmo rápido y dinámico en el que hay una presión constante para la innovación y la velocidad al mercado, muchos equipos de proyectos abrazan un sentido de urgencia para comenzar a trabajar en un proyecto con información muy limitada, a regañadientes consienten esperar a tener una visión clara, y comienzan la ejecución sin una comprensión fundamental del problema que debe ser solucionado. La recomendación es que antes de iniciar un proyecto de Big Data se debe tener una idea muy clara de qué es exactamente lo se está tratando de lograr cuando se empieza.

3.      Priorizar objetivos. En el artículo de Gilchrist también se recomienda determinar las prioridades. Entender los motivadores del negocio ayudará a priorizar los objetivos y asegurarse que el proyecto se está centrando en lo que va a agregar valor al negocio.

4.      Establecer el caso de uso. ¿Con qué frecuencia se ha empezado a trabajar en un proyecto en el que no se proveen casos de uso? A menudo, en un esfuerzo frenético para aumentar la velocidad del mercado, los proyectos comienzan su ejecución sin una comprensión clara de los casos de uso. El modelado de casos de uso es una herramienta de planificación eficaz que proporciona un marco para los requisitos en un lenguaje fácil de entender y que sirve para facilitar el lograr acuerdos con los clientes y las partes interesadas. Los Casos de Uso enlazan las necesidades de los interesados con los requerimientos, ayudan a validar que se capturan todos estos requerimientos, y a verificar la comprensión de los interesados.

5.      Determinar las necesidades de datos e identificar las fuentes de datos necesarias para apoyar sus casos de uso. Hay que recordar que mientras más grande es la misión de una organización, más complejos serán sus requerimientos de datos, y se requerirá más trabajo para delimitar el alcance en forma adecuada. Y se debe tener en cuenta el origen y la calidad de sus datos. ¿De dónde proceden?, ¿se necesita limpiarlos?, ¿están almacenados en bases de datos relacionales tradicionales?, ¿es un formato estructurado, procedente de canales web y las redes sociales?, ¿los datos están en reposo o en movimiento?

6.      Se deben considerar las necesidades de infraestructura. Muchas organizaciones subestiman las necesidades de almacenamiento. Aunque las organizaciones son conscientes de los volúmenes de datos existentes, no se dan cuenta de que tendrán que duplicar los datos en un entorno independiente para realizar el análisis avanzado requerido. Debido al modelo de servicio basado en la utilidad o la medida de la computación en nube, muchas organizaciones han descubierto que los servicios basados en la nube ofrecen un precio más económico a la escala requerida para el manejo de grandes volúmenes de datos.

7.      Comprender plenamente las necesidades de recursos. Un reto para la mayoría de los proyectos de TI es encontrar las habilidades necesarias para ejecutar con éxito los objetivos de negocio definidos. Para los proyectos de Big Data, es una tarea aún más difícil. Teniendo en cuenta las nuevas tecnologías y herramientas que intervienen, hay una escasez de recursos con experiencia. Y hay nuevos roles emergentes en la escena, como el ingeniero de datos – que es un rol relativamente nuevo pero crucial en los proyectos de Big Data.

Para tener éxito en un proyecto de Big Data, se necesitan recursos con conocimientos de matemáticas, estadística, algoritmos, ciencia de datos, así como visión para los negocios para entender cómo el esfuerzo se inscribe en el panorama más amplio de metas y objetivos de negocio. Un buen esquema de seguridad también resulta beneficioso si se utiliza información clasificada o restringida. Además, se necesita gente que se sienta cómoda con el aprendizaje y el uso de herramientas y tecnologías nuevas y complejas, tales como bases de datos no relacionales.

La necesidad de una gama compleja y amplia de habilidades hace aún más difícil la tarea de encontrar los recursos adecuados para el equipo.

Así que cuando se prepare para el próximo proyecto de Big Data, se deben evaluar el alcance, los requisitos y criterios de éxito para idear un plan que permita llevar a cabo las metas y objetivos.

Izaskun Larrea

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s