Si buscas las mejores habilidades que necesitan los científicos de datos, con habilidades técnicas como R o SQL. En mi experiencia estudiando en la Universidad de Deusto , una gran parte de mi tiempo se dedica a entender qué piezas de información pueden realmente conectar y encontrar maneras de mostrar cómo los datos se pueden utilizar con diferentes herramientas para obtener conocimientos. Disfruto escribiendo posts en Innova Basque Assistant y contribuir a las presentaciones y a la interacción con el cliente, en definitiva, convirtiendo mi trabajo en la universidad en contenido utilizable para otros. Trabajo con estadísticos y profesionales del marketing. Aunque otros científicos de datos describen estas actividades en muchos foros para el conocimiento de la industria, ofrecen consejos sobre cómo usar la comunicación para trabajar con equipos diversos y para desarrollar ideas. Nuestra capacidad de ofrecer ideas y de superar las brechas entre los negocios y la tecnología. Estas habilidades agregan valor tomando datos y tecnología y convirtiéndolo en conocimiento práctico que la gente puede aplicar a sus operaciones diarias. Estas habilidades clave no serían posibles sin una buena comunicación. Aquí hay algunos consejos para avanzar sus habilidades de comunicación al siguiente nivel y comenzar a perfeccionar esas habilidades para el día a día dinámico de un científico de datos.
1. ¡Hágase la pregunta que quiere solucionar!
A veces sólo necesita una solución rápida y sucia para obtener una salida para trazar y hacer figuras aproximadas. Otras veces realmente no puede decir si está en el camino correcto hasta que consigue algo que funcione y comienza a mirar cómo sus datos y modelos se están comportando. Más allá de borrar el camino inicial para ajustar un modelo, conseguir algo que funcione le da un punto de partida para discusiones que pueden conducir a hallazgos útiles más rápidamente. La calidad desde un punto de vista económico, es esencial. Aquí tenemos un simple clasificador o problema de filtrado aplicado a la inspección de las piezas a medida que se fabrican. El modelo final establece umbrales para partes obviamente buenas y partes obviamente malas y luego deja espacio entre los puntos de corte “bueno” y “malo” para seleccionar partes para una inspección más profunda por personas reales. Esta solución propuesta es relativamente simple, pero incluso en este caso hipotético sería difícil llegar a la solución propuesta sin utilizar el modelo inicial para discutir factores reales como los costos de clasificar erróneamente partes o pasar horas-hombre en la supervisión humana.
Comenzando con el caso más simple y una idea clara de cómo su trabajo se utilizará le ayudará a comprender rápidamente sus datos y hacer progresos por trabajar realmente con él. Esto asegurará que usted alcance conclusiones útiles y presentables más rápidamente, y aumentará los retornos de trabajo subsecuente con los datos. Los resultados iniciales le permitirán demostrar el valor de las mejoras que incorpora haciendo comparaciones directas con una solución de línea de base. Tener una respuesta o métrica de rendimiento que puede explicar a otros también abre oportunidades para que usted pueda trabajar con profesionales técnicos y no técnicos, en lugar de probar una batería de enfoques de modelado y profundizar en las idiosincrasias del proyecto por su cuenta. En general, obtener algún tipo de resultados, o incluso errores, informará a su próximo paso, y le dará un mejor marco de referencia sobre el problema para usted y los demás.
2. ¡Salte a la solución!
A veces sólo necesita una solución rápida para obtener una salida y hacer figuras aproximadas. Otras veces usted realmente no puede decir si usted está en el camino correcto hasta que usted consigue algo que funcione y usted comienza a mirar cómo sus datos y modelos se están comportando. Más allá de borrar el camino inicial para ajustar un modelo, conseguir algo que funcione le da un punto de partida para que pueden conducir a hallazgos útiles más rápidamente. Recientemente he leído una entrada del blog sobre la aplicación de la ciencia de los datos a la garantía de calidad desde un punto de vista económico. Aquí tenemos un simple clasificador o problema de filtrado aplicado a la inspección de las piezas a medida que se fabrican. El modelo final establecen umbrales puntos de corte “bueno” y “malo” para seleccionar partes para una inspección más profunda por personas reales. Esta solución propuesta es relativamente simple, pero incluso en este caso hipotético sería difícil llegar a la solución propuesta sin utilizar el modelo inicial para discutir factores reales como los costos de clasificar erróneamente partes o pasar horas en la supervisión humana.
Comenzando con el caso más simple y una idea clara de su trabajo le ayudará a comprender rápidamente sus datos y hacer progresos. Esto asegurará que usted alcance conclusiones útiles y presentables más rápidamente, y aumentará los retornos de trabajo con los datos. Los resultados iniciales le permitirán demostrar el valor de las mejoras directas con una solución en línea. Tener una respuesta o métrica de rendimiento también abre oportunidades para que usted pueda trabajar con profesionales técnicos y no técnicos, en lugar de probar una batería de enfoques de modelado y profundizar en las idiosincrasias del proyecto . En general, obtener algún tipo de resultados, o incluso errores, informará a su próximo paso, y le dará la mejor referencia sobre el problema.
2. Gestionar activamente
Delinear las relaciones e incorporarlas en sus enfoques es clave para implementar soluciones viables a problemas reales. Incluso los desafíos que parecen ser puramente técnicos siempre existen dentro del contexto de necesidades reales de negocios, personas reales y limitaciones en tiempo real.
Los proyectos de investigación siempre parecen muy técnicos en la superficie, pero a menudo tuve que controlar el contexto para trabajar con otros grupos de investigadores. Para solucionar el problema, tuve que percibir y comunicar estas cuestiones relacionales para tomar el control de los datos. Enmarcamos el problema desde el punto de vista de que queremos tener fuentes confiables de datos y no causar estrés indebido. Es importante determinar las relaciones que los clientes necesitan para obtener aprobación para compartir datos o para programar llamadas de conferencia con los verdaderos influyentes de su proyecto. Para tareas internas como el raspado de datos, debemos mantenerse mutuamente a bordo con los usuarios finales para nuevos conjuntos de datos y modelos. También presentamos nuestras solicitudes en el contexto del tiempo dedicado a obtener resultados , o equilibrar las necesidades de otros departamentos y clientes. Mantener el control de las relaciones le da la imagen completa de obstáculos para el éxito y le permite replantear preguntas y comunicarse.
3. Entenderlo y procesarlo:
Una clave para generar conocimiento es asegurarse de que las partes interesadas puedan entenderlo y procesarlo. En primer lugar aprendí esta lección en la investigación académica , los conceptos técnicos clave antes de pasar a discutir sus métodos. Las descripciones concisas son necesarias para mantener las presentaciones y publicaciones dentro de las limitaciones de longitud y para mantenerse en el buen camino.
Mis proyectos ahora implican varios métodos estadísticos, software sofisticado, algo de mi propio scripting, y datos específicos del dominio. La ciencia de datos involucra detalles técnicos de múltiples disciplinas y los informes suelen estar preparados para una audiencia más orientada a los resultados. Para una próxima presentación, estoy discutiendo cómo utilizar varios motores de aprendizaje automático para la regresión con datos. En mis primeras ediciones me esforcé por dar descripciones completas y técnicas de cada aprendizaje, así como la regresión de mínimos cuadrados ordinarios.
Bucear en detalles que están fuera del alcance de los problemas puede confundir a sus clientes sobre cuál es el tema principal. Un cliente con más experiencia técnica puede tener preguntas sobre detalles más finos que tienen efectos importantes en sus modelos y análisis, pero realmente no les haces ningún favor compartiendo información antes de proporcionar toda la información.
