Agenda

1 Track 1
2 Track 2
9:00 - 9:30
Registro
09:30 - 10:00
Bienvenida a la jornadas y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning
José F. Aldana Montes
10:00 -11:00
I need to sort out my wardrobe. Image classification of fashion items using Deep Learning
Amy Kate Boyd
11:00 -11:45
Descanso
11:45 - 12:30
Sí yo he podido aprender algo de eso llamado IA... ¡Créeme, tú también puedes!
Eduard Tomas
11:45 - 12:30
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
Manuel Rodrigo Cabello
Alexander González
12:40 - 13:25
Estado del Arte de la IA
Pablo Álvarez Doval
12:40 - 13:25
LSTM, ¿qué son y cuándo se usan?
Sara San Luís Rodríguez
13:25- 14:30
Descanso
14:30 - 15:15
Power BI: Storytelling, Quick Insights, Q&A
Rocío Sesma Alcalde
Mª Dolores Jiménez Cotillas
14:30 - 15:15
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Jesús Antonio Sánchez
Daniel Escribano
15:25- 16:10
Introducción a la arquitectura Data Lake con Azure
Daniel Escribano
Rafael Gómez
15:25- 16:10
Introducción a NLP (Natural Language Processing) en Azure
Eduardo Matallanas
Jesús Antonio Sánchez
16:10 - 17:15
BIGOWL: Using Semantics to Develop Big Data Analytics Solutions
José Manuel García Nieto
16:10 - 17:15
Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información
David Mateos Fernandez
Manuel Rodrigo Cabello
17:15 - 18:00
Unbalanced data: Same algorithms different techniques
Eric Martín Cañete
17:15 - 18:00
De cero a cien con Reinforcement Learning
Manuel Martín Mairal
18:00 - 18:30 
Q&A/Networking
9:00 - 9:30
Registro
09:30 - 10:00
Bienvenida a la jornadas y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning
José F. Aldana Montes
10:00 -11:00
I need to sort out my wardrobe. Image classification of fashion items using Deep Learning
Amy Kate Boyd
11:00 -11:45
Descanso
1 Track 1
11:45 - 12:30
Sí yo he podido aprender algo de eso llamado IA... ¡Créeme, tú también puedes!
Eduard Tomas
12:40 - 13:25
Estado del Arte de la IA
Pablo Álvarez Doval
2 Track 2
11:45 - 12:30
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
Manuel Rodrigo Cabello
Alexander González
12:40 - 13:25
LSTM, ¿qué son y cuándo se usan?
Sara San Luís Rodríguez
13:25- 14:30
Descanso
1 Track 1
14:30 - 15:15
Power BI: Storytelling, Quick Insights, Q&A
Rocío Sesma Alcalde
Mª Dolores Jiménez Cotillas
15:25- 16:10
Introducción a la arquitectura Data Lake con Azure
Daniel Escribano
Rafael Gómez
16:10 - 17:15
BIGOWL: Using Semantics to Develop Big Data Analytics Solutions
José Manuel García Nieto
17:15 - 18:00
Unbalanced data: Same algorithms different techniques
Eric Martín Cañete
2 Track 2
14:30 - 15:15
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Jesús Antonio Sánchez
Daniel Escribano
15:25- 16:10
Introducción a NLP (Natural Language Processing) en Azure
Eduardo Matallanas
Jesús Antonio Sánchez
16:10 - 17:15
Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información
David Mateos Fernandez
Manuel Rodrigo Cabello
17:15 - 18:00
De cero a cien con Reinforcement Learning
Manuel Martín Mairal
Clausura
18:00 - 18:30
Q&A/Networking
Close
I need to sort out my wardrobe. Image classification of fashion items using Deep Learning
I need to sort out my wardrobe: Image classification of fashion items using Deep Learning. Classifying numbers and letters is so last season .. Let’s classify our wardrobes instead! Learn all about the ins and outs of image classification using deep learning. In this session I will show two forms of image classification using deep learning. One will be using the Microsoft Custom Vision service and transfer learning, and the other will be using the Microsoft Azure Data Science Virtual machine and the deep learning API, Keras. I will show you, step-by-step, how to classify clothing into categories such as dresses, t-shirts, sandals, trainers etc. The dataset we will use will be the Fashion MNIST dataset from Zalando the online fashion brand: https://github.com/zalandoresearch/fashion-mnist. Content: https://github.com/amynic/deep-learning-fashion
Close
Amy Kate Boyd
Cloud Developer Advocate, Growth & Ecosystem (G&E at Microsoft)
Bio
A highly passionate, motivated, hardworking and reliable individual. Thrives when working with, and leading teams to solve complex problems and deliver a solution. Demonstrated during her role as a Software Engineer and Technical Evangelist, leading customer and partner engagements around key technologies such as Machine Learning, Internet of Things and Power BI. Striving to constantly learn and develop technical and soft skillsets. Demonstrates excellent communication and presentation skills whilst working in a variety of customer facing roles.
Charla
I need to sort out my wardrobe. Image classification of fashion items using Deep Learning
Descripción
I need to sort out my wardrobe: Image classification of fashion items using Deep Learning. Classifying numbers and letters is so last season .. Let’s classify our wardrobes instead! Learn all about the ins and outs of image classification using deep learning. In this session I will show two forms of image classification using deep learning. One will be using the Microsoft Custom Vision service and transfer learning, and the other will be using the Microsoft Azure Data Science Virtual machine and the deep learning API, Keras. I will show you, step-by-step, how to classify clothing into categories such as dresses, t-shirts, sandals, trainers etc. The dataset we will use will be the Fashion MNIST dataset from Zalando the online fashion brand: https://github.com/zalandoresearch/fashion-mnist. Content: https://github.com/amynic/deep-learning-fashion
Close
Estado del Arte de la IA
En esta sesión se hará un breve repaso histórico a los desarrollos en el campo de la inteligencia artificial, para después poder pasar a discutir el estado actual del campo, los nuevos desarrollos tanto en el entorno académico como el empresarial, y las líneas de investigación abiertas más interesantes.Repasaremos los papers más interesantes publicados este año en los campos de imagen artificial, procesado de texto y audio y aprendizaje por refuerzo, hablaremos del paso de las redes neuronales convolucionales a capsNets, y de como se están empleando estos nuevos desarrollos en clientes y empresas específicas.
Close
Pablo Álvarez Doval
Principal Data Architect at Plain Concepts
Bio
Data Architect y General Manager de Plain Concepts en el Reino Unido. Con experiencia en bases de datos relacionales, data warehousing y proyectos tradicionales de BI, ha dedicado los últimos años a diseñar y construir proyectos Big Data y Machine Learning para clientes de diferentes sectores como Healthcare, Digital Media, Retail e Industria.
Charla
Estado del Arte de la IA
Descripción
En esta sesión se hará un breve repaso histórico a los desarrollos en el campo de la inteligencia artificial, para después poder pasar a discutir el estado actual del campo, los nuevos desarrollos tanto en el entorno académico como el empresarial, y las líneas de investigación abiertas más interesantes.Repasaremos los papers más interesantes publicados este año en los campos de imagen artificial, procesado de texto y audio y aprendizaje por refuerzo, hablaremos del paso de las redes neuronales convolucionales a capsNets, y de como se están empleando estos nuevos desarrollos en clientes y empresas específicas.
Close
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
En esta sesión veremos como podemos utilizar nuestra Raspberry Pi para realizar detección de objetos en imágenes utilizando Tensorflow tanto para el entrenamiento como para la inferencia.. Para ellos realizaremos una demostración en directo donde utilizaremos la cámara de la Raspberry para detectar objetos en una imagen haciendo uso del nuevo paquete de Tensorflow optimizado para este dispositivo
Close
Manuel Rodrigo Cabello
MVP on Artificial Intelligence
Bio
Software Engineer en Plain Concepts y MVP en Inteligencia Artificial con una experiencia de más de 9 años en el desarrollo de aplicaciones. Apasionado de las nuevas tecnologías y todo lo que tenga que ver con técnicas basadas en Inteligencia Artificial.
Charla
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
Descripción
En esta sesión veremos como podemos utilizar nuestra Raspberry Pi para realizar detección de objetos en imágenes utilizando Tensorflow tanto para el entrenamiento como para la inferencia.. Para ellos realizaremos una demostración en directo donde utilizaremos la cámara de la Raspberry para detectar objetos en una imagen haciendo uso del nuevo paquete de Tensorflow optimizado para este dispositivo
Charla 2
Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información
Descripción Charla 2
Durante esta sesión haremos una breve introducción al proceso de Information Retrieval y analizaremos los principales conceptos:- Query expansion- Word Embedding- Matching- Retrieval Model (Métricas de recuperación) - Word Mover's distance - Word Centroid Distance - Doc2Vec InferenceA parte de utilizar los clásicos modelos como tf-idf, también veremos como utilizar distintos modelos de word embedding para facilitar una recuperación semántica.- FastText- Word2Vec- Doc2Vec
Close
Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información
Durante esta sesión haremos una breve introducción al proceso de Information Retrieval y analizaremos los principales conceptos:- Query expansion- Word Embedding- Matching- Retrieval Model (Métricas de recuperación) - Word Mover's distance - Word Centroid Distance - Doc2Vec InferenceA parte de utilizar los clásicos modelos como tf-idf, también veremos como utilizar distintos modelos de word embedding para facilitar una recuperación semántica.- FastText- Word2Vec- Doc2Vec
Close
David Mateos Fernandez
Gerente de Desarrollo y Arquitectura en Aenor
Bio
Licenciado en Informática en la Universidad Politécnica de Madrid. Formo parte del equipo del departamento de IT de AENOR como Gerente de Desarrollo y Arquitectura. Actualmente estamos inmersos en un Plan de Sistemas, y en la mejora continua de metodologías de trabajo en los distintos equipos para ofrecer el mejor servicio. Mi trayectoria profesional ha evolucionado desde un inicio puramente técnico hacía funciones de “management”, muy enfocado a entender las necesidades de mi cliente interno.
Charla
Caso de éxito: Recomendación de normas de Aenor usando técnicas de Recuperación de Información
Descripción
Durante esta sesión haremos una breve introducción al proceso de Information Retrieval y analizaremos los principales conceptos:- Query expansion- Word Embedding- Matching- Retrieval Model (Métricas de recuperación) - Word Mover's distance - Word Centroid Distance - Doc2Vec InferenceA parte de utilizar los clásicos modelos como tf-idf, también veremos como utilizar distintos modelos de word embedding para facilitar una recuperación semántica.- FastText- Word2Vec- Doc2Vec
Close
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
En esta sesión veremos como podemos utilizar nuestra Raspberry Pi para realizar detección de objetos en imágenes utilizando Tensorflow tanto para el entrenamiento como para la inferencia.. Para ellos realizaremos una demostración en directo donde utilizaremos la cámara de la Raspberry para detectar objetos en una imagen haciendo uso del nuevo paquete de Tensorflow optimizado para este dispositivo
Close
Alexander González
Software Engineer en Plain Concepts
Bio
Graduado en Ingeniería Informática. Formo parte del equipo de IA en Plain Concepts y formaba parte del programa Microsoft Student Partner en Microsoft España. En mis tiempos libres se puede decir que disfruto de muchas cosas, principalmente siempre intento viajar, jugar al futbol y a videojuegos, ver series, y además siempre estar al tanto del mundo de la tecnología, asistiendo a charlas, preparando talleres e investigando.
Charla
Raspberry Pi: Reconocimiento de imágenes con Tensorflow
Descripción
En esta sesión veremos como podemos utilizar nuestra Raspberry Pi para realizar detección de objetos en imágenes utilizando Tensorflow tanto para el entrenamiento como para la inferencia.. Para ellos realizaremos una demostración en directo donde utilizaremos la cámara de la Raspberry para detectar objetos en una imagen haciendo uso del nuevo paquete de Tensorflow optimizado para este dispositivo
Close
BIGOWL: Using Semantics to Develop Big Data Analytics Solutions
La extracción e incorporación de conocimiento se considera beneficiosa para el análisis eficiente de Big Data. El conocimiento puede formar parte en el diseño del flujo de trabajo, la definición de restricciones, la selección y configuración de parámetros, las estrategias interactivas y de toma de decisiones. BIGOWL es una ontología para apoyar la gestión del conocimiento en Big Data Analytics. BIGOWL está diseñado para cubrir un amplio vocabulario de términos relacionados con los flujos de trabajo de análisis Big Data, incluidos sus componentes y la forma en que están conectados, desde las fuentes de datos hasta la visualización analítica. Se han desarrollado varios casos prácticos entre los que se encuentra el procesamiento de transmisión en tiempo real con Spark de datos de tráfico del portal de datos abiertos de Nueva York, para la optimización de rutas en el entorno urbano de la ciudad de Nueva York.
Close
José Manuel García Nieto
Post-Doctoral Researcher at Khaos Research
Bio
Investigador Postdoctoral de la Universidad de Málaga con experiencia en técnicas metaheurísticas de optimización multi-objetivo, las técnicas de Web Semántica y los algoritmos avanzados en minería de datos, con especial interés en ecosistemas Big Data y con aplicación en problemas duros del mundo real en campos multidisciplinares como: Bioinformática (MSA, Molecular docking, selección de genes y clasificación en Microarrays de ADN) y Smart Cities.
Charla
BIGOWL: Using Semantics to Develop Big Data Analytics Solutions
Descripción
La extracción e incorporación de conocimiento se considera beneficiosa para el análisis eficiente de Big Data. El conocimiento puede formar parte en el diseño del flujo de trabajo, la definición de restricciones, la selección y configuración de parámetros, las estrategias interactivas y de toma de decisiones. BIGOWL es una ontología para apoyar la gestión del conocimiento en Big Data Analytics. BIGOWL está diseñado para cubrir un amplio vocabulario de términos relacionados con los flujos de trabajo de análisis Big Data, incluidos sus componentes y la forma en que están conectados, desde las fuentes de datos hasta la visualización analítica. Se han desarrollado varios casos prácticos entre los que se encuentra el procesamiento de transmisión en tiempo real con Spark de datos de tráfico del portal de datos abiertos de Nueva York, para la optimización de rutas en el entorno urbano de la ciudad de Nueva York.
Close
Introducing MongoDB and PyMongo for developing scalable applications
MongoDB (de la palabra en inglés “humongous” que significa enorme) es un sistema de base de datos NoSQL orientado a documentos, desarrollado bajo el concepto de código abierto. MongoDB forma parte de la nueva familia de sistemas de base de datos NoSQL. En lugar de guardar los datos en tablas como se hace en las base de datos relacionales, MongoDB guarda estructuras de datos en documentos similares a JSON con un esquema dinámico (MongoDB utiliza una especificación llamada BSON), haciendo que la integración de los datos en ciertas aplicaciones sea más fácil y rápida. En el taller de MongoDB y Python se abordará una introducción al modelo de datos NoSQL usado por MongoDB y los aspectos principales en la gestión de un servidor MongoDB y el uso del mismo para el acceso a datos. Se completará el taller con el acceso a los datos desde Python usando para ello PyMongo, y realizando tratamientos y visualizaciones sencillas de los datos. Para este taller se usará un repositorio de datos de delitos en Chicago
Close
Ismael Navas Delgado
Senior Researcher at Khaos Research
Bio
Profesor Titular de Universidad. Ingeniero en Informática, Máster en Biología Celular y Molecular, y Doctor por la Universidad de Málaga. Miembro del grupo Khaos de la Universidad de Málaga con experiencia en integración de datos mediante el uso de tecnologías semánticas y su aplicación a las Ciencias de la Vida. Docente con experiencia en bases de datos, almacenes de datos, estándares de datos y bases de datos NoSQL (MongoDB, Cassandra, Hive, Hbase, Neo4J).
Charla
Introducing MongoDB and PyMongo for developing scalable applications
Descripción
MongoDB (de la palabra en inglés “humongous” que significa enorme) es un sistema de base de datos NoSQL orientado a documentos, desarrollado bajo el concepto de código abierto. MongoDB forma parte de la nueva familia de sistemas de base de datos NoSQL. En lugar de guardar los datos en tablas como se hace en las base de datos relacionales, MongoDB guarda estructuras de datos en documentos similares a JSON con un esquema dinámico (MongoDB utiliza una especificación llamada BSON), haciendo que la integración de los datos en ciertas aplicaciones sea más fácil y rápida. En el taller de MongoDB y Python se abordará una introducción al modelo de datos NoSQL usado por MongoDB y los aspectos principales en la gestión de un servidor MongoDB y el uso del mismo para el acceso a datos. Se completará el taller con el acceso a los datos desde Python usando para ello PyMongo, y realizando tratamientos y visualizaciones sencillas de los datos. Para este taller se usará un repositorio de datos de delitos en Chicago
Close
Bienvenida a la jornadas y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning
Bienvenida a la jornada y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning con Víctor Fernando Muñoz Vicerrector de Proyectos Estratégicos Universidad de Málaga, Ernesto Pimentel Director de la E.T.S. de Ingeniería Informática Universidad de Málaga, José F. Aldana Director de la Cátedra de IA, Big Data Analytics y Machine Learning y Pablo Doval y Rodrigo Cabello de Plain Concepts
Close
José F. Aldana Montes
Principal Researcher at Khaos Research
Bio
Catedrático de Universidad. Licenciado en Informática y Doctor en Informática por la Universidad de Málaga. Investigador Principal del grupo Khaos de la Universidad de Málaga con interés en la intersección de las tecnologías de Bases de Datos, Web Semántica, Linked Open data y Big Data. Investigador Principal de 22 proyectos de investigación obtenidos en convocatorias competitivas, con más de 250 artículos publicados.
Charla
Bienvenida a la jornadas y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning
Descripción
Bienvenida a la jornada y presentación de la Cátedra de IA, Big Data Analytics y Machine Learning con Víctor Fernando Muñoz Vicerrector de Proyectos Estratégicos Universidad de Málaga, Ernesto Pimentel Director de la E.T.S. de Ingeniería Informática Universidad de Málaga, José F. Aldana Director de la Cátedra de IA, Big Data Analytics y Machine Learning y Pablo Doval y Rodrigo Cabello de Plain Concepts
Close
Power BI: Storytelling, Quick Insights, Q&A
En esta charla se hará un repaso de las funcionalidades que incorpora Power BI y que nos permiten contar historias con los datos, pasando de tener informes desconectados entre sí a narrar historias interesantes siguiendo un guion. Además, veremos cómo obtener más información de nuestros conjuntos de datos usando las funcionalidades de Quick Insights y Q&A.
Close
Rocío Sesma Alcalde
Data Engineer at Plain Concepts
Bio
Data engineer en Plain concrepts, trabajando en proyectos de Business Intelligence desde hace muchos años. Me encanta conocer nuevos negocios a través de sus datos y diseñar modelos que den respuestas a los usuarios.
Charla
Power BI: Storytelling, Quick Insights, Q&A
Descripción
En esta charla se hará un repaso de las funcionalidades que incorpora Power BI y que nos permiten contar historias con los datos, pasando de tener informes desconectados entre sí a narrar historias interesantes siguiendo un guion. Además, veremos cómo obtener más información de nuestros conjuntos de datos usando las funcionalidades de Quick Insights y Q&A.
Close
Sí yo he podido aprender algo de eso llamado IA... ¡Créeme, tú también puedes!
¿Quieres empezar a aprender un poco sobre IA, pero te confunden tantos términos raros? Te cuesta distinguir entre IA, Machine Learning, Deep Learning, Redes Neuronales y demás palabrejas? ¿No sabes ni como empezar a meterte en este mundillo? ¿Ni que lenguajes o frameworks existen? ¡No té preocupes! ¡Yo estaba como tú! En esta charla te contaré como yo he aprendido algo de este mundillo y te contaré los fundamentos básicos para que puedas meterte en él sin miedo! ¡Créeme, si yo he podido... tú también podrás!
Close
Eduard Tomas
MVP on Visual Studio and Development Team Lead at Plain Concepts
Bio
Friki standard de nivel 10. Le gusta la música heviata, los libros de fantasía y ciencia ficción, los juegos de rol con papel y dados de colores y como no, el desarrollo… Tras varios años de ir dando la lata y de charlar en eventos internacionales (vale, un par de veces en Andorra) fue reconocido MVP en IIS/ASP.NET por parte de Microsoft, por lo que tiene en casa una esatuilla de algo parecido al cristal con 6 anillitos muy monos. En su tiempo libre lo puedes encontrar programando algún que otro engendro en Plain Concepts.
Charla
Sí yo he podido aprender algo de eso llamado IA... ¡Créeme, tú también puedes!
Descripción
¿Quieres empezar a aprender un poco sobre IA, pero te confunden tantos términos raros? Te cuesta distinguir entre IA, Machine Learning, Deep Learning, Redes Neuronales y demás palabrejas? ¿No sabes ni como empezar a meterte en este mundillo? ¿Ni que lenguajes o frameworks existen? ¡No té preocupes! ¡Yo estaba como tú! En esta charla te contaré como yo he aprendido algo de este mundillo y te contaré los fundamentos básicos para que puedas meterte en él sin miedo! ¡Créeme, si yo he podido... tú también podrás!
Close
Power BI: Storytelling, Quick Insights, Q&A
En esta charla se hará un repaso de las funcionalidades que incorpora Power BI y que nos permiten contar historias con los datos, pasando de tener informes desconectados entre sí a narrar historias interesantes siguiendo un guion. Además, veremos cómo obtener más información de nuestros conjuntos de datos usando las funcionalidades de Quick Insights y Q&A.
Close
Mª Dolores Jiménez Cotillas
Software Engineer at Plain Concepts
Bio
Loli Jiménez es ingeniera telemática y trabaja como desarrolladora en Plain Concepts, participando en proyectos de Office 365, SharePoint y Power BI. Tiene una experiencia de más de 8 años en el desarrollo de aplicaciones.
Charla
Power BI: Storytelling, Quick Insights, Q&A
Descripción
En esta charla se hará un repaso de las funcionalidades que incorpora Power BI y que nos permiten contar historias con los datos, pasando de tener informes desconectados entre sí a narrar historias interesantes siguiendo un guion. Además, veremos cómo obtener más información de nuestros conjuntos de datos usando las funcionalidades de Quick Insights y Q&A.
Close
De cero a cien con Reinforcement Learning
Abordaremos los conceptos básicos que envuelven el reinforcement learning, para seguidamente examinar de cerca los principales frameworks del ecosistema Python que se utilizan en este campo. Con estas herramientas básicas estaremos listos para pasar a la acción y trataremos de dar solución a dos problemas sencillos en base a todo lo aprendido.
Close
Manuel Martín Mairal
Data Scientist at Plain Concepts
Bio
Data Scientist en Plain Concepts. Malagueño afincado en Bilbao. Entusiasta de las tecnologías big data y de la resolución de problemas de analítica de datos mediante técnicas modernas de aprendizaje estadístico y deep learning.
Charla
De cero a cien con Reinforcement Learning
Descripción
Abordaremos los conceptos básicos que envuelven el reinforcement learning, para seguidamente examinar de cerca los principales frameworks del ecosistema Python que se utilizan en este campo. Con estas herramientas básicas estaremos listos para pasar a la acción y trataremos de dar solución a dos problemas sencillos en base a todo lo aprendido.
Close
Show me the code: Desarrollo de modelos con Deep Learning 
En este workshop se hará una introducción al desarrollo de modelos de Deep Learning con Tensorflow y Keras, su despliegue y posterior consumo desde nuestras aplicaciones.Se verán dos tipos de problemas en la práctica: clasificación de imágenes y extracción de conocimientos de texto, Para cada uno de ellos se hará una introducción teórica (Redes neuronales convolucionales, técnicas de embedding, etc...) y a continuación se guiará a los participantes del taller en el desarrollo de la solución.
Close
José Fernández Vizoso
Data Engineer at Plain Concepts
Bio
Tech Lead en Plain Concepts UK. Con background en desarrollo y bases de datos, en los últimos años ha participado sobre todo en proyectos de Big Data y Machine Learning.
Charla
Show me the code: Desarrollo de modelos con Deep Learning 
Descripción
En este workshop se hará una introducción al desarrollo de modelos de Deep Learning con Tensorflow y Keras, su despliegue y posterior consumo desde nuestras aplicaciones.Se verán dos tipos de problemas en la práctica: clasificación de imágenes y extracción de conocimientos de texto, Para cada uno de ellos se hará una introducción teórica (Redes neuronales convolucionales, técnicas de embedding, etc...) y a continuación se guiará a los participantes del taller en el desarrollo de la solución.
Close
Introducción a la arquitectura Data Lake con Azure
En esta charla la idea es ilustrar cómo funciona y qué componentes forman parte de una arquitectura Data Lake clásica pero usando tecnología cloud de Azure. La charla se dividirá en:1. ¿De dónde veníamos? DW clásico y primeras aproximaciones usando Hadoop2. Introducción del concepto de Data Lakea. Cambio de arquitecturab. Desacoplamiento de datos, consumidores y potencia de cálculoc. Descripción de componentes principales: Azure Data Lake Store, HDInsight, Data Factory, Azure SQL database3. Demo end-to-end de la arquitectura funcionando4. Lambda architecture como manera de extender a escenario real time5. Importancia del Data Warehouse en escenarios “big data” (Apache Kylin)
Close
Rafael Gómez
Data Engineer at Plain Concepts
Bio
Data Engineer en Plain Concepts dedicado a proyectos de Big Data (principalmente arquitectura DataLake) en Azure. Interesado en SQL Server, HDInsight y .NET en general. Dedico tiempo libre a la domótica, música y cine.
Charla
Introducción a la arquitectura Data Lake con Azure
Descripción
En esta charla la idea es ilustrar cómo funciona y qué componentes forman parte de una arquitectura Data Lake clásica pero usando tecnología cloud de Azure. La charla se dividirá en:1. ¿De dónde veníamos? DW clásico y primeras aproximaciones usando Hadoop2. Introducción del concepto de Data Lakea. Cambio de arquitecturab. Desacoplamiento de datos, consumidores y potencia de cálculoc. Descripción de componentes principales: Azure Data Lake Store, HDInsight, Data Factory, Azure SQL database3. Demo end-to-end de la arquitectura funcionando4. Lambda architecture como manera de extender a escenario real time5. Importancia del Data Warehouse en escenarios “big data” (Apache Kylin)
Close
LSTM, ¿qué son y cuándo se usan?
Las unidades LSTM (long Short-Term Memory STM) son un tipo de bloques empleados para la construcción de redes neuronales recurrentes. Estas se caracterizan por ser capaces de recordar diferentes valores a lo largo de intervalos de tiempo aleatorios.En esta charla trataremos este tipo de unidades junto con algunas de sus aplicaciones prácticas.
Close
Sara San Luís Rodríguez
Software Engineer at Plain Concepts
Bio
Apasionada de las ciencias desde pequeña, estudié Matemáticas en la Universidad de Santiago de Compostela, formación que completé con un Máster en Estadística e Investigación Operativa. Este último me permitió adentrarme en el mundo de la IA y del ML, campos en los que trabajo ahora mismo en Plain Concepts como Data Scientist.
Charla
LSTM, ¿qué son y cuándo se usan?
Descripción
Las unidades LSTM (long Short-Term Memory STM) son un tipo de bloques empleados para la construcción de redes neuronales recurrentes. Estas se caracterizan por ser capaces de recordar diferentes valores a lo largo de intervalos de tiempo aleatorios.En esta charla trataremos este tipo de unidades junto con algunas de sus aplicaciones prácticas.
Close
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Esta sesión tiene como objetivo enseñar como definir un pipeline de entrenamiento y despliegue de modelos de machine learning. La idea será adaptar el enfoque de TensorFlow extended a Azure ML, viendo cada una de las partes del proceso y describiendo cada uno de los componentes usando el ecosistema de Microsoft (Azure, AzureML, etc)
Close
Daniel Escribano
Software Engineer at Plain Concepts
Bio
Data Engineer en Plain Concepts. Entre datos, código y Azure paso mi tiempo.
Charla
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Descripción
Esta sesión tiene como objetivo enseñar como definir un pipeline de entrenamiento y despliegue de modelos de machine learning. La idea será adaptar el enfoque de TensorFlow extended a Azure ML, viendo cada una de las partes del proceso y describiendo cada uno de los componentes usando el ecosistema de Microsoft (Azure, AzureML, etc)
Charla 2
Introducción a la arquitectura Data Lake con Azure
Descripción Charla 2
En esta charla la idea es ilustrar cómo funciona y qué componentes forman parte de una arquitectura Data Lake clásica pero usando tecnología cloud de Azure. La charla se dividirá en:1. ¿De dónde veníamos? DW clásico y primeras aproximaciones usando Hadoop2. Introducción del concepto de Data Lakea. Cambio de arquitecturab. Desacoplamiento de datos, consumidores y potencia de cálculoc. Descripción de componentes principales: Azure Data Lake Store, HDInsight, Data Factory, Azure SQL database3. Demo end-to-end de la arquitectura funcionando4. Lambda architecture como manera de extender a escenario real time5. Importancia del Data Warehouse en escenarios “big data” (Apache Kylin)
Close
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Esta sesión tiene como objetivo enseñar como definir un pipeline de entrenamiento y despliegue de modelos de machine learning. La idea será adaptar el enfoque de TensorFlow extended a Azure ML, viendo cada una de las partes del proceso y describiendo cada uno de los componentes usando el ecosistema de Microsoft (Azure, AzureML, etc)
Close
Jesús Antonio Sánchez
Software Engineer at Plain Concepts
Bio
Data engineer en Plain Concepts desde 2014. Experiencia en desarrollo de software, ha dedicado los últimos 5 años a los datos, pasando por muchos tipos de proyectos, desde proyectos de Big Data, consultoría de SQL Server, data warehousing a, últimamente, centrado en  proyectos de Machine Learning y, concretamente, NLP (Natural Language Processing). Apasionado del desarrollo de software, los datos y de los juegos online.
Charla
Desplegando modelos de Machine Learning en producción (y no morir en el intento)
Descripción
Esta sesión tiene como objetivo enseñar como definir un pipeline de entrenamiento y despliegue de modelos de machine learning. La idea será adaptar el enfoque de TensorFlow extended a Azure ML, viendo cada una de las partes del proceso y describiendo cada uno de los componentes usando el ecosistema de Microsoft (Azure, AzureML, etc)
Charla 2
Introducción a NLP (Natural Language Processing) en Azure
Descripción Charla 2
Esta charla pretende introducir a la audiencia al mundo del procesamiento del lenguaje natural, o NLP por sus siglas en inglés (Natural Language Processing). La charla en sí constará de 3 bloques.1. Estado del arte en NLP. ¿Qué se está usando hoy en día? ¿Qué problemas podemos solucionar y qué problemas no? Técnicas comúnmente usados en la industria2. Introducción a conceptos básicos a la hora de afrontar un proyecto ML con NLP: preprocesado, vectorización y embedding (word2vec, fastText, técnicas básicas como tf-idf, counting, etc). Clasificadores.3. Pequeño ejemplo práctico con despliegue usando Azure Machine Learning.
Close
Introducción a NLP (Natural Language Processing) en Azure
Esta charla pretende introducir a la audiencia al mundo del procesamiento del lenguaje natural, o NLP por sus siglas en inglés (Natural Language Processing). La charla en sí constará de 3 bloques.1. Estado del arte en NLP. ¿Qué se está usando hoy en día? ¿Qué problemas podemos solucionar y qué problemas no? Técnicas comúnmente usados en la industria2. Introducción a conceptos básicos a la hora de afrontar un proyecto ML con NLP: preprocesado, vectorización y embedding (word2vec, fastText, técnicas básicas como tf-idf, counting, etc). Clasificadores.3. Pequeño ejemplo práctico con despliegue usando Azure Machine Learning.
Close
Eduardo Matallanas
Data Engineer at Plain Concepts
Bio
Data Engineer en Plain Concepts. Emocionado por las nuevas tecnologías, la robótica y la inteligencia artificial. Llevo trabajando en este campo desde hace 8 años tanto en el ámbito universitario como empresarial. Mis últimos proyectos han estado relacionados con chatbots y el uso de motores NLP para su impletación. Desde mi incorporación en Plain Concepts, me dedico a proyectos relacionados con Machine Learning. A parte del software, disfruto mucho el ciclismo, escuchar música, leer y salir con amigos.
Charla
Introducción a NLP (Natural Language Processing) en Azure
Descripción
Esta charla pretende introducir a la audiencia al mundo del procesamiento del lenguaje natural, o NLP por sus siglas en inglés (Natural Language Processing). La charla en sí constará de 3 bloques.1. Estado del arte en NLP. ¿Qué se está usando hoy en día? ¿Qué problemas podemos solucionar y qué problemas no? Técnicas comúnmente usados en la industria2. Introducción a conceptos básicos a la hora de afrontar un proyecto ML con NLP: preprocesado, vectorización y embedding (word2vec, fastText, técnicas básicas como tf-idf, counting, etc). Clasificadores.3. Pequeño ejemplo práctico con despliegue usando Azure Machine Learning.
Close
Unbalanced data: Same algorithms different techniques
The idea like in other algorithms is to divide the training data set in little pieces. A different algorithm is trained over each piece. Usually this kind of algorithms is majority-vote based. That means that when a new data point enters, the algorithm asks every little algorithm and the most-voted class is the one selected. But why the majority? There are some data configurations or some problems that need to be treated different. A good example it could be illness detection vs stock trading. In the first problem you need to be sure that you detect all ill people and detect some false positives is less important. On the other hand we have stock trading problem where it is not important not detect some good signals to enter the market but it is necessary to have not too much false positives. Obviously for the first class of problem is better to accept less number of algorithms classifying a patient as ill than the majority and in the second case it could be interesting to increase the number of little algorithms predicting a good signal to enter the market. Unbalanced data is first kind data. What this algorithm does is to evaluate each training data point asking all little trees to obtain a score, for example if the original dataset has been divided into 5 subspaces the score will be an integer between 0 and 5 representing the number of trees that prognosticates a certain class. This number is a very important related data that it will be used as a feature to generate a new dataset with just one feature (this weight) and obviously the data point class. With this new dataset we can train other algorithm to determinate which is the most optimum weight to predict a class or the other one. The result of this method is a “new algorithm” that is able to work over unbalanced data because it detects the necessary of promote minority class and it will set a weight threshold according to this. This method has been probed over some unbalanced datasets including some of them from Kaggle public files. It always gets a more than acceptable score in comparison with other solutions. Other good characteristic is that this algorithm not only works over unbalanced. It has been tested over some more datasets and it always obtains better accuracy than Random Forest in classification problems. It’s remarkable that Random Forest is a very common and very powerful algorithm and this new modifications can generate the possibility of improve it and make it more independent from data attending to data. That means that this method gives some more autonomy to the algorithm to work over different data natures such as the unpredictable unbalanced data.
Close
Eric Martín Cañete
Software Engineer at Plain Concepts
Bio
Data Scientist en Plain Concepts con experiencia en multitud de campos relacionados con la analítica avanzada, Big Data, modelos predictivos e Inteligencia Artificial. Apasionado del análisis de datos y de los insights que se pueden obtener de ellos así como las últimas tecnologías y algoritmos para explotarlos.
Charla
Unbalanced data: Same algorithms different techniques
Descripción
The idea like in other algorithms is to divide the training data set in little pieces. A different algorithm is trained over each piece. Usually this kind of algorithms is majority-vote based. That means that when a new data point enters, the algorithm asks every little algorithm and the most-voted class is the one selected. But why the majority? There are some data configurations or some problems that need to be treated different. A good example it could be illness detection vs stock trading. In the first problem you need to be sure that you detect all ill people and detect some false positives is less important. On the other hand we have stock trading problem where it is not important not detect some good signals to enter the market but it is necessary to have not too much false positives. Obviously for the first class of problem is better to accept less number of algorithms classifying a patient as ill than the majority and in the second case it could be interesting to increase the number of little algorithms predicting a good signal to enter the market. Unbalanced data is first kind data. What this algorithm does is to evaluate each training data point asking all little trees to obtain a score, for example if the original dataset has been divided into 5 subspaces the score will be an integer between 0 and 5 representing the number of trees that prognosticates a certain class. This number is a very important related data that it will be used as a feature to generate a new dataset with just one feature (this weight) and obviously the data point class. With this new dataset we can train other algorithm to determinate which is the most optimum weight to predict a class or the other one. The result of this method is a “new algorithm” that is able to work over unbalanced data because it detects the necessary of promote minority class and it will set a weight threshold according to this. This method has been probed over some unbalanced datasets including some of them from Kaggle public files. It always gets a more than acceptable score in comparison with other solutions. Other good characteristic is that this algorithm not only works over unbalanced. It has been tested over some more datasets and it always obtains better accuracy than Random Forest in classification problems. It’s remarkable that Random Forest is a very common and very powerful algorithm and this new modifications can generate the possibility of improve it and make it more independent from data attending to data. That means that this method gives some more autonomy to the algorithm to work over different data natures such as the unpredictable unbalanced data.