[Py-MAD] [OT] potencial charla en preparación :D

Hernán Foffani hfoffani at gmail.com
Fri Jun 21 13:07:47 CEST 2013


Una aclaración: lo de Map/Reduce sobre clusters lo propongo para la charla, no para el taller. Para este último usaríamos procesamiento in-core, es decir conjunto de datos que "quepan" en RAM de portátiles estándar.

No se cuánto tiempo están durando los talleres en PyMad ¿3 horas? y la idea es partir de un dataset y llegar a una predicción final, porque quedarse por el camino por falta de tiempo va a dejar a los participantes frustrados. Como habría mucho que hacer avanzaríamos por los temas a un ritmo preestablecido y para aquellos participantes que se retrasen en algún punto tendrían a disposición el material ya procesado para que puedan aprovechar el tema siguiente.
Además la gente tendría que disponer de esqueletos de scripts para que no perder el tiempo en todo el "boilerplate" y evitar el síndrome de la hoja en blanco.
Por último, hay algunas tareas en data analysis donde *no* se usa Python (en exploración principalmente, o al menos yo no lo uso); así que necesitaría algún consejo sobre qué hacer en este punto.
En definitiva, los que quieran ayudar y yo tendríamos que tener todo el análisis hecho de antemano. 

H. MF-S



El 21/06/2013, a las 12:12, Enrique Sánchez <je.sanchezb at gmail.com> escribió:

> Hola,
> 
> Yo ando ahora con cosas de NLTK y peleándome con estos temas de big data y data mining así que +1 a la charla y si necesitas ayuda puedo echarte una mano (dentro de mis capacidades :D)
> 
> Un saludo
> 
> Enrique Sánchez
> 
> Siempre se llega a alguna parte si se camina lo bastante. (Lewis Carroll)
> 
> 
> El 21 de junio de 2013 12:09, Juan Manuel Parrilla <padajuan at gmail.com> escribió:
> +1, muy interesante
> 
> 
> El 21 de junio de 2013 12:06, Carlos Eduardo León Franco <carlos.eduardo.leon.franco at gmail.com> escribió:
> 
> Muy, muy interesante.
> 
> ¿qué ayuda necesitas?
> 
> _____
> Carlos León
> G+: http://gplus.to/scyros
> Twitter: http://twitter.com/scyros
> 
> 
> El 21 de junio de 2013 12:04, Kiko <kikocorreoso at gmail.com> escribió:
> 
> +10^30
> 
> Te puedo ayudar a preparar/proponer cosas. Las cosas de big data no las uso pero todo lo demás sí que he hecho uso de algunas de ellas.
> 
> 
> El 21 de junio de 2013 11:47, Alejandro Guirao Rodríguez <lekumberri at gmail.com> escribió:
> 
> +1000000000
> 
> Me interesa muchísimo.
> 
> 
> 2013/6/21 Hernán Foffani <hfoffani at gmail.com>
> En mi empresa hacemos data analysis (big data y "small") y tengo un par de cosillas para presentar, Map Reduce específicamente. Pero no está pulido y no daría ni para 10 minutos. Lo que tengo ahora es solo una explicación del algoritmo y un clase helper para hacer tests locales. Para que tenga mas sustancia prefiero que la presentación incluya procesamiento sobre clusters, por ejemplo Hadoop sobre Amazon AWS usando la API para Python (no en Java). Lo que haya que pagar corre a mi cargo.
> 
> Para un taller propongo un caso completo de análisis predictivo: adquisición del dataset (hay mogollón de datos públicos), pulido de datos, exploración, elección de modelo (por ej. logistic regression, neural networks, random forest, etc), uso de la(s) biblioteca(s) de análisis, proceso de predicción, validación cruzada, estudio de error y resultado final.
> Mas divertido aún sería organizar una competencia entre equipos de un análisis predictivo.
> Naturalmente los talleres también serían en Python.
> 
> Para el taller necesitaría tiempo y ayuda extra durante el mismo y sobre todo en la organización previa. Los participantes tendrían que traer sus ordenadores con algunos paquetes de software ya instalado para no perder tiempo.
> 
> ¿Os interesa?
> 
> Saludos,
> Hernán.
> 
> El 14/06/2013, a las 16:54, J. Javier Maestro <jjmaestro at ieee.org> escribió:
> 
>> 2013/6/14 Kiko <kikocorreoso at gmail.com>
>> Después de dos años y medio de lista este es el primer caso en que nos quieren venir a contar una oferta. No creo que nos hayan inundado :-) 
>> 
>> Ojalá fuera así en el futuro y entonces ya volveríamos a hablar del 'problema'.
>> 
>> Para la próxima reunión, cuando Pablo pida charlas a ver si somos tan prolíficos como con este hilo :-P
>> 
>> +1! +1!  Yo estoy haciendo cosas con graphite y creo que en unos meses, cuando tenga las cosas más claras, podré dar una charla :)  Pablo, apunta!! :D
>> 
>> -- 
>> jotas
>> _______________________________________________
>> Madrid mailing list
>> Madrid at lists.es.python.org
>> https://lists.es.python.org/listinfo/madrid
> 
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid
> 
> 
> 
> -- 
> Alejandro Guirao Rodríguez
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid
> 
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid
> 
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid
> 
> 
> 
> -- 
> /JMP
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid
> 
> _______________________________________________
> Madrid mailing list
> Madrid at lists.es.python.org
> https://lists.es.python.org/listinfo/madrid

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.es.python.org/pipermail/madrid/attachments/20130621/c84d3fed/attachment-0001.html>


More information about the Madrid mailing list