Participar en proyectos de software libre

Participar en proyectos de software libre

  1. #31
    I WANT CHAFLA BACK
    Registrad@ el
    22/12/2014
    Localidad
    Waterloo, Canada
    Sexo
    Chico
    Edad
    29
    Mensajes
    1.237
    Agradecido
    1106 veces
    Temas
    8
    Gracias / Me gusta
    Vaina Loca escribió: Ver mensaje
    ???

    Pero entonces, qué hacen exáctamente? aprender a usar hadoop y demás?

    No sé, yo creo que para empezar lo primero sería python + sql. Pueden empezar instalando SQLite por ejemplo, aunque sea una aberración le enseñará SQL, y eso luego le da acceso a muchas BD's.

    Por cierto, qué opinas de este curso? https://learnpythonthehardway.org/book/ mucha gente lo recomienda, pero echándole un vistazo parece que usa python 2.7 aún, no sé, además el tío recomienda NO usar python 3. No entiendo muy bien por qué lo recomienda tanta gente.
    Pues sí, básicamente. No sé si ya lo habrán cambiado, pero en la UB minería de datos es optativa y no requiere haber tomado estadística. La gente sale de ahí sin haber aprendido nada más que instalar Hadoop y usar un poco de MapReduce. Es ridículo.

    Sí, por eso decía lo de enfocarse en el proyecto web. Con eso saca algo de soltar en SQL y python y le debería tomar al menos medio año completarlo.

    Ése curso se escribió hace como... Siete años más o menos xD. Cuando yo estaba en segundo de carrera. En ese entonces Python 3.0 no era usado por nadie y no tenía sentido aprenderlo si querías trabajar como profesional. Al margen de eso, es un buen curso, pero si no me falla la memoria no cubre SQL. Yo hoy en día lo que haría es seguirlo usando Python 3.6. Y le añadiría SQL. Hoy en día, no hay campo de la informática que no requiera soltura escribiendo en esa familia de lenguajes. Incluyendo bioinformática.

    EDITO: Je, estadística es obligatoria ahora: http://www.ub.edu/web/ub/es/estudis/...fitxa/I/G1077/. Menos mal. Yo no llegué a darla, pero mis viejos compañeros de carrera me comentaron salir de la clase de minerías de datos sin tener ni puta idea de cómo usar nada de eso. Más o menos lo entiendo porque es un área relativamente nueva, pero aún así... .
    Última edición hecha por Hijitusolvidosupass, 30/04/2017 a las 22:34.

  2. #32
    Mega Usuari@
    Registrad@ el
    14/04/2009
    Localidad
    JALISIA
    Sexo
    Chico
    Edad
    43
    Mensajes
    5.182
    Agradecido
    2710 veces
    Temas
    93
    Gracias / Me gusta
    Hijitusolvidosupass escribió: Ver mensaje
    Pues sí, básicamente. No sé si ya lo habrán cambiado, pero en la UB minería de datos es optativa y no requiere haber tomado estadística. La gente sale de ahí sin haber aprendido nada más que instalar Hadoop y usar un poco de MapReduce. Es ridículo.

    Sí, por eso decía lo de enfocarse en el proyecto web. Con eso saca algo de soltar en SQL y python y le debería tomar al menos medio año completarlo.

    Ése curso se escribió hace como... Siete años más o menos xD. Cuando yo estaba en segundo de carrera. En ese entonces Python 3.0 no era usado por nadie y no tenía sentido aprenderlo si querías trabajar como profesional. Al margen de eso, es un buen curso, pero si no me falla la memoria no cubre SQL. Yo hoy en día lo que haría es seguirlo usando Python 3.6. Y le añadiría SQL. Hoy en día, no hay campo de la informática que no requiera soltura escribiendo en esa familia de lenguajes. Incluyendo bioinformática.


    Ya entiendo. Pues no sé, estadística, desde un punto de vista teórico es complicada, a partir de métodos de análisis multivariante la cosa empieza a ponerse cuesta arriba, me acuerdo la primera vez que abrí un libro y leía frases como "calculado a través el cuadrado de las distancias del espacio euclídeo" y era como whaaaat? pero cómo calculo yo eso pisha? pèro bueno, todo se supera. Luego en la práctica, si te soy sincero, además de estadística descriptiva, clústering, regresiones y poco más se usa. Nunca en mi vida he visto un caso de uso realmente complicado, que fuese un reto real. También es cierto que nunca me he visto en un caso donde no pudiese resolver algo con una DB relacional al uso, asi que no sé. Me parece que hay mucho hype con el big data y la gente le quiere endosar spark hasta a un CRM.

    Todo el dolor que he sufrido siempre ha sido curando datos. Es la cosa más horrorosa y tediosa que hay, y es tranquilamente donde gastas más tiempo, y lo peor es que la mayoría de las veces es un trabajo de chinos que te tiene pegado a la pantalla escudriñando como un pringao horas y horas.

    Anyway, yo creo que lo mejor sería buscar algo estructurado (un curso vamos) con python + sql. A mí este me gusta mucho https://automatetheboringstuff.com/ pero que yo recuerde no tiene nada de SQL. A ver si encuentro algo con SQL y lo meto aquí.

    Si quieres buscar por tu cuenta, python 3, que incluya SQL (supongo que enseñarán con MySQL o SQLite), y preferiblemente que sea muy práctico, como el que puse anteriormente.

  3. #33
    I WANT CHAFLA BACK
    Registrad@ el
    22/12/2014
    Localidad
    Waterloo, Canada
    Sexo
    Chico
    Edad
    29
    Mensajes
    1.237
    Agradecido
    1106 veces
    Temas
    8
    Gracias / Me gusta
    Vaina Loca escribió: Ver mensaje
    Ya entiendo. Pues no sé, estadística, desde un punto de vista teórico es complicada, a partir de métodos de análisis multivariante la cosa empieza a ponerse cuesta arriba, me acuerdo la primera vez que abrí un libro y leía frases como "calculado a través el cuadrado de las distancias del espacio euclídeo" y era como whaaaat? pero cómo calculo yo eso pisha? pèro bueno, todo se supera. Luego en la práctica, si te soy sincero, además de estadística descriptiva, clústering, regresiones y poco más se usa. Nunca en mi vida he visto un caso de uso realmente complicado, que fuese un reto real. También es cierto que nunca me he visto en un caso donde no pudiese resolver algo con una DB relacional al uso, asi que no sé. Me parece que hay mucho hype con el big data y la gente le quiere endosar spark hasta a un CRM.
    Sí, pero por lo general la estadística que necesitas en tu día a día en ingeniería de datos no llega tanto. Lo cual justifica aún menos que haya habido tan poco formación al respecto. Quiero decir, mi jefe de equipo, un ingeniero de software GENIAL, no sabía cómo calcular un percentile hace un par de semanas. Eso debería ser obligatorio...

    Y lo big data es cierto y da para un libro entero. he visto casos de gente decir que mongodb es más rápido que postgresql en blogs. Si en un blog tienes diferencia de rendimiento entre mongodb y postgresql es que estás hciendo algo MUY mal. De nuevo, nosotros tenemos una base de datos con 1GB de información nueva al día y podemos hacer queries de meses en menos de un segundo simplemente usando la herramienta bien. Te entiendo tan bien eso... El 90% de los proyectos no necesitan ninguna técnica de big data.

    Lo cual no quita que en el caso de bioinformática sí necesites otras medidas. El ADN es muy grande y por lo general lo haces sobre montones de personas. El último proyecto en el que trabajé con eso incluía bases de datos con 10TB de información. Ahí usar Spark, Hadoop y toda la peña tiene mucho sentido.

    Vaina Loca escribió: Ver mensaje
    Todo el dolor que he sufrido siempre ha sido curando datos. Es la cosa más horrorosa y tediosa que hay, y es tranquilamente donde gastas más tiempo, y lo peor es que la mayoría de las veces es un trabajo de chinos que te tiene pegado a la pantalla escudriñando como un pringao horas y horas.
    Ya xD. Es la peor parte de minería de datos. Y la menos elegante.

    Vaina Loca escribió: Ver mensaje
    Anyway, yo creo que lo mejor sería buscar algo estructurado (un curso vamos) con python + sql. A mí este me gusta mucho https://automatetheboringstuff.com/ pero que yo recuerde no tiene nada de SQL. A ver si encuentro algo con SQL y lo meto aquí.

    Si quieres buscar por tu cuenta, python 3, que incluya SQL (supongo que enseñarán con MySQL o SQLite), y preferiblemente que sea muy práctico, como el que puse anteriormente.
    Arf... El problema es que ella ya está haciendo un curso. Quiero decir, lo único que no verá en primero de carrera del curso "Python the hard way" será test automáticos y flask. Todo lo demás, lo dará en la uni. Del libro "Automate the boring stuff", necesitará los últimos ocho capítulos. Todo lo demás, lo ves en la carrera. Normalmente lo que la carrera falla es en hacer proyectos que no sean pruebas de concepto. Es decir, aparte de lo que dará en primer año, necesitará: SQL, alguna framework web (Flask, Django, la que sea), tests automáticos, git e integración continua. Y todo eso lo puede aprender simplemente leyendo material relacionado con el tema. Es decir, si sabes programar, te basta con leer los ejemplos de Flask para saber como hacer un servicio web. O un poco sobre docstring para saber cómo hacer tests automáticos. No necesitas necesariamente un curso.

    Si lo encuentras, mejor! Free Code Camp es un ejemplo de un excelente curso que cubre todo eso. Pero la mayoría no lo hace, la mayoría simplemente te enseña lo básico de programación y una, a lo sumo dos, de las otras cinco cosas. Pa eso es lo mismo simplemente meterte con un proyecto que te interese y aprender las tecnologías tangensiales mientras lo creas.

    En resumen: Para mí, si estudias informática, lo importante es cubrir lo que no dan en la carrera. Es decir, proyectos que no sean pruebas de concepto y que sirvan un propósito "real." Si lo haces con un curso mejor, tienes información guiada. Pero en mi experiencia la mayoría de los cursos no siguen esos métodos. Si no encuentras uno, entonces casi mejor hacer el proyecto por tu cuenta que estar siempre dando vueltas en los mismos conceptos. Todo esto, desde mi experiencia luego de hacer 30 cursos que básicamente enseñaban lo mismo más dos o tres cosas aisladas.

  4. Me gusta ........ le ha gustado este mensaje
  5. #34
    Mega Usuari@
    Registrad@ el
    14/04/2009
    Localidad
    JALISIA
    Sexo
    Chico
    Edad
    43
    Mensajes
    5.182
    Agradecido
    2710 veces
    Temas
    93
    Gracias / Me gusta
    Hijitusolvidosupass escribió: Ver mensaje
    Sí, pero por lo general la estadística que necesitas en tu día a día en ingeniería de datos no llega tanto. Lo cual justifica aún menos que haya habido tan poco formación al respecto. Quiero decir, mi jefe de equipo, un ingeniero de software GENIAL, no sabía cómo calcular un percentile hace un par de semanas. Eso debería ser obligatorio...
    Bueno, pero siempre hay alguna librería para hacer eso no? De todas formas XD http://www.vitutor.com/estadistica/d...tiva/a_13.html no tiene más misterio.

    Yo hay muchísimas cosas que he olvidado cómo se hacen. Si entiendes del tema de forma conceptual, es mirarlo y ya está. Estadística descriptiva no es ningún problema, quizá para alguien que no trabaje con estas movidas estadística inferencial, rollo pruebas de hipótesis y tal se le haga raro, pero vamos.

    Y lo big data es cierto y da para un libro entero. he visto casos de gente decir que mongodb es más rápido que postgresql en blogs. Si en un blog tienes diferencia de rendimiento entre mongodb y postgresql es que estás hciendo algo MUY mal. De nuevo, nosotros tenemos una base de datos con 1GB de información nueva al día y podemos hacer queries de meses en menos de un segundo simplemente usando la herramienta bien. Te entiendo tan bien eso... El 90% de los proyectos no necesitan ninguna técnica de big data.

    Lo cual no quita que en el caso de bioinformática sí necesites otras medidas. El ADN es muy grande y por lo general lo haces sobre montones de personas. El último proyecto en el que trabajé con eso incluía bases de datos con 10TB de información. Ahí usar Spark, Hadoop y toda la peña tiene mucho sentido.
    Supongo que para eso molará, yo es que realmente además de movidas CRUD y análisis realmente nunca he visto nada raro. De hecho si una empresa tiene data wharehouse normalmente ya es indicativo de que tienen o han tenido alguien con dos dedos de frente. Normalmente las empreas guardan los datos en Excels, y da putas gracias porque los he visto en PPTs y doc también (en serio, archivos de word con miles de tablas dentro, xD, nos estuvimos riendo una semana, hasta que tratamos de extraerlos xd).

    Siempre que alguien me menciona algo relacionado con big data me sonrío, porque te lo suelta un tipo que tiene 10000 clientes. Pero bueno, nosotros siempre vendemos lo que hacemos como la repolla en vinagre, y la gente queda más contenta que dios. Básicamente el 99,9% de las veces es rediseñar los procesos, ver cómo se va a organizar el CRUD de turno, hacer algo tipo de dashboard/reporting y ya está. Es un trabajo tedioso a veces, pero de verdad tiene cero ciencia. Bueno, y cuando les enseñas cómo sacar datos de una DB a Excel ya la gente se mea directamente. Les parece puta magia.

    Si es que en realidad la gente no necesita tanto. Para ser productivos necesitan que la peña se saque los datos y haga sus informes sin dolor, y con eso ya está prácticamente todo. A veces hasta tienen las herramientas ya, pero no saben usarlas.

    Arf... El problema es que ella ya está haciendo un curso. Quiero decir, lo único que no verá en primero de carrera del curso "Python the hard way" será test automáticos y flask. Todo lo demás, lo dará en la uni. Del libro "Automate the boring stuff", necesitará los últimos ocho capítulos. Todo lo demás, lo ves en la carrera. Normalmente lo que la carrera falla es en hacer proyectos que no sean pruebas de concepto. Es decir, aparte de lo que dará en primer año, necesitará: SQL, alguna framework web (Flask, Django, la que sea), tests automáticos, git e integración continua. Y todo eso lo puede aprender simplemente leyendo material relacionado con el tema. Es decir, si sabes programar, te basta con leer los ejemplos de Flask para saber como hacer un servicio web. O un poco sobre docstring para saber cómo hacer tests automáticos. No necesitas necesariamente un curso.

    Si lo encuentras, mejor! Free Code Camp es un ejemplo de un excelente curso que cubre todo eso. Pero la mayoría no lo hace, la mayoría simplemente te enseña lo básico de programación y una, a lo sumo dos, de las otras cinco cosas. Pa eso es lo mismo simplemente meterte con un proyecto que te interese y aprender las tecnologías tangensiales mientras lo creas.

    En resumen: Para mí, si estudias informática, lo importante es cubrir lo que no dan en la carrera. Es decir, proyectos que no sean pruebas de concepto y que sirvan un propósito "real." Si lo haces con un curso mejor, tienes información guiada. Pero en mi experiencia la mayoría de los cursos no siguen esos métodos. Si no encuentras uno, entonces casi mejor hacer el proyecto por tu cuenta que estar siempre dando vueltas en los mismos conceptos. Todo esto, desde mi experiencia luego de hacer 30 cursos que básicamente enseñaban lo mismo más dos o tres cosas aisladas.
    Ayer estuve buscando un ratillo, pero la verdad no he encontrado nada, qué raro la verdad.

Permisos de tu Usuario

  • No puedes crear nuevos temas
  • No puedes publicar respuestas
  • No puedes adjuntar archivos
  • No puedes editar tus mensajes
  •  
  • El código BB está activado
  • Los emoticonos están activados
  • La etiqueta [IMG] está activado
  • La etiqueta [VIDEO] está activado
  • El código HTML está desactivado

Temas similares

  1. El crecimiento del Software Libre
    Por opositivo en Acción Social
    Respuestas: 10
    Último mensaje: 09/06/2010, 13:12
  2. Los partidos políticos vascos y el Software Libre
    Por opositivo en elKonsultorio de Informática
    Respuestas: 1
    Último mensaje: 02/03/2009, 12:47
  3. Programa edicion de video, software libre
    Por Die Mapa Schön en elKonsultorio de Informática
    Respuestas: 4
    Último mensaje: 04/07/2008, 1:13
  4. El software libre es bueno para el medio ambiente
    Por [G]AMMA en elKonsultorio de Informática
    Respuestas: 2
    Último mensaje: 06/04/2007, 18:32
  5. El software libre no es de pobres, sino de inteligentes
    Por [G]AMMA en elKonsultorio de Informática
    Respuestas: 1
    Último mensaje: 08/02/2007, 20:11
Feedback Buttons provided by Advanced Post Thanks / Like (Pro) - vBulletin Mods & Addons Copyright © 2020 DragonByte Technologies Ltd.