Peña de mates a mí

Vaina Loca

New member
La movida es que tengo un dump de datos enorme, pero incompleto. He llegado a la conclusión de que puedo resolver casi todos los huecos cone cuaciones lineales de dos incógnitas.

Problema, tengo que resolver unas 60 y pico mil de ellas. Aún no me he metido mucho en el tema, le he preguntado a un tío del curro y me ha dicho que mire "métodos de resolución" y me he puesto 10 min en google y ya he visto peña con unos flamewars de la ostia.

Intento evitar la perspectiva de pasarme cuatro días enteros leyendo historias que seguro que me va a costar pillar.

Decidme, ¿me va a suponer esto un problema?
 

Hijitusolvidosupass

I WANT CHAFLA BACK
Las soluciones que se me ocurren dependen de qué magnitud de datos estemos hablando y de si es un trabajo para una vez o tendrías que repetir en el futuro.

Si lo que tienes una cantidad datos grandes, pero no prohibitiva (es decir, del orden de los 100k rows) y es un trabajo de "una vez" (es decir, no necesitas una solución general, si no algo que funcione ahora y ya), yo no me comería mucho la cabeza con este asunto:

Agarra python, la libreria numpy y ve file por fila llenando los huecos armando matrices para los sistemas de ecuaciones (http://blog.crespo.org.ve/2012/12/resolucion-de-sistemas-de-ecuaciones.html). Igual te tarda un rato, pero no importa, porque lo tienes que hacer solo una vez y ya. Incluso puedes partir la fuente de datos y correr el script en paralelo para cada partición y deberías acabar incluso más rápido.

Si el orden de magnitud es más grande (millones de filas) o si necesitas una solución más generalista, se te puede complicar y te diría que me des más detalles.
 

Vaina Loca

New member
Si, son algo menos de 100k. Miraré python, aunque me molaría usar excel e ya. He visto que hay algo con solver, y he visto que solver tiene funciones para celdas, pero no he mirado mucho más.

Es un tema que sólo tengo que resolver una vez, y no me aporta demasiado asi que no quiero darle demasiadas vueltas tampoco.

Las soluciones que se me ocurren dependen de qué magnitud de datos estemos hablando y de si es un trabajo para una vez o tendrías que repetir en el futuro.

Si lo que tienes una cantidad datos grandes, pero no prohibitiva (es decir, del orden de los 100k rows) y es un trabajo de "una vez" (es decir, no necesitas una solución general, si no algo que funcione ahora y ya), yo no me comería mucho la cabeza con este asunto:

Agarra python, la libreria numpy y ve file por fila llenando los huecos armando matrices para los sistemas de ecuaciones (http://blog.crespo.org.ve/2012/12/resolucion-de-sistemas-de-ecuaciones.html). Igual te tarda un rato, pero no importa, porque lo tienes que hacer solo una vez y ya. Incluso puedes partir la fuente de datos y correr el script en paralelo para cada partición y deberías acabar incluso más rápido.

Si el orden de magnitud es más grande (millones de filas) o si necesitas una solución más generalista, se te puede complicar y te diría que me des más detalles.
 

Hijitusolvidosupass

I WANT CHAFLA BACK
Si, son algo menos de 100k. Miraré python, aunque me molaría usar excel e ya. He visto que hay algo con solver, y he visto que solver tiene funciones para celdas, pero no he mirado mucho más.

Es un tema que sólo tengo que resolver una vez, y no me aporta demasiado asi que no quiero darle demasiadas vueltas tampoco.
De excel sé poco y nada, así que no te puedo ayudar. Pero el script en python te debería llevar menos veinte líneas. En cualquier caso, si controlas hojas de cálculo, seguro que sabes aplicar el concepto de matrices para resolver ecuaciones. Así que siempre podés mirarte el link y traducirlo a excel.
 

Vaina Loca

New member
Sí, pero nunca lo he hecho con 60k ecuaciones. No sé, miraré mañana, espero que no pete nada y me salga a la primera. Lo que me da pánico es pasarme muchas horas con eso.

De excel sé poco y nada, así que no te puedo ayudar. Pero el script en python te debería llevar menos veinte líneas. En cualquier caso, si controlas hojas de cálculo, seguro que sabes aplicar el concepto de matrices para resolver ecuaciones. Así que siempre podés mirarte el link y traducirlo a excel.
 
Arriba