¿Como bajarse la lista de Tascón por Internet? (VI)
Finalmente, algunas estadísticas de interés sobre la base de datos. Ya anteriormente les mostraba como extraer la información de la base de datos.
Algunos hechos interesantes:
Sin embargo no todos los datos tenían sentido; Buscando sin mucho esfuerzo me encontré con las siguientes cosas:
Quizas en el futuro juegue un poco más con la base de datos, dado la gran cantidad de información que tiene; En particular me gustaría correlacionar los datos de estas tablas con otras bases de datos con indicadores economicos, educación, etc. Independientemente de sus otras implicaciones, es una forma diferente de ver al país.
Bueno, de nuevo a la realidad. Los dejo con una hoja de cálculo en formato OpenOffice Calc para que se diviertan ustedes (no tiene ninguna información que permita identificar a particulares, sólo algunos datos agregados). Sólo tiene un par de reportes agregados, pero creo que les va a interesar.
Buscar en Technorati: Santaines
Algunos hechos interesantes:
- Número de abstencionistas: 3534950 (%28)
- Número de firmas invalidas: 2182735 (%17)
- Número de personas fallecidas hasta el 2004, inscritas en el rep: 93327 (%0.008)
- Total de registrados en la base de datos: 12394109
| si | no | votantes | estado |
|---|---|---|---|
| 11050 | 40444 | 51494 | AMAZONAS |
| 37645 | 149056 | 186701 | VARGAS |
| 1350 | 29359 | 30709 | EMBAJADA |
| 9381 | 62989 | 72370 | AMACURO |
| 67176 | 151369 | 218545 | NVA ESPARTA |
| 30516 | 114158 | 144674 | COJEDES |
| 43637 | 149131 | 192768 | APURE |
| 65726 | 269388 | 335114 | GUARICO |
| 106757 | 261892 | 368649 | MONAGAS |
| 81782 | 193493 | 275275 | YARACUY |
| 60039 | 244794 | 304833 | BARINAS |
| 164189 | 612507 | 776696 | ARAGUA |
| 276913 | 675659 | 952572 | CARABOBO |
| 115252 | 278791 | 394043 | MERIDA |
| 169264 | 455771 | 625035 | ANZOATEGUI |
| 78192 | 266939 | 345131 | TRUJILLO |
| 114022 | 450697 | 564719 | BOLIVAR |
| 120361 | 326659 | 447020 | FALCON |
| 75795 | 367456 | 443251 | SUCRE |
| 148485 | 390308 | 538793 | TACHIRA |
| 67141 | 302897 | 370038 | PORTUGUESA |
| 183048 | 589172 | 772220 | LARA |
| 318829 | 948558 | 1267387 | DTTO. CAPITAL |
| 419515 | 884331 | 1303846 | MIRANDA |
| 440112 | 972114 | 1412226 | ZULIA |
- La persona más vieja en el registro nació en 1828-09-21, ¿178 años?
- La persona más joven en el registro nació en 1990-11-21, ¿16 años?
- Fallecidos y con firma valida en la base de datos rep: 6397 (¿estos votaron?)
- Fallecidos y abstencionistas en la base de datos rep: 52123 (¿Murieron tantos en ese periodo?)
- Número de votantes sin una dirección (sin contar direcciones basura): 2131170 (¿porqúe tantos?)
Quizas en el futuro juegue un poco más con la base de datos, dado la gran cantidad de información que tiene; En particular me gustaría correlacionar los datos de estas tablas con otras bases de datos con indicadores economicos, educación, etc. Independientemente de sus otras implicaciones, es una forma diferente de ver al país.
Bueno, de nuevo a la realidad. Los dejo con una hoja de cálculo en formato OpenOffice Calc para que se diviertan ustedes (no tiene ninguna información que permita identificar a particulares, sólo algunos datos agregados). Sólo tiene un par de reportes agregados, pero creo que les va a interesar.
Buscar en Technorati: Santaines



2 Comentarios:
impresionante...
muy buena iniciativa, felicitaciones.
Si te digo que estoy estudiando Perl como primer lenguaje de programacion, no te extrañes. Tu lo inspirastes.
Otra cosa interesante que puedes hacer es sacar el numero de personas que aparecen como que firmaron para el revocatorio presidencial (tanto las validas como las demas) para verificar que el numero coincida con las cifras emitidas por el CNE para el firmazo. Es una forma de verificar el origen de la data, ademas de otras cosas... Tambien pudieses sacar el numero de los que firmaron contra los diputados opositores. Yo baje la base de datos e hice unas busquedas de prueba con cedulas de conocidos y algunas de personajes publicos con resultados interesantes. La lista me parece veridica, y los defectos de data parecen comparables a lo que debe esperarse de la base de datos del REP original.
Enlaces a este articulo:
Crear un vínculo
<< Regresar