Resumen de la clase
Modelizar significa organizar los datos, agrupándolos según unos criterios determinados, mediante tablas.
Organización de datos
¿Qué es modelizar los datos?
Modelizar significa organizar los datos, agrupándolos según unos criterios determinados, mediante tablas.
Cada grupo de datos (tabla) contiene uno o varios campos que tienen alguna
relación con algún/os campo/s de otras tablas.
La dificultad y el
"arte" de modelizar estriba en decidir qué datos pueden y deben estar
agrupados en una misma tabla y, posteriormente, decidir cómo se van a
relacionar estas tablas.
Una base de datos es una colección de información
organizada de forma que un programa de ordenador pueda seleccionar rápidamente
los fragmentos de datos que necesite. Una base de datos es un sistema de
archivos electrónico.
Los datos se organizan por campos (columnas), registros
(filas) y archivos. Un campo es una pieza única de información;
un registro es un sistema completo de campos; y un archivo es
una colección de registros. Por ejemplo, una guía de teléfono es análoga a un
archivo. Contiene una lista de registros, cada uno de los cuales consiste en
tres campos: nombre, dirección, y número de teléfono.
A veces se utiliza DB, de database en inglés, para
referirse a las bases de datos. Durante el desarrollo de la materia Informática
nos referiremos con BDE, por base de datos Excel.
El proceso de organización de una base de datos Excel (BDE) consiste en aplicar una serie de reglas para:
- Evitar la redundancia de datos
- Proteger la integridad de los datos (Se refiere la correctitud y completitud de la información en una base de datos. Cuando los contenidos se modifican, la integridad de los datos almacenados puede perderse de muchas maneras diferentes).
- Evitar problemas de actualización de los datos en las tablas
Primer nivel: pasos.
- Eliminar los grupos repetitivos de la tablas individuales.
- Crear una tabla separada por cada grupo de datos relacionados.
- Identificar cada grupo de datos relacionados con una clave primaria
- Crear tablas separadas para aquellos grupos de datos que se aplican a varios registros.
- Relacionar estas tablas mediante una clave externa.
- Eliminar aquellos campos que no dependan de la clave.
- Ninguna columna puede depender de una columna que no tenga una clave.
- No puede contener datos derivados transcriptos. Estos deben ser producto de un cálculo o una decisión.
Ejemplos
En este contexto, una clave foránea o clave ajena es una limitación referencial entre dos tablas.
La clave foránea identifica una columna o grupo de columnas en una tabla (tabla hija o referendo) que se refiere a una columna o grupo de columnas en otra tabla (tabla maestra o referenciada).
Las columnas en la tabla referendo deben ser la clave primaria en la tabla referenciada.
Una clave foránea es una clave que se usa en una tabla secundaria y que coincide con la clave primaria en una tabla primaria relacionada. Las claves foráneas pueden tener valores duplicados (multiplicidad) en la tabla asociada, mientras que para las claves primarias eso no es posible.
¿Cómo elegir los identificadores o claves de registro?
Una clave principal es un campo o un conjunto de campos con valores
únicos en una tabla.
Los valores de la clave pueden usarse para hacer referencia a registros
completos, porque cada registro tiene un valor diferente para la clave.
Cada tabla solo puede tener una clave principal.
1. Clave principal
2. Clave externa /foránea
Una clave principal correcta debe tener varias características:
- Identifica inequívocamente cada fila / registro.
- Nunca debe estar vacía ni ser nula (siempre debe contener un valor).
- Los valores que contiene no suelen cambiar (lo ideal es que no cambien).
- Si no se halla una clave correcta, se suele autonumerar para generar un único valor de identificación para cada registro.
Ejemplos de claves incorrectas
Cualquier campo al que le falten una o más de las características
necesarias para que se le considere una clave correcta, representa una elección
poco adecuada de clave principal.
A continuación algunos ejemplos de campos que son claves
principales incorrectas para una tabla llamada Contactos, así como los motivos por los
que se consideran incorrectas.
Clave principal incorrecta
|
Motivo
|
Nombre
|
Puede no ser único y estar sujeto a cambios.
|
Número de teléfono
|
Tiene probabilidades de cambiar.
|
Dirección de correo electrónico
|
Tiene probabilidades de cambiar.
|
Código postal
|
Puede que más
de una persona tenga el mismo código postal.
|
Combinaciones de palabras y números
|
La parte de palabras está sujeta a cambios y, como tal, puede suponer
una carga en las tareas de mantenimiento. Podría prestar a confusión si la
parte de palabras se repite como un campo independiente. Por ejemplo,
combinar la ciudad y un número incrementado (por ejemplo, NEWYORK0579) sería
una opción incorrecta si la ciudad también se almacena como un campo.
|
Número CUIT
|
Es información privada y puede no estar permitida en departamentos
gubernamentales y algunas organizaciones.
Algunas personas carecen de número de CUIT
Una persona puede tener más de uno a lo largo de su vida.
|
¿Cómo se modelizan los datos en Excel?
Para modelizar y montar una estructura de datos adecuada, es necesario
organizar los datos agrupándolos, según unos criterios determinados, mediante
tablas de dos tipos:
1) Tablas de hechos
En estas tablas deben ir los datos que representen los hechos
principales a medir y a vigilar mediante indicadores. Suelen ser los datos
que se multiplican en mayor cantidad a medida que pasa el tiempo.
Los datos de las tablas de hechos suelen expresar: ¿cúando ha ocurrido
un hecho? y ¿qué valor tiene el hecho?
Supongamos un ejemplo de aplicación para el control de nóminas (sueldos), el hecho principal es que cada mes se generan una serie de nóminas en la empresa.
Supongamos un ejemplo de aplicación para el control de nóminas (sueldos), el hecho principal es que cada mes se generan una serie de nóminas en la empresa.
Es una tabla que multiplicará sus registros muy rápidamente y cada
registro (cada hecho) es una nómina – sueldo que está asociada a una fecha de generación
(el último día de cada mes).
Nóminas | |||||
Identificador de Movimiento | Fecha de liquidación | Devengos (salario base, antigüedad, etc.) |
Horas extras | Comisiones por productividad | Deducción de la Seguridad Social que va a cargo del trabajador |
1 | 31/01/2019 | $ 35.000 | $ 3.000 | $ 450 | |
2 | 31/01/2019 | $ 35.000 | $ 2.000 | $ 390 | |
3 | 31/01/2019 | $ 42.000 | $ 1.000 | $ 500 | |
4 | 31/02/2019 | $ 47.000 | $ 1.500 | $ 2.000 | $ 900 |
5 | 31/01/2019 | $ 35.000 | $ 2.000 | $ 450 | |
6 | 31/02/2019 | $ 37.000 | $ 6.000 | $ 450 | |
7 | 31/01/2019 | $ 48.000 | $ 2.000 | $ 450 | |
8 | 28/02/2019 | $ 55.000 | $ 700 |
Podemos observar que, los datos que de momento se han
incluido en la tabla de hechos son los que cumplen las siguientes condiciones:
- Todos los meses varían. Es decir, la fecha, el importe devengado, etc... siempre varían en cada nómina.
- Las cantidades (devengos, horas, comisiones, etc.) y la fecha de cada nómina son los datos protagonistas a cuantificar.
Fecha Nómina: La fecha de devengo de la nómina. Normalmente el último día del
mes.
Devengos: Suma de las cantidades principales que componen la nómina
(salario base, antigüedad, etc.)
Horas: Horas extras a incluir en la nómina.
Incentivos: Comisiones y similares por productividad o ventas.
S.Social: Deducción de la Seguridad Social que va a cargo del trabajador
Las cantidades (devengos, horas, comisiones, etc. ) y la fecha de cada nómina son lo que queremos cuantificar y son los datos protagonistas.
Horas: Horas extras a incluir en la nómina.
Incentivos: Comisiones y similares por productividad o ventas.
S.Social: Deducción de la Seguridad Social que va a cargo del trabajador
Las cantidades (devengos, horas, comisiones, etc. ) y la fecha de cada nómina son lo que queremos cuantificar y son los datos protagonistas.
2) Tablas de dimensión (dimensión tables)
Cada una de las tablas de
dimensión debe contener los valores que definen a los hechos.
Las tablas de dimensión suelen decir ¿qué tipo de hecho ha ocurrido? ¿quién hay detrás del hecho?
Las tablas de dimensión suelen decir ¿qué tipo de hecho ha ocurrido? ¿quién hay detrás del hecho?
Este tipo de tablas necesitan
que uno de los campos sea una clave primaria o primary key para
que cada registro quede identificado inequívocamente.
Esto significa que en ese
campo NO PUEDE HABER DUPLICADOS.
Las claves primarias suelen ser
números enteros, pero en Microsoft
Excel y dado que no es una aplicación diseñada como base de datos relacional,
debemos flexibilizar algunas normas y esta es una de ellas: si en una
tabla de dimensión hay un campo que contiene datos para los que no va a haber
duplicados, lo aprovecharemos como clave primaria, pero si no lo hay,
agregaremos uno "ad hoc" cuyo contenido sea preferentemente
significativo, no demasiado largo y por supuesto, sin duplicados.
Información del cliente | ||||||
IdClienteTitular | Apellido | Nombre | IdLocalidad | CA | Saldo | Fecha |
17724298 | Pérez | José | 2252 | 456 | $ 4.500 | 25/04/2019 |
28456665 | Arri | Jaqquelina | 2252 | 566 | $ 500 | 25/04/2019 |
34599000 | Estévez | Luciano | 2246 | 422 | $ 700 | 25/04/2019 |
19345666 | Prietto | Lúcas | 2252 | 675 | $ 800 | 25/04/2019 |
27898392 | Juarez | Lorena | 2242 | 672 | $ 9.880 | 25/04/2019 |
Las claves que se agregan en la tabla de hechos se llaman claves externas o foreign keys y sí pueden tener duplicados:
A este tipo de relación de la llama "relación de uno a
varios"
Por lo tanto, cada tabla de dimensión necesita tener
relacionado su campo de clave primaria con un campo de clave externa que debe
haber a tal efecto en la tabla de hechos.
Descargar diapositivas con instrucciones para demostración
Este comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminarEste comentario ha sido eliminado por un administrador del blog.
ResponderEliminar