Ir al contenido principal

Clase IV- 25042019 - Introducción


Resumen de la clase


¿Qué es modelizar los datos?

Modelizar significa organizar los datos, agrupándolos según unos criterios determinados, mediante tablas. 

Cada grupo de datos (tabla) contiene uno o varios campos que tienen alguna relación con algún/os campo/s de otras tablas.

La dificultad y el "arte" de modelizar estriba en decidir qué datos pueden y deben estar agrupados en una misma tabla y, posteriormente, decidir cómo se van a relacionar estas tablas. 

Organización de datos

Una base de datos es una colección de información organizada de forma que un programa de ordenador pueda seleccionar rápidamente los fragmentos de datos que necesite. Una base de datos es un sistema de archivos electrónico.

Los datos se organizan por campos (columnas), registros (filas) y archivos. Un campo es una pieza única de información; un registro es un sistema completo de campos; y un archivo es una colección de registros. Por ejemplo, una guía de teléfono es análoga a un archivo. Contiene una lista de registros, cada uno de los cuales consiste en tres campos: nombre, dirección, y número de teléfono.

A veces se utiliza DB, de database en inglés, para referirse a las bases de datos. Durante el desarrollo de la materia Informática nos referiremos con BDE, por base de datos Excel.

El proceso de organización de una base de datos Excel  (BDE) consiste en aplicar una serie de reglas para:

  • Evitar la redundancia de datos
  • Proteger la integridad de los datos (Se refiere la correctitud y completitud de la información en una base de datos. Cuando los contenidos se modifican, la integridad de los datos almacenados puede perderse de muchas maneras diferentes).
  • Evitar problemas de actualización de los datos en las tablas
Para poder decir que los datos de una tabla están organizados deben respetarse 3 niveles de proceso:

Primer nivel: pasos.
  • Eliminar los grupos repetitivos de la tablas individuales.
  • Crear una tabla separada por cada grupo de datos relacionados.
  • Identificar cada grupo de datos relacionados con una clave primaria
Segundo nivel: pasos. 
  • Crear tablas separadas para aquellos grupos de datos que se aplican a varios registros.
  • Relacionar estas tablas mediante una clave externa.
Tercer nivel: pasos.

  • Eliminar aquellos campos que no dependan de la clave.
  • Ninguna columna puede depender de una columna que no tenga una clave.
  • No puede contener datos derivados transcriptos. Estos deben ser producto de un cálculo o una decisión.
En el diseño de BDE, se llama clave principal  o primaria a un campo o a una combinación de campos que identifica de forma única a cada fila de una tabla. Una clave primaria comprende de esta manera una columna o conjunto de columnas. No puede haber dos filas en una tabla que tengan la misma clave primaria.

Ejemplos

En este contexto, una clave foránea o clave ajena  es una limitación referencial entre dos tablas.

La clave foránea identifica una columna o grupo de columnas en una tabla (tabla hija o referendo) que se refiere a una columna o grupo de columnas en otra tabla (tabla maestra o referenciada). 



Las columnas en la tabla referendo deben ser la clave primaria en la tabla referenciada.

Una clave foránea es una clave que se usa en una tabla secundaria y que coincide con la clave primaria en una tabla primaria relacionada. Las claves foráneas pueden tener valores duplicados (multiplicidad) en la tabla asociada, mientras que para las claves primarias eso no es posible. 


¿Cómo elegir los identificadores o claves de registro?


Una clave principal es un campo o un conjunto de campos con valores únicos en una tabla.

Los valores de la clave pueden usarse para hacer referencia a registros completos, porque cada registro tiene un valor diferente para la clave.

Cada tabla solo puede tener una clave principal. 


1. Clave principal
2. Clave externa /foránea


Una clave principal correcta debe tener varias características:

  • Identifica inequívocamente cada fila / registro.
  • Nunca debe estar vacía ni ser nula  (siempre debe contener un valor).
  • Los valores que contiene no suelen cambiar (lo ideal es que no cambien).
  • Si no se halla una clave correcta, se suele autonumerar para generar un único valor de identificación para cada registro.

Ejemplos de claves incorrectas

Cualquier campo al que le falten una o más de las características necesarias para que se le considere una clave correcta, representa una elección poco adecuada de clave principal.

A continuación  algunos ejemplos de campos que son claves principales incorrectas para una tabla llamada Contactos, así como los motivos por los que se consideran incorrectas.

Clave principal incorrecta
Motivo
Nombre
Puede no ser único y estar sujeto a cambios.
Número de teléfono
Tiene probabilidades de cambiar.
Dirección de correo electrónico
Tiene probabilidades de cambiar.
Código postal
Puede que más de una persona tenga el mismo código postal.
Combinaciones de palabras y números
La parte de palabras está sujeta a cambios y, como tal, puede suponer una carga en las tareas de mantenimiento. Podría prestar a confusión si la parte de palabras se repite como un campo independiente. Por ejemplo, combinar la ciudad y un número incrementado (por ejemplo, NEWYORK0579) sería una opción incorrecta si la ciudad también se almacena como un campo.
Número CUIT
Es información privada y puede no estar permitida en departamentos gubernamentales y algunas organizaciones.
Algunas personas carecen de número de CUIT
Una persona puede tener más de uno a lo largo de su vida.


¿Cómo se modelizan los datos en Excel?


Para modelizar y montar una estructura de datos adecuada, es necesario organizar los datos agrupándolos, según unos criterios determinados, mediante tablas de dos tipos:

1) Tablas de hechos

En estas tablas deben ir los datos que representen los hechos principales a medir y a vigilar mediante indicadores. Suelen ser los datos que se multiplican en mayor cantidad a medida que pasa el tiempo.

Los datos de las tablas de hechos suelen expresar: ¿cúando ha ocurrido un hecho? y ¿qué valor tiene el hecho?

Supongamos un ejemplo de aplicación para el control de nóminas (sueldos), el hecho principal es que cada mes se generan una serie de nóminas en la empresa.

Es una tabla que multiplicará sus registros muy rápidamente y cada registro (cada hecho) es una nómina – sueldo  que está asociada a una fecha de generación (el último día de cada mes).

Nóminas
Identificador  de Movimiento Fecha de liquidación  Devengos
(salario base, antigüedad, etc.)
Horas extras Comisiones por productividad Deducción de la Seguridad Social que va a cargo del trabajador
1 31/01/2019  $                                35.000  $   3.000  $                         450
2 31/01/2019  $                                35.000  $              2.000  $                         390
3 31/01/2019  $                                42.000  $   1.000  $                         500
4 31/02/2019  $                                47.000  $   1.500  $              2.000  $                         900
5 31/01/2019  $                                35.000  $              2.000  $                         450
6 31/02/2019  $                                37.000  $   6.000  $                         450
7 31/01/2019  $                                48.000  $   2.000  $                         450
8 28/02/2019  $                                55.000  $                         700

Podemos observar que, los datos que de momento se han incluido en la tabla de hechos son los que cumplen las siguientes condiciones:
  • Todos los meses varían. Es decir, la fecha, el importe devengado, etc... siempre varían en cada nómina. 
  • Las cantidades (devengos, horas, comisiones, etc.) y la fecha de cada nómina son los datos protagonistas a cuantificar.

Fecha Nómina: La fecha de devengo de la nómina. Normalmente el último día del mes.
Devengos: Suma de las cantidades principales que componen la nómina (salario base, antigüedad, etc.)
Horas: Horas extras a incluir en la nómina.
Incentivos: Comisiones y similares por productividad o ventas.
S.Social: Deducción de la Seguridad Social que va a cargo del trabajador


Las cantidades (devengos, horas, comisiones, etc. ) y la fecha de cada nómina son lo que queremos cuantificar y son los datos protagonistas.


2) Tablas de dimensión (dimensión tables)

Cada una de las tablas de dimensión debe contener los valores que definen a los hechos.

Las tablas de dimensión suelen decir ¿qué tipo de hecho ha ocurrido? ¿quién hay detrás del hecho?

Este tipo de tablas necesitan que uno de los campos sea una clave primaria o primary key para que cada registro quede identificado inequívocamente.

Esto significa que en ese campo NO PUEDE HABER DUPLICADOS.

Las claves primarias suelen ser números enteros,  pero en Microsoft Excel y dado que no es una aplicación diseñada como base de datos relacional, debemos flexibilizar algunas normas y esta es una de ellas: si en una tabla de dimensión hay un campo que contiene datos para los que no va a haber duplicados, lo aprovecharemos como clave primaria, pero si no lo hay, agregaremos uno "ad hoc" cuyo contenido sea preferentemente significativo, no demasiado largo y por supuesto, sin duplicados.

Por ejemplo:
Información del cliente
IdClienteTitular Apellido Nombre  IdLocalidad CA Saldo Fecha
17724298 Pérez  José 2252 456  $          4.500 25/04/2019
28456665 Arri Jaqquelina 2252 566  $             500 25/04/2019
34599000 Estévez Luciano 2246 422  $             700 25/04/2019
19345666 Prietto Lúcas 2252 675  $             800 25/04/2019
27898392 Juarez Lorena 2242 672  $          9.880 25/04/2019
Para que cada registro de una tabla de hechos quede indentificado por una dimensión, es necesario agregar a tal efecto un campo en dicha tabla (la de hechos) que adopte uno de los valores de la clave primaria que tiene la tabla de dimensión, de forma que exista una especie de "cordón umbilical" entre ambas tablas. 

Las claves que se agregan en la tabla de hechos se llaman claves externas o foreign keys y sí pueden tener duplicados:



A este tipo de relación de la llama "relación de uno a varios"

Por lo tanto, cada tabla de dimensión necesita tener relacionado su campo de clave primaria con un campo de clave externa que debe haber a tal efecto en la tabla de hechos.



Descargar diapositivas con instrucciones para demostración


Comentarios

  1. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  2. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  3. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  4. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  5. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  6. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  7. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  8. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  9. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  10. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  11. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  12. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  13. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  14. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  15. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  16. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  17. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  18. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  19. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  20. Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar

Publicar un comentario

Entradas populares de este blog

Clase XXVII- 25102019 - Funciones y fórmulas Excel - TP Plan Maestro de Producción

Pasos para desarrollar el TP PMP en Excel 1. Crear en hojas separadas tablas de datos para las estructuras "Viajantes" y "Productos" según: 2. Calcular el stock para cada producto en la tabla de Productos: 3. Crear en una nueva hoja, la tabla Pedidos según: 3.a.  Determina qué datos deben ser cargados por el operador, cuáles calculados por el sistema y cuáles tomados de las tablas creadas anteriormente. 3.b.  Utiliza los recursos que Excel ofrece para realizar validaciones en las capturas de los datos de cada registro. 3.c. Ofrece retroalimentación al usuario en caso de error. 3.d. Realiza pruebas con datos de  prueba para depurar los mecanismos implementados en la tabla. Se sugiere usar la sgte. estrategia: 4. Ordenar los datos por fecha de pedido.     Agruparlos en 8 períodos / semanas y determinar la cantidad pedida para cada período según: 5. Realizar pruebas de control comprobando la exac...

Clase XXII - 26092019 - Aplicación lineamientos de diseño TP - Punto de equilibrio

Aplicación lineamientos de diseño TP - Punto de equilibrio en Excel Temas abordados en clase Menú Revisar  - Ficha Revisión Menú Diseño de página - Ficha Configuración de página Menú Inicio  - Ficha Fuentes Menú Inicio  - Ficha Párrafo Menú Inicio  - Ficha Estilos Menú Referencias  - Ficha Notas al pie Menú Insertar  - Ficha Encabezado y pie de página Menú Inicio  - Ficha Ilustraciones Menú Herramientas de imagen - Submenú Formato - Ficha Organizar - Botón Posición Menú Inicio  - Ficha Vínculos - Botón Hipervínculos Menú Referencias  - Ficha Tabla de contenido Menú Insertar  - Ficha Páginas - Página en blanco Menú Insertar  - Ficha Páginas - Salto de página Herramientas - Uso de la regla Menú Insertar  - Ficha Textos Instructivo Word ·          Leer el documento. Corregir errores gramaticales y de ortografía. ·         ...

Clase XXIII - 03102019 - Aplicación lineamientos de diseño TP - Punto de equilibrio

Aplicación lineamientos de diseño TP - Punto de equilibrio en una presentación Manual Powerpoint  Power Point es un programa de Microsoft Office para realizar presentaciones que permite diseñar  diapositivas con texto, imágenes, videos, hiperenlaces y animaciones. Esta herramienta es una de las más extendidas para crear un apoyo visual dinámico en las exposiciones.   Una presentación es un acto de comunicación , Powerpoint es una herramienta utilizada para comunicar ideas en forma visual ( a través de diapositivas),  por lo tanto, se debe: Exponer un objetivo claro. Debemos contar a nuestra audiencia qué van a ver en la presentación. ¿Vamos a hablar de algo realizado o de un proyecto? ¿Queremos exponer un tema, una idea, un proyecto?  Transmitir emociones para lograr efectividad (seguridad, coherencia, efectivo). Crear dramatismo. Es importante mantener la tensión en el público incorporando elementos inesperados y que provoquen la sorpre...