Conceptos de Diseño en Archivos y Bases de Datos

Campos

De acuerdo con Whitten y Bentley (2008) un campo se define como “la unidad más pequeña de datos significativos que se almacena en un archivo o en una base de datos.” (p.421). Es decir, son las columnas que tienen nombres significativos para representar una clase particular de información sobre la entidad. Por otra parte, Whitten y Bentley señalan que existen 4 tipos de campos, divididos en:

Clave Primaria. Es un campo que identifica de manera única a un registro. Asimismo, puede crearse una clave primaria concatenando dos o más campos.
Clave Secundaria. Este campo cumple con las características necesarias (unicidad) para ser una clave primaria, sin embargo, se ha tomado otro campo que satisface mejor el objetivo y la lógica de los datos. Las claves secundarias son todos aquellos campos que no son una clave primaria y que pueden utilizarse como claves foráneas, aunque esto último no es algo común.
Clave Foránea. Suele ser un campo de una entidad que hace referencia a la clave primaria de otra entidad lo cual permite una relación entre ambas entidades. El uso de claves foráneas garantiza una mayor integridad referencial, mitigando cualquier inconsistencia.
Campo Descriptivo. Son todos aquellos campos que no tienen ninguna de las claves antes descritas.

Registros

Un registro es una tupla que contiene un único dato por cada campo presente en la entidad y que, además, “tienen algo en común con la entidad descrita”. (Kendall & Kendall, 2011, p.408). Por otro lado, un registro puede tener una longitud fija o variable, como indica Whitten & Bentley (2008) “durante el diseño de sistemas, los registros estarán clasificados ya sea como registros de longitud fija o de longitud variable” (p.421). Si bien los registros de longitud fija son lo más utilizados, existen situaciones en donde se le da más prioridad a la minimización del espacio, y tal minimización se alcanza empleando registros de longitud variable. (Kendall & Kendall, 2011, p.409).

Archivos

Kendall & Kendall (2011) se refieren a un archivo como aquel que “contiene grupos de registros que se utilizan para proveer información para operaciones, planeación, administración y toma de decisiones.” (p.410). Asimismo, clasifican los tipos de archivos de acuerdo a su tiempo de existencia de la siguiente manera:

Prolongada. En este apartado se encuentran los archivos maestros, los cuales se caracterizan por mantener una estructura fija y una constante actualización de los registros, además, contienen una amplia cantidad de registros. Por otro lado, están los archivos tablas que almacenan los datos que se utilizarán para realizar operaciones aritméticas o lógicas para calcular más datos.

Temporal. Primeramente, están los archivos de transacciones, estos cumplen un papel fundamental ya que se encargan de almacenar los eventos o modificaciones que ocurren para posteriormente actualizar el archivo maestro y además producir informes. Por último, se sitúan los archivos de informes que son empleados para imprimir y distribuir los datos cuando sea necesario.

Bases de Datos

Una base de datos es una colección de datos relacionados que permanecen en el tiempo. De acuerdo con Kroenke (2003) “el propósito de una base de datos es ayudar a las personas a dar seguimiento a las cosas.” (p.3).

Por otro lado, Ramez Elmasri & Shamkant B. Navathe (2007) expresan que la definición de base de datos es normalmente restringida por algunas propiedades implícitas:

1. Una base de datos representa algún aspecto del mundo real y los cambios introducidos en tal representación se reflejan en la base de datos.

2. Una base de datos es una colección de datos lógicamente coherente con algún tipo de significado inherente.

3. Una base de datos puede ser de cualquier tamaño y complejidad.

4. Una base de datos se puede generar y mantener manualmente o estar computarizada.

Técnicas de Diseño de Archivos y Base de Datos: Ingeniería Inversa de Bases de Datos.

La ingeniería inversa se puede definir como “el proceso de descubrir los principios tecnológicos de un dispositivo, un objeto o un sistema, mediante el análisis de su estructura, funcionamiento u operación.” (Juánez-Ramírez et al, 2007). La ingeniería inversa también es aplicada en la creación de sistemas, debido a lo anteriormente dicho, este proceso toma cada dato en el sistema y lo analiza en detalle, con el objetivo de crear un sistema nuevo que tendrá las mismas funcionalidades, pero con una nueva innovación para no obtener un plagio.

Modelo de Entidad-Relación

En las bases de datos, es aplicada la ingeniería inversa y existen técnicas para analizar la estructura, la funcionalidad y los datos que componen una base de datos en múltiples aspectos, como su diseño lógico y su diseño físico. El modelo de Entidad-Relación es una representación gráfica que gracias a su forma simple identifica los elementos importantes en la base de datos (atributos), las propiedades de estos elementos (atributos) y como se relacionan estos elementos entre si (relación). (Barker, 1994).

Normalización

La normalización, en cuanto a base de datos se refiere, es vista como la transformación de la estructura de los datos para conseguir una manera de presentarlos mucho más eficiente, pequeña, estable y coherente. Al realizar este método, se consigue una base de datos mucho más fácil de entender y de interpretar, sin embargo, no ayuda a la optimización del rendimiento de la base de datos. Según el Departamento de Ciencias de la Computación de Cataluña: “Básicamente, las reglas de Normalización están encaminadas a eliminar redundancias e inconsistencias de dependencia en el diseño de las tablas.” (s.f). En este sentido, y aunque existen muchas formas de normalización, la mayoría se rigen de los siguientes pasos para conseguir un resultado efectivo:

Se elimina todos los grupos repetitivos y se agrega una clave primaria a uno de los registros, teniendo en cuenta que, la clave primaria se interpreta por ser un dato único. Por ejemplo, Número de Cédula, número de teléfono, etc.

Es necesario durante este proceso, que todos los atributos registrados sin la clave sean dependientes de la clave primaria.

Se deben eliminar las dependencias transitivas; dichas dependencias son aquellas en la que los atributos sin clave son dependientes de otros atributos sin clave.

Por otra parte, las formas de normalización funcionan de una manera jerárquica, casi como bloques apilados unos sobre otros; para llegar a una forma, hace falta llegar a otras formas primero, de manera que cada una elimina una parte de la redundancia con cada instancia. Son clasificadas en:

Primera forma normal (1NF): Araneda explica que: “Es la forma normal propia al esquema relacional, de uso obligatorio.” (2022). Se consigue cuando en una tabla, cada celda no contiene más de un valor, existe un atributo designado como clave primaria y no se duplican las filas y las columnas en todas las tablas. En esta forma, se remueven los grupos repetitivos, más no la redundancia.

Segunda forma normal (2NF): Se consigue cuando una tabla ya se encuentre en 1NF, y esta no tenga dependencia parcial entre sus atributos no claves (que no dependan de la clave primaria ya asignada). Una vez se realiza esta forma, se consigue la eliminación de la redundancia.

Tercera forma normal (3NF): Con la tercera forma normal, se suprimen las dependencias parciales transitivas, es decir, que los atributos no principales (aquellos que no pertenezcan a una clave del candidato) dependan de otros atributos no principales.

Lineamiento para el Diseño de Relación Archivo Maestro/Base de Datos

En la materia de bases de datos, se conoce como archivo maestro, a aquel archivo que contiene la información centralizada de otras tablas y otros archivos dentro del sistema, además de como acceder a estos últimos dentro de la jerarquía. Dentro de ellos, se debe encontrar todos los valores principales de cada tabla, que podrán ser utilizados a su vez por otras tablas como suministro para operaciones y consultas. La empresa PowerData explica la obtención de un archivo maestro como “un método que permite a una organización relacionar todos sus datos críticos con un solo archivo… de forma que se obtiene un punto de referencia común para los datos más importantes, simplificando además el intercambio de datos entre personal y departamentos.” (s.f.). De manera que, los archivos maestros representan la principal fuente de referencias a la información dentro de una base de datos.

Al diseñar relaciones de archivos maestros dentro de bases de datos, es recomendado tomar en cuenta los siguientes lineamientos:

Es necesaria la separación completa de las entidades de datos, de manera que cada una cree un archivo maestro y no coexistan en un solo archivo.

Los campos de datos de cada entidad de datos deben estar alojados en su respectivo archivo maestro representativo, es decir, no pueden existir en otro. Un ejemplo podría ser el campo de “Nombre de estudiante”, que no puede estar en otro archivo que no sea el “Archivo maestro de estudiantes”.

Es necesario que cada archivo maestro o, en su defecto, cada relación de base de datos, posea un solo programa CRUD, es decir, una manera de Crear, Leer, Actualizar, y Borrar del registro.

Uso de Base de Datos

En la era digital actual, las bases de datos juegan un papel fundamental en la gestión y organización de la información. El uso eficiente de bases de datos permite a las organizaciones almacenar, acceder y analizar datos de manera efectiva, lo que es crucial para la toma de decisiones informada y estratégica.

Almacenes de Datos

Según la definición de Amazon Web Services (AWS) (s.f.), un almacén de datos es un “repositorio central de información que se puede analizar para tomar decisiones mejor informadas”. Los datos se recopilan y almacenan en estos depósitos desde sistemas transaccionales, bases de datos relacionales y otras fuentes, normalmente de manera continua, los profesionales como analistas empresariales, ingenieros de datos, científicos de datos y directivos acceden a la información a través de diversas herramientas de inteligencia empresarial (BI), clientes SQL y otras aplicaciones especializadas en análisis. Estas herramientas les permiten explorar, interpretar y tomar decisiones basadas en datos precisos y actualizados, facilitando una mejor comprensión de las tendencias y el comportamiento del mercado.

Actualmente un almacén de datos modernos según la empresa SAP SE (s.f.) “puede alojar datos estructurados y no estructurados. Fusionando estos tipos de datos y eliminando los silos entre ambos, las empresas pueden obtener una completa imagen integral de la información estratégica más valiosa.” Esta capacidad para manejar tanto datos estructurados como no estructurados permite a las empresas ser más flexibles y adaptarse rápidamente a las cambiantes necesidades del mercado.

Publicación de Base de Datos para la Web

La publicación de bases de datos para la web es un proceso que permite que los datos almacenados en una base de datos sean accesibles y manipulables a través de aplicaciones web. Este proceso es crucial para la creación de aplicaciones dinámicas que puedan proporcionar a los usuarios acceso en tiempo real a la información que necesitan.

Existen tres formas de publicar una base de datos para la web:

La primera forma de publicar una base de datos en la web es con FileMaker Server, en donde se pueda usar FileMaker WebDirect para publicar datos en la web rápidamente. No se requiere software adicional y los usuarios con navegadores compatibles pueden ver, editar y buscar registros con los privilegios de acceso adecuados. Los datos en el navegador se actualizan automáticamente a medida que se transfieren desde FileMaker Server.

Luego, la Publicación Estática la cual es adecuada para datos que cambian poco. Se exportan los datos para crear una página web estática con HTML, la cual no se actualiza cuando los datos de la base de datos cambian. Esto es útil si no se necesita una conexión en vivo con la base de datos.

Por último, la Publicación en la Web Personalizada, en el cual Utiliza FileMaker Server y tecnologías como XML y PHP, se puede tener un mayor control sobre la apariencia y funcionalidad de la base de datos publicada. Esto permite integrar la base de datos con otros sitios web, controlar la interacción del usuario con los datos y cómo se muestran en los navegadores

Referencias Bibliográficas

Amazon Web Service. (s.f.). Obtenido de AWS: https://aws.amazon.com/es/what-is/data-warehouse/

Araneda, P. (2022). El camino de los datos a la información. Opendataclinica.

Barker, R. (1994). El modelo entidad-realción CASE*METHOD.

Departamento de Ciencias de la Computación de Cataluña. (s.f.). Normalización de Base de Datos y Técnicas de diseño. Universidad Politécnica de Cataluña.

IMMUNE T. (2024). Obtenido de IMMUNE TECHNOLOGY INSTUTE: https://immune.institute/blog/bases-de-datos-ejemplos-y-aplicaciones/

JUÁREZ-RAMÍREZ, R., LICEA, G., & CRISTÓBAL-SALAS , A. (2007). Ingeniería Inversa y Reingeniería Aplicadas a Proyectos de Software Desarrollados. Obtenido de International Institude of Informatics and Cybernetics: https://www.iiisci.org/journal/pdv/risci/pdfs/x581yp.pdf

Kendall & Kendall. (2011). Análisis y diseño de Sistemas. (8ª Edición). México Ed. Prentice Hall.

Kroenke, D., M. (2003). Procesamiento de bases de datos. (8ª Edición). México Ed. Prentice Hall.

PowerData. (s.f). MDM (Master Data Management): ¿Qué es y cómo debes implementarlo en tu empresa?. https://www.powerdata.es/mdm#:~:text=MDM%20%28gesti%C3%B3n%20de%20datos%20maestros%29%2C%20es%20un%20m%C3%A9todo,simplificando%20adem%C3%A1s%20el%20intercambio%20de%20datos%20entre%20per

Ramez Elmasri & Shamkant B. Navathe. (2007). Fundamentos de sistemas de bases de datos (5ª Edición). Madrid Pearson Educación S.A.

SAP Business Technology Platform . (s.f.). Obtenido de SAP: https://www.sap.com/latinamerica/products/technology-platform/datasphere/what-is-a-data-warehouse.html

Whitten & Bentley. (2008). Análisis de sistemas diseño y métodos. (7ª Edición). México D.F: McGraw-Hill / Interamericana Editores, S.A.

Buscar este blog

Diseño de Archivos y Bases de Datos