processador de textos

processador de textos

lunes, 13 de diciembre de 2010

BASE DE DATOS

BASE DE DATOS
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar fácilmente. A continuación te presentamos una guía que te explicará el concepto y características de las bases de datos.
El término de bases de datos fue escuchado por primera vez en 1963, en un simposio celebrado en California, USA. Una base de datos se puede definir como un conjunto de información relacionada que se encuentra agrupada ó estructurada.
Desde el punto de vista informático, la base de datos es un sistema formado por un conjunto de datos almacenados en discos que permiten el acceso directo a ellos y un conjunto de programas que manipulen ese conjunto de datos.
Cada base de datos se compone de una o más tablas que guarda un conjunto de datos. Cada tabla tiene una o más columnas y filas. Las columnas guardan una parte de la información sobre cada elemento que queramos guardar en la tabla, cada fila de la tabla conforma un registro.

Definición de base de datos

Se define una base de datos como una serie de datos organizados y relacionados entre sí, los cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular.
Características
Entre las principales características de los sistemas de base de datos podemos mencionar:
  • Independencia lógica y física de los datos.
  • Redundancia mínima.
  • Acceso concurrente por parte de múltiples usuarios.
  • Integridad de los datos.
  • Consultas complejas optimizadas.
  • Seguridad de acceso y auditoría.
  • Respaldo y recuperación.
  • Acceso a través de lenguajes de programación estándar.
Estructura de una Base de Datos
Una base de datos, a fin de ordenar la información de manera lógica, posee un orden que debe ser cumplido para acceder a la información de manera coherente. Cada base de datos contiene una o más tablas, que cumplen la función de contener los campos.
En el siguiente ejemplo mostramos una tabla “comentarios” que contiene 4 campos.
Los datos quedarían organizados como mostramos en siguiente ejemplo:
Por consiguiente una base de datos posee el siguiente orden jerárquico:
  • Tablas
  • Campos
  • Registros
  • Lenguaje SQL
Tablas:
Tabla en las bases de datos, se refiere al tipo de modelado de datos, donde se guardan los datos recogidos por un programa. Su estructura general se asemeja a la vista general de un programa de Hoja de cálculo. Las tablas se componen de dos estructuras: Registros y campos
Tipos de Campos
Cada Sistema de Base de Datos posee tipos de campos que pueden ser similares o diferentes. Entre los más comunes podemos nombrar:
  • Numérico: entre los diferentes tipos de campos numéricos podemos encontrar enteros “sin decimales” y reales “decimales”.
  • Booleanos: poseen dos estados: Verdadero “Si” y Falso “No”.
  • Memos: son campos alfanuméricos de longitud ilimitada. Presentan el inconveniente de no poder ser indexados.
  • Fechas: almacenan fechas facilitando posteriormente su explotación. Almacenar fechas de esta forma posibilita ordenar los registros por fechas o calcular los días entre una fecha y otra.
  • Alfanuméricos: contienen cifras y letras. Presentan una longitud limitada (255 caracteres).
  • Autoincrementables: son campos numéricos enteros que incrementan en una unidad su valor para cada registro incorporado. Su utilidad resulta: Servir de identificador ya que resultan exclusivos de un registro.

Un registro (también llamado fila o tupla) representa un objeto único de datos implícitamente estructurados en una tabla. En términos simples, una tabla de una base de datos puede imaginarse formada de filas y columnas o campos. Cada fila de una tabla representa un conjunto de datos relacionados, y todas las filas de la misma tabla tienen la misma estructura.
Un registro es un conjunto de campos que contienen los datos que pertenecen a una misma repetición de entidad. Se le asigna automáticamente un número consecutivo (número de registro) que en ocasiones es usado como índice aunque lo normal y práctico es asignarle a cada registro un campo clave para su búsqueda.
La estructura implícita de un registro y el significado de los valores de sus campos exige que dicho registro sea entendido como una sucesión de datos, uno en cada columna de la tabla. La fila se interpreta entonces como una variable relacional compuesta por un conjunto de tuplas, cada una de las cuales consta de dos ítems: el nombre de la columna relevante y el valor que esta fila provee para dicha columna.
Cada columna espera un valor de un tipo concreto.

El lenguaje SQL es el más universal en los sistemas de base de datos. Este lenguaje nos permite realizar consultas a nuestras bases de datos para mostrar, insertar, actualizar y borrar datos.
A continuación veremos un ejemplo de ellos:
  • Mostrar: para mostrar los registros se utiliza la instrucción Select. Select * From comentarios.
  • Insertar: los registros pueden ser introducidos a partir de sentencias que emplean la instrucción Insert. Insert Into comentarios (titulo, texto, fecha) Values ('saludos', 'como esta', '22-10-2007')
  • Borrar: Para borrar un registro se utiliza la instrucción Delete. En este caso debemos especificar cual o cuales son los registros que queremos borrar. Es por ello necesario establecer una selección que se llevara a cabo mediante la cláusula Where. Delete From comentarios Where id='1'.
  • Actualizar: para actualizar los registros se utiliza la instrucción Update. Como para el caso de Delete, necesitamos especificar por medio de Where cuáles son los registros en los que queremos hacer efectivas nuestras modificaciones. Además, tendremos que especificar cuáles son los nuevos valores de los campos que deseamos actualizar.



una base de datos es un sistemade informacion que permite realizar los siguientes procesos:

   
1:creacion de las estructuras de informacion:TABLAS
2:busqueda de informacion en las tablas:CONSULTAS
3:captura de datos para las tablas:FORMULARIOS
4:resumen de informacion :INFORMES
5:ejecucion de lista de acciones:MACROS:y descripcion de procesos complejos:MODULOS

Ventajas de las bases de datos

Control sobre la redundancia de datos:

Los sistemas de ficheros almacenan varias copias de los mismos datos en ficheros distintos. Esto hace que se desperdicie espacio de almacenamiento, además de provocar la falta de consistencia de datos.
En los sistemas de bases de datos todos estos ficheros están integrados, por lo que no se almacenan varias copias de los mismos datos. Sin embargo, en una base de datos no se puede eliminar la redundancia completamente, ya que en ocasiones es necesaria para modelar las relaciones entre los datos.

Consistencia de datos:

Eliminando o controlando las redundancias de datos se reduce en gran medida el riesgo de que haya inconsistencias. Si un dato está almacenado una sola vez, cualquier actualización se debe realizar sólo una vez, y está disponible para todos los usuarios inmediatamente. Si un dato está duplicado y el sistema conoce esta redundancia, el propio sistema puede encargarse de garantizar que todas las copias se mantienen consistentes.

Compartición de datos:

En los sistemas de ficheros, los ficheros pertenecen a las personas o a los departamentos que los utilizan. Pero en los sistemas de bases de datos, la base de datos pertenece a la empresa y puede ser compartida por todos los usuarios que estén autorizados.

Mantenimiento de estándares:

Gracias a la integración es más fácil respetar los estándares necesarios, tanto los establecidos a nivel de la empresa como los nacionales e internacionales. Estos estándares pueden establecerse sobre el formato de los datos para facilitar su intercambio, pueden ser estándares de documentación, procedimientos de actualización y también reglas de acceso.

Mejora en la integridad de datos:

La integridad de la base de datos se refiere a la validez y la consistencia de los datos almacenados. Normalmente, la integridad se expresa mediante restricciones o reglas que no se pueden violar. Estas restricciones se pueden aplicar tanto a los datos, como a sus relaciones, y es el SGBD quien se debe encargar de mantenerlas.

Mejora en la seguridad:

La seguridad de la base de datos es la protección de la base de datos frente a usuarios no autorizados. Sin unas buenas medidas de seguridad, la integración de datos en los sistemas de bases de datos hace que éstos sean más vulnerables que en los sistemas de ficheros.

Mejora en la accesibilidad a los datos:

Muchos SGBD proporcionan lenguajes de consultas o generadores de informes que permiten al usuario hacer cualquier tipo de consulta sobre los datos, sin que sea necesario que un programador escriba una aplicación que realice tal tarea.

Mejora en la productividad:

El SGBD proporciona muchas de las funciones estándar que el programador necesita escribir en un sistema de ficheros. A nivel básico, el SGBD proporciona todas las rutinas de manejo de ficheros típicas de los programas de aplicación.
El hecho de disponer de estas funciones permite al programador centrarse mejor en la función específica requerida por los usuarios, sin tener que preocuparse de los detalles de implementación de bajo nivel.

Mejora en el mantenimiento:

En los sistemas de ficheros, las descripciones de los datos se encuentran inmersas en los programas de aplicación que los manejan.
Esto hace que los programas sean dependientes de los datos, de modo que un cambio en su estructura, o un cambio en el modo en que se almacena en disco, requiere cambios importantes en los programas cuyos datos se ven afectados.
Sin embargo, los SGBD separan las descripciones de los datos de las aplicaciones. Esto es lo que se conoce como independencia de datos, gracias a la cual se simplifica el mantenimiento de las aplicaciones que acceden a la base de datos.

Aumento de la concurrencia:

En algunos sistemas de ficheros, si hay varios usuarios que pueden acceder simultáneamente a un mismo fichero, es posible que el acceso interfiera entre ellos de modo que se pierda información o se pierda la integridad. La mayoría de los SGBD gestionan el acceso concurrente a la base de datos y garantizan que no ocurran problemas de este tipo.

Mejora en los servicios de copias de seguridad:

Muchos sistemas de ficheros dejan que sea el usuario quien proporcione las medidas necesarias para proteger los datos ante fallos en el sistema o en las aplicaciones. Los usuarios tienen que hacer copias de seguridad cada día, y si se produce algún fallo, utilizar estas copias para restaurarlos.
En este caso, todo el trabajo realizado sobre los datos desde que se hizo la última copia de seguridad se pierde y se tiene que volver a realizar. Sin embargo, los SGBD actuales funcionan de modo que se minimiza la cantidad de trabajo perdido cuando se produce un fallo.





Modelos de datos.
    Para introducirnos en este tema, empezaremos definiendo que es un modelo.
modelo:    Es una representación de la realidad que contiene las características generales de algo que se va a realizar. En base de datos, esta representación la elaboramos de forma gráfica.
¿Qué es modelo de datos?
    Es una colección de herramientas conceptuales para describir los datos, las relaciones que existen entre ellos, semántica asociada a los datos y restricciones de consistencia.
Los modelos de datos se dividen en tres grupos:

     *Modelos lógicos basados en objetos.
     *Modelos lógicos basados en registros.
     *Modelos físicos de datos.

Modelos lógicos basados en objetos.
Se usan para describir datos en los niveles conceptual y de visión, es decir, con este modelo representamos los datos de tal forma como nosotros los captamos en el mundo real, tienen una capacidad de estructuración bastante flexible y permiten especificar restricciones de datos explícitamente. Existen diferentes modelos de este tipo, pero el más utilizado por su sencillez y eficiencia es el modelo Entidad-Relación.
*  Modelo Entidad-Relación.
             Denominado por sus siglas como: E-R; Este modelo representa a la realidad a través de entidades, que son objetos  que existen y que se distinguen de otros por sus características, por ejemplo: un alumno se distingue de otro por sus características particulares como lo es el nombre, o el numero de control asignado al entrar a una institución educativa, así mismo, un empleado, una materia, etc. Las entidades pueden ser de dos tipos:
         Tangibles :
                Son todos aquellos objetos físicos que podemos ver,
              tocar o sentir.
            Intangibles:
                 Todos aquellos eventos u objetos conceptuales que no
              podemos ver, aun sabiendo que existen, por ejemplo:
              la entidad materia, sabemos que existe, sin embargo, no la
              podemos visualizar o tocar.
     Las características de las entidades en base de datos se llaman atributos, por ejemplo el nombre, dirección teléfono, grado, grupo, etc. son atributos de la entidad alumno; Clave, número de seguro social, departamento, etc., son atributos de la entidad empleado. A su vez una entidad se puede asociar o relacionar con más entidades a través de relaciones.
 Pero para entender mejor esto, veamos un ejemplo:
     Consideremos una empresa que requiere controlar a los vendedores y las ventas que ellos realizan; de este problema determinamos que los objetos o entidades principales a estudiar son el empleado (vendedor) y el artículo (que es el producto en venta), y las características que los identifican son:
                  Empleado:       Artículo:
                  Nombre            Descripción
                  Puesto              Costo
                  Salario              Clave
                  R.F.C.
La relación entre ambas entidades la podemos establecer como Venta.
    Bueno, ahora nos falta describir como se representa un modelo E-R gráficamente, la representación es muy sencilla, se emplean símbolos, los cuales son:
    Símbolo                                               Representa
    Así nuestro ejemplo anterior quedaría representado de la siguiente forma:
 
    Existen más aspectos a considerar con respecto a los modelos entidad relación, estos serán considerados en el tema Modelo Entidad Relación.
  Modelos lógicos basados en registros.
    Se utilizan para describir datos en los niveles  conceptual y físico.
Estos modelos utilizan registros  e instancias para representar la realidad, así como las relaciones que existen entre estos registros (ligas) o apuntadores. A diferencia de los modelos de datos basados en objetos, se usan para especificar la estructura lógica global de la base de datos y para proporcionar una descripción a nivel más alto de la implementación.
Los tres modelos de datos más ampliamente aceptados son:
           Modelo Relacional
           Modelo de Red
           Modelo Jerárquico
        * Modelo relacional.

         En este modelo se representan los datos y las relaciones entre estos, a través de una colección de tablas, en las cuales los renglones (tuplas) equivalen a los cada uno de los registros que contendrá la base de datos y las columnas corresponden a las características(atributos) de cada registro localizado en la tupla;
Considerando nuestro ejemplo del empleado y el artículo:
 Tabla del empleado
Ahora te preguntaras ¿cómo se representan las relaciones entre las entidades en este modelo?
    Existen dos formas de representarla; pero para ello necesitamos definir que es una llave primaria: Es un atributo el cual definimos como atributo principal, es una forma única de identificar a una entidad. Por ejemplo, el RFC de un empleado se distingue de otro por que los RFC no pueden ser iguales.
 Ahora si, las formas de representar las relaciones en este modelo son:
1. Haciendo una tabla que contenga cada una de las llaves primarias de las entidades involucradas en la relación.
   Tomando en cuenta que la llave primaria del empleado es su RFC, y la llave primaria del articulo es la Clave.
 
2. Incluyendo en alguna de las tablas de las entidades involucradas, la llave de la otra tabla.
                                                                                                
       * Modelo de red.
     Este modelo representa los datos mediante colecciones de registros
y sus relaciones se representan por medio de ligas o enlaces,
los cuales pueden verse como punteros.  Los registros se organizan
en un conjunto de gráficas arbitrarias.      
 Ejemplo:

             
    Para profundizar en este tema visitemos: Modelo de datos de red.
    * Modelo jerárquico.

          Es similar al modelo de red en cuanto a las relaciones y datos, ya que estos se representan por  medio de registros  y sus ligas. La diferencia radica en que están organizados por conjuntos de arboles en lugar de gráficas arbitrarias.

            
           Para profundizar más en el tema visita: Modelo de datos jerárquico. 
  Modelos físicos de datos.      Se usan para describir a los datos en el nivel más bajo, aunque existen muy pocos modelos de este tipo,   básicamente capturan aspectos de la implementación de los sistemas de base de datos. Existen dos clasificaciones de este tipo que son:
        Modelo unificador
       Memoria de elementos.


Instancias y esquemas.
    Con el paso del tiempo la información que se va acumulando y desechando en la base de datos, ocasiona que está cambie.
Denominamos:
Instancia.
     Al estado que presenta una base de datos en un tiempo dado. Veámoslo como una fotografía que tomamos de la base de datos en un tiempo t, después de que transcurre el tiempo t la base de datos ya no es la misma.
Esquema.
     Es la descripción lógica de la base de datos, proporciona los nombres de las entidades y sus atributos especificando las relaciones que existen entre ellos. Es un banco en el que se inscriben los valores que irán formando cada uno de los atributos. El esquema no cambia los que varían son los datos y con esto tenemos una nueva instancia.
Ejemplo:
Considerando el ejemplo del vendedor que vende artículos, esquema e instancia según nuestro ejemplo, quedaría:
Esquema:
    { Vendedor : Nombre, puesto, salario, RFC }
    { Articulo : Clave, costo, descripción }
Instancia:
    Como podemos observar el esquema nos muestra la estructura en el cual se almacenaran los datos, en este caso en registros cuyos nombres de campos son: por parte del vendedor (Nombre, puesto,salario, RFC) y por el artículo (Clave, costo,descripción); La instancia representa a una serie de datos almacenados en los registros establecidos por el esquema, estos datos varían, no permanecen fijos en el tiempo.
  Independencia de los datos
    Se refiere a la protección contra los programas de aplicación que puedan originar  modificaciones cuando se altera la organización física o lógica de la base de datos. Existen 2 niveles de independencia de datos.
      Independencia física de datos:
             Es la capacidad de modificar el esquema físico sin provocar que se vuelvan a escribir los programas de aplicación.
     Independencia lógica de datos:
               Capacidad de modificar el esquema conceptual sin provocar que se vuelvan a escribir los programas de aplicación.

 Lenguaje de definición de datos
        El lenguaje de definición de datos, denominado por sus siglas como: DDL(Data definition Language).
    Permite definir un esquema de base de datos por medio de una serie de definiciones que se expresan en un lenguaje especial, el resultado de estas definiciones se almacena en un archivo especial llamado diccionario de datos.
 Lenguaje de manipulación de datos
    La manipulación de datos se refiere a las operaciones de insertar, recuperar, eliminar o modificar datos; dichas operaciones son realizadas a través del lenguaje de manipulación de datos (DML, Data Manipulation Language), que es quién permite el acceso de los usuarios a los datos.
Existen básicamente 2 tipos de lenguajes de manipulación de datos:
  • Procedimentales:
        Los LMD requieren que el usuario especifique que datos se necesitan y cómo obtenerlos.
  • No procedimentales:
        Los LMD requieren que el usuario especifique que datos se necesitan y sin especificar cómo obtenerlos.
Manejador de Bases de Datos
    El sistema  manejador   de bases de datos es la porción más importante del software de un sistema de base de datos. Un DBMS es una colección de numerosas rutinas de software interrelacionadas, cada una de las cuales es responsable de alguna tarea específica.
Las funciones principales de un DBMS son:
                Crear y organizar la Base de datos.
              Establecer y mantener las trayectorias de acceso a la base
               de datos de tal forma que  los datos puedan ser accesados
                rápidamente.

              Manejar los datos de acuerdo a las peticiones de los usuarios.
              Registrar el uso de las bases de datos.
              Interacción con el manejador de archivos.
                    Esto a través de las sentencias en DML al comando de el
                sistema de archivos. Así el Manejador de base de datos es el
                responsable del verdadero almacenamiento de los datos.

              Respaldo y recuperación.
                    Consiste en contar con mecanismos implantados que
                permitan la recuperación fácilmente de los datos en caso
                de ocurrir fallas en el sistema de base de datos.

              Control de concurrencia.
                    Consiste en controlar la interacción entre los usuarios
                concurrentes para no afectar la inconsistencia de los datos.

              Seguridad e integridad.
                    Consiste en contar con mecanismos que permitan el
                control de la consistencia de los datos evitando que estos
                se vean perjudicados por cambios no autorizados o previstos.

El DBMS es conocido también como Gestor de Base de datos.
        
    La figura muestra el  DBMS como interfase entre la base de datos física y las peticiones del usuario. El DBMS interpreta las peticiones de entrada/salida del usuario y las manda al sistema operativo para la transferencia de datos entre la unidad de memoria secundaria y la memoria principal.
    En sí, un sistema manejador de base de datos es el corazón de la base de datos ya que se encarga del control total de los posibles aspectos que la puedan afectar.
 Administrador de Bases de Datos
Denominado por sus siglas como: DBA, Database Administrator.
    Es la persona encargada y que tiene el control total sobre el sistema de base de datos, sus funciones principales son:
  Definición de esquema.
     Es el esquema original de la base de datos se crea escribiendo un conjunto de definiciones que son traducidas por el compilador de DDL a un conjunto de tablas que son almacenadas permanentemente en el diccionario de datos.

  Definición de la estructura de almacenamiento del método de acceso.
     Estructuras de almacenamiento y de acceso adecuados se crean escribiendo un conjunto de definiciones que son traducidas por e compilador del lenguaje de almacenamiento y definición de datos.

  Concesión de autorización para el acceso a los datos.
      Permite al administrador de la base de datos regular las partes de las bases de datos que van a ser accedidas por varios usuarios.

  Especificación de límitantes de integridad.
      Es una serie de restricciones que se encuentran almacenados en una estructura especial del sistema que es consultada por el gestor de base de datos cada vez que se realice una actualización al sistema.

 Usuarios de las bases de datos.
    Podemos definir a los usuarios como toda persona que tenga todo tipo de contacto con el sistema de base de datos desde que este se diseña, elabora, termina y se usa.
Los usuarios que accesan una base de datos pueden clasificarse como:
  Programadores de aplicaciones.
      Los profesionales en computación que interactuan con el sistema por medio de llamadas en DML (Lenguaje de Manipulación de Datos), las cuales están incorporadas en un programa escrito en un lenguaje de programación (Por ejemplo, COBOL, PL/I, Pascal, C, etc.)
  Usuarios sofisticados.
      Los usuarios sofisticados interactuan con el sistema sin escribir programas. En cambio escriben sus preguntas en un lenguaje de consultas de base de datos.
  Usuarios especializados.
      Algunos usuarios sofisticados escriben aplicaciones de base de datos especializadas que no encajan en el marco tradicional de procesamiento de datos.
  Usuarios ingenuos.
      Los usuarios no sofisticados interactuan con el sistema invocando a uno de los programas de aplicación permanentes que se han escrito anteriormente en el sistema de base de datos, podemos mencionar al usuario ingenuo como el usuario final que utiliza el sistema de base de datos sin saber nada del diseño interno del mismo por ejemplo: un cajero.
Estructura general del sistema.
    Un sistema de base de datos se encuentra dividido en módulos cada uno de los cuales controla una parte de la responsabilidad total de sistema. En la mayoría de los casos, el sistema operativo proporciona únicamente los servicios más básicos y el sistema de la base de datos debe partir de esa base y controlar además el manejo correcto de los datos. Así el diseño de un sistema de base de datos debe incluir la interfaz entre el sistema de base de datos y el sistema operativo.
Los componentes funcionales de un sistema de base de datos, son:
      Gestor de archivos.
            Gestiona la asignación de espacio en la memoria del disco y
       de las estructuras de datos usadas para representar información.

      Manejador de base de datos.
            Sirve de interfaz entre los datos y los programas de aplicación.

      Procesador de consultas.
             Traduce las proposiciones en lenguajes de consulta a
       instrucciones de bajo nivel. Además convierte la solicitud del
       usuario en una forma más eficiente.

      Compilador de DDL.
            Convierte las proposiciones DDL en un conjunto de tablas
       que contienen metadatos, estas se almacenan en el diccionario
       de datos.

      Archivo de datos.
           En él se encuentran almacenados físicamente los datos de una
       organización.

      Diccionario de datos.
            Contiene la información referente a la estructura de la base
       de datos.

      Indices.
            Permiten un rápido acceso a registros que contienen valores
       específicos.

    Una forma gráfica de representar los componentes antes
mencionados y la relación que existe entre ellos sería la siguiente.

No hay comentarios:

Publicar un comentario