lunes, 11 de marzo de 2013

"Leyes de Codd"

REGLA  0
Para que un sistema se denomine sistema de gestión de bases de datos relacionales, este sistema debe usar (exclusivamente) sus capacidades relacionales para gestionar la base de datos.


REGLA 1: REGLA DE LA INFORMACIÓN
Toda la información en una base de datos relacional se representa explícitamente en el nivel lógico exactamente de una manera: con valores en tablas.


REGLA 2: REGLA DEL ACCESO GARANTIZADO
Para todos y cada uno de los datos (valores atómicos) de una BDR se garantiza que son accesibles a nivel lógico utilizando una combinación de nombre de tabla, valor de clave primaria y nombre de columna.



REGLA 3: TRATAMIENTO SISTEMÁTICO DE VALORES NULOS
Los valores nulos (que son distintos de la cadena vacía, blancos, 0, ...) se soportan en los SGBD totalmente relacionales para representar información desconocida o no aplicable de manera sistemática, independientemente del tipo de datos.

            

REGLA 4: CATÁLOGO DINÁMICO EN LÍNEA BASADO EN EL MODELO RELACIONAL
La descripción de la base de datos se representa a nivel lógico de la misma manera que los datos normales, de modo que los usuarios autorizados pueden aplicar el mismo lenguaje relacional a su consulta, igual que lo aplican a los datos normales.



REGLA 5: REGLA DEL SUBLENGUAJE DE DATOS COMPLETO
Un sistema relacional debe soportar varios lenguajes y varios modos de uso de terminal (ej: rellenar formularios, etc.). Sin embargo, debe existir al menos un lenguaje cuyas sentencias sean expresables, mediante una sintaxis bien definida, como cadenas de caracteres y que sea completo, soportando:

            - Definición de datos
            - Definición de vistas
            - Manipulación de datos (interactiva y por programa)
            - Limitantes de integridad
            - Limitantes de transacción (iniciar, realizar, deshacer) (Begin, commit, rollback).



REGLA 6: REGLA DE ACTUALIZACIÓN DE VISTAS
Todas las vistas que son teóricamente actualizables se pueden actualizar por el sistema.


REGLA 7: INSERCIÓN, ACTUALIZACIÓN Y BORRADO DE ALTO NIVEL
La capacidad de manejar una relación base o derivada como un solo operando se aplica no sólo a la recuperación de los datos (consultas), si no también a la inserción, actualización y borrado de datos.

REGLA 8: INDEPENDENCIA FÍSICA DE DATOS
Los programas de aplicación y actividades del terminal permanecen inalterados a nivel lógico cuandoquiera que se realicen cambios en las representaciones de almacenamiento o métodos de acceso.



REGLA 9: INDEPENDENCIA LÓGICA DE DATOS
Los programas de aplicación y actividades del terminal permanecen inalterados a nivel lógico cuandoquiera que se realicen cambios a las tablas base que preserven la información.

         


REGLA 10: INDEPENDENCIA DE INTEGRIDAD
Los limitantes de integridad específicos para una determinada base de datos relacional deben poder ser definidos en el sublenguaje de datos relacional, y almacenables en el catálogo, no en los programas de aplicación.


REGLA 11: INDEPENDENCIA DE DISTRIBUCIÓN
Una BDR tiene independencia de distribución.



REGLA 12: REGLA DE LA NO SUBVERSIÓN
Si un sistema relacional tiene un lenguaje de bajo nivel (un registro de cada vez), ese bajo nivel no puede ser usado para saltarse (subvertir) las reglas de integridad y los limitantes expresados en los lenguajes relacionales de más alto nivel (una relación (conjunto de registros) de cada vez).

10 bases de datos mas grandes del mundo

"World Data Centre for Climate"
El centro mundial de datos para el clima (WDCC). 
Esta es la base de datos más grande del mundo, ubicada en alemania, tuvo un costo de más de 53 millones de euros, los datos que maneja son:
220 terabytes de datos web
  • 6 petabytes de datos adicionales













"National Energy Research Scientific Computing Center"

National Energy Research Scientific Computing Center: El NERSC es un laboratorio que investiga distintos tipos.

  2.8 petabytes de datos
Es operada por más de 2,000 científicos














"AT&T"
  •  Compañía de telecomunicaciones de Estados Unidos, guardan todos los regístros desde hace décadas.
  • 323 terabytes de información
  • 1.9 trillones de llamadas telefónicas guardadas









"Google"

  • No se sabe a cienta cierta el tamaño, pero sabiendo que:
  • 91 millones de búsquedas por día
  • Realiza más de 50% de las búsquedas en Internet a nivel mundial
  • Incontables perfiles de personas a nivel mundial almacenados










"Sprint"
  • Una de las mayores compañías de telecomunicaciones.
  • 2.85 trillones de filas en la base de datos
  • 365 millones de detalles de llamadas procesadas por día
  • En los picos se guardan 70,000 detalles de llamada por segundo.


















"ChoicePoint"
  • Almacena datos personales de la población de EEUU.
  • 250 terabytes de datos personales
  • Información de más de 250 millones de personas





"YouTube"
  • 100 millones de videos vistos por día
  • 65,000 videos agregador por día
  • Tiene el 60% de los videos que hay en línea
  • Al menos 45 terabytes de videos












"Amazon"
  • Tienda online más grande del mundo.
  • 59 millones de clientes activos
  • Más de 42 terabytes de datos









"CIA (Central Intelligence Agency)"
  • Tamaño desconocido (se sabe que es inmenso).
  • Estadísticas y datos detallados de más de 250 paises
  • Gran número desconocido de información clasificada














"Biblioteca del congreso de Estados Unidos"
  • 130 millones de de cosas (libros, fotos, mapas, etc)
  • 29 millones de libros
  • Se agregan 10,000 nuevas cosas por día
  • 852 kilómetros de estanterias
  • 5 millones de documentos digitales
  • 20 terabytes de datos en texto