Los archivos de datos deben tener una estructura que permita a los usuarios determinar qué tipo de datos que está viendo . Una manera de estructurar estos archivos es para insertar delimitadores entre campos de datos y al final de los registros . Los diferentes tipos de archivos tienen diferentes delimitadores. El delimitador utilizado depende del tipo de datos del archivo y de los campos de datos que contienen . Programas de bases de datos a menudo pueden reconocer el tipo de archivo delimitado , y convertirlo a los delimitadores estándar que utiliza el programa. Estructura
archivos delimitados
archivos básicos contienen datos en los campos y registros. Los delimitadores indican qué datos pertenecen juntos en un campo , y los campos que componen un registro. Un campo es un punto de datos individual , mientras que un registro es un conjunto de puntos de datos que se refieren al mismo elemento . Un ejemplo típico es una lista de clientes que tiene campos que muestran el nombre , edad, dirección y número de teléfono . Estos campos constituyen un registro se hace referencia a un mismo cliente . La mayoría de los archivos de datos tienen un registro por línea , pero los campos separados con una variedad de delimitadores.
Archivos delimitados por comas
El tipo más común de archivo delimitado es un archivo con coma de valores separados o . CSV. Los archivos tienen un registro por línea , y los campos que comas entre ellos. La mayoría de programas de bases de datos se pueden leer. Archivos CSV , convertirlos en su propio formato nativo y exportarlos para su uso en otros programas. Un problema clave para los archivos CSV . Está incluyendo datos que contienen comas. Procesadores de datos deben quite las comas adicionales durante la validación de datos o utilizar soluciones alternativas no convencionales , tales como encerrar el campo entre comillas.
Ficha Archivos delimitados
< p > Los datos con estructura de textos complejos que a menudo tiene comas para ser comprensible . Por esta razón, muchas bases de datos grandes utilizan delimitadores distintos comas. Una alternativa popular es el archivo delimitado por tabulaciones o tabulación de valores separados ( . TSV ) . La mayoría de los programas de base de datos pueden leer estos archivos , y tienen la ventaja de que generan columnas ordenadas , con los lados izquierdos de los datos en fila , al abrirlos en los procesadores de texto .
Otros delimitadores < br >
Los siguientes archivos delimitados más comunes son los que utilizan los dos puntos como delimitadores . Los dos puntos sufren el mismo problema que comas si los datos contienen dos puntos en su texto . Similares otros delimitadores alternativos son puntos y comas y espacios. Los archivos de datos utilizan estos delimitadores dependiendo de si los datos contienen el delimitador . Algunos programas le permiten elegir cualquier carácter como delimitador para un archivo en particular , pero estos archivos pueden no ser compatibles con otros programas de bases de datos .