¿ Con MySQL, hay dos posibles conjuntos de caracteres disponibles para que sus datos sean almacenados pulg Estos conjuntos de caracteres Unicode reflejan la cantidad de datos que se almacena por carácter en la base de datos MySQL. El UTF - 8 de tres bytes Unicode de codificación ( UTF - 8 ) juego de caracteres se reconoce comúnmente , pero no es el juego de caracteres predeterminado para MySQL . ¿Qué son los juegos de caracteres ?
Juegos de caracteres son un conjunto de normas que contienen todas las teclas de entrada de teclado disponibles . El primer juego de caracteres ASCII populares funcionó bien para el idioma Inglés , pero como otras naciones comenzaron a utilizar las computadoras y las diversas necesidades , se requiere un nuevo conjunto de caracteres. UCS -2 y UTF - 8 son dos conjuntos de caracteres capaz de introducir datos desde casi cualquier teclado en el mundo.
UCS- 2 de codificación Unicode ( UCS- 2 )
UCS- 2 es un juego de caracteres que utiliza 16 bits por carácter , apoyando el Plano multilingüe Básico ( BMP ) . En comparación, ASCII utiliza sólo un byte . El rango de valores de código de bits entre 0 y 65535 y , en UCS- 2 , puede ser codificada en una palabra de 16 bits fija.
Tres bytes UTF - 8 Unicode Encoding < br >
Con UTF - 8 , el mismo rango de conjunto de caracteres y bits de código se utiliza como UCS - 2 , pero que utiliza sólo de uno a tres bytes por carácter . Mientras que UCS- 2 puede ser codificado en un código de 16 bits fija , UTF - 8 codifica para cualquiera de 8, 16 o 24 bits . UTF -8 es un nuevo estándar de UCS- 2 .
Por defecto de MySQL a UCS- 2
MySQL es una aplicación de base de datos muy antiguo y su creación precedieron a la masa implementación de UTF - 8 . Por lo tanto , MySQL siempre ha favorecido UCS - 2 , que es adecuado para la mayoría de las implementaciones de bases de datos . Si desea utilizar UTF - 8 en lugar , puede hacerlo cambiando la configuración de base de datos .