<?php
include_once $_SERVER['DOCUMENT_ROOT'] . '/include/shared-manual.inc';
$TOC = array();
$TOC_DEPRECATED = array();
$PARENTS = array();
include_once dirname(__FILE__) ."/toc/book.mbstring.inc";
$setup = array (
  'home' => 
  array (
    0 => 'index.php',
    1 => 'PHP Manual',
  ),
  'head' => 
  array (
    0 => 'UTF-8',
    1 => 'es',
  ),
  'this' => 
  array (
    0 => 'mbstring.encodings.php',
    1 => 'Juegos de caracteres soportados',
    2 => 'Juegos de caracteres soportados',
  ),
  'up' => 
  array (
    0 => 'book.mbstring.php',
    1 => 'Strings multibyte',
  ),
  'prev' => 
  array (
    0 => 'mbstring.constants.php',
    1 => 'Constantes predefinidas',
  ),
  'next' => 
  array (
    0 => 'mbstring.ja-basic.php',
    1 => 'Casos de caracteres japoneses',
  ),
  'alternatives' => 
  array (
  ),
  'source' => 
  array (
    'lang' => 'es',
    'path' => 'reference/mbstring/encodings.xml',
  ),
  'history' => 
  array (
  ),
);
$setup["toc"] = $TOC;
$setup["toc_deprecated"] = $TOC_DEPRECATED;
$setup["parents"] = $PARENTS;
manual_setup($setup);

contributors($setup);

?>
<div id="mbstring.encodings" class="chapter">
  <h1 class="title">Juegos de caracteres soportados</h1>

  <table class="segmentedlist">
   <caption><strong>Juegos de caracteres soportados</strong></caption>
   <thead><tr><th>Nombre en el registro IANA</th>
   <th>Juegos de caracteres</th>
   <th>Descripción</th>
   <th>Notas</th>
   </tr></thead><tbody><tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">ISO 10646</td>
    <td class="seg">
     El juego de caracteres universal (<code class="literal">Universal Character Set</code>),
     con 31 bits por caracter, al estándar <code class="literal">UCS-4</code>
     por <code class="literal">ISO/IEC 10646</code>. Está sincronizado con
     la última versión de Unicode.
    </td>
    <td class="seg">
     Si este nombre es utilizado en la herramienta de conversión, el convertidor
     intenta reconocer el texto a partir del último BOM
     (<code class="literal">byte order mark</code>), para conocer el orden
     de los bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">UCS-4</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UCS-4</code>, las cadenas se suponen
     estar en formato big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">UCS-4</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UCS-2</code>, las cadenas se suponen
     estar en formato little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-2</td>
    <td class="seg">UCS-2</td>
    <td class="seg">
     El juego de caracteres universal (<code class="literal">Universal Character Set</code>),
     con 16 bits por caracter, al estándar <code class="literal">UCS-2</code>
     por <code class="literal">ISO/IEC 10646</code>. Está sincronizado con
     la última versión de Unicode.
    </td>
    <td class="seg">
     Si este nombre es utilizado en la herramienta de conversión, el convertidor
     intenta reconocer el texto a partir del último BOM
     (<code class="literal">byte order mark</code>), para conocer el orden
     de los bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-2</td>
    <td class="seg">UCS-2</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UCS-4</code>, las cadenas se suponen
     estar en formato big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Formato de transformación de Unicode, de 32 bits, cuyas cartas
     corresponden al juego estándar Unicode. Este juego no es idéntico
     a <code class="literal">UCS-4</code> porque los caracteres Unicode estaban limitados
     a valores de 21 bits.
    </td>
    <td class="seg">
     Si este nombre es utilizado en la herramienta de conversión, el convertidor
     intenta reconocer el texto a partir del último BOM
     (<code class="literal">byte order mark</code>), para conocer el orden
     de los bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UTF-32</code>, las cadenas se suponen
     estar en formato big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UTF-32</code>, las cadenas se suponen
     estar en formato little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Formato de transformación de Unicode sobre 16 bits. Se debe notar
     que <code class="literal">UTF-16</code> ya no es idéntico a  <code class="literal">UCS-2</code>
     porque un mecanismo fue introducido en Unicode 2.0 y
     <code class="literal">UTF-16</code> ahora hace referencia a un
     codificación de 21 bits.
    </td>
    <td class="seg">
     Si este nombre es utilizado en la herramienta de conversión, el convertidor
     intenta reconocer el texto a partir del último BOM
     (<code class="literal">byte order mark</code>), para conocer el orden
     de los bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UTF-16</code>, las cadenas se suponen
     estar en formato big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Ver arriba.
    </td>
    <td class="seg">
     A diferencia de <code class="literal">UTF-16</code>, las cadenas se suponen
     estar en formato little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-8</td>
    <td class="seg">Unicode / UCS</td>
    <td class="seg">
     Formato de transformación Unicode de 8 bits.
    </td>
    <td class="seg">ninguno</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-7</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Un formato compatible con el correo electrónico de Unicode,
     especificado en <a href="https://datatracker.ietf.org/doc/html/rfc2152" class="link external">&raquo;&nbsp;RFC2152</a>.
    </td>
    <td class="seg">ninguno</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ninguno</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Una variante de <code class="literal">UTF-7</code> que es especialmente utilizada en el
     <a href="https://datatracker.ietf.org/doc/html/rfc3501" class="link external">&raquo;&nbsp;protocolo IMAP</a>.
    </td>
    <td class="seg">ninguno</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     US-ASCII (recomendado) / iso-ir-6 / ANSI_X3.4-1986 /
     ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
    </td>
    <td class="seg">ASCII / ISO 646</td>
    <td class="seg">
     ASCII, <code class="literal">American Standard Code for Information Interchange</code>
     es un formato clásico de 7 bits. También está normalizado internacionalmente,
     bajo el nombre <code class="literal">ISO 646</code>.
    </td>
    <td class="seg">(ninguno)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     EUC-JP (recomendado) /
     Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
    </td>
    <td class="seg">
     Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana) /
     JIS X0208:1990 / JIS X0212:1990
    </td>
    <td class="seg">
     Como se puede ver, el nombre deriva de la abreviatura de
     <code class="literal">Extended UNIX Code Packed Format for Japanese</code>,
     este juego es esencialmente utilizado en plataformas Unix.
     El juego original, <code class="literal">Extended UNIX Code</code>,
     está diseñado sobre la base de <code class="literal">ISO 2022</code>.
    </td>
    <td class="seg">
     El juego identificado por <code class="literal">EUC-JP</code> es diferente
     de <code class="literal">IBM932 / CP932</code>, que es utilizado por
     <code class="literal">OS/2®</code> y Microsoft® Windows®.
     Para intercambiar información con estas plataformas,
     utilice <code class="literal">EUCJP-WIN</code>.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Shift_JIS (recomendado) / MS_Kanji / csShift_JIS</td>
    <td class="seg">Compuesto de JIS X0201:1997 / JIS X0208:1997</td>
    <td class="seg">
     <code class="literal">Shift_JIS</code> fue desarrollado a principios de los años 80,
     y, al mismo tiempo, los primeros procesadores de texto estaban
     en el mercado. Fue hecho para conservar la compatibilidad con
     el juego <code class="literal">JIS X 0201:1976</code>. Según la definición de
     IANA, el juego de caracteres <code class="literal">Shift_JIS</code> es ligeramente
     diferente de <code class="literal">IBM932 / CP932</code>. Sin embargo, los nombres
     <code class="literal">&quot;SJIS&quot;</code> y  <code class="literal">&quot;Shift_JIS&quot;</code> son
     a menudo utilizados erróneamente, para estos juegos.
    </td>
    <td class="seg">Para <code class="literal">CP932</code>, utilice <code class="literal">SJIS-WIN</code>.</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">(ninguno)</td>
    <td class="seg">
     Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </td>
    <td class="seg">
     Aunque este &quot;juego de caracteres&quot; utiliza el mismo juego que
     <code class="literal">EUC-JP</code>, en realidad es diferente. Solo tiene
     algunos caracteres de diferencia.
    </td>
    <td class="seg">ninguno</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-31J / csWindows31J</td>
    <td class="seg">
     Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </td>
    <td class="seg">
     Aunque este &quot;juego de caracteres&quot; utiliza el mismo juego que
     <code class="literal">Shift_JIS</code>, en realidad es diferente. Solo tiene
     algunos caracteres de diferencia.
    </td>
    <td class="seg">(ninguno)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-JP (recomendado) / csISO2022JP</td>
    <td class="seg">
     US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
    </td>
    <td class="seg"><a href="https://datatracker.ietf.org/doc/html/rfc1468" class="link external">&raquo;&nbsp;RFC1468</a></td>
    <td class="seg">ninguno</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">JIS</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-1</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-2</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-3</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-4</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-6</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-7</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-8</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-9</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-10</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-13</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-14</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-15</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-16</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BASE64</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HTML-ENTITIES</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">7bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">8bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-CN</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP936</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HZ</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-TW</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP950</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BIG-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">UHC (CP949)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1251 (CP1251)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1252 (CP1252)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP866 (IBM866)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-R</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-U</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
  </tbody></table>
 </div>
<?php manual_footer($setup); ?>