<?php
include_once $_SERVER['DOCUMENT_ROOT'] . '/include/shared-manual.inc';
$TOC = array();
$TOC_DEPRECATED = array();
$PARENTS = array();
include_once dirname(__FILE__) ."/toc/book.xml.inc";
$setup = array (
  'home' => 
  array (
    0 => 'index.php',
    1 => 'PHP Manual',
  ),
  'head' => 
  array (
    0 => 'UTF-8',
    1 => 'pt_BR',
  ),
  'this' => 
  array (
    0 => 'xml.encoding.php',
    1 => 'Codifica&ccedil;&atilde;o de caracteres',
    2 => 'Codifica&ccedil;&atilde;o de caracteres',
  ),
  'up' => 
  array (
    0 => 'book.xml.php',
    1 => 'Analisador de XML',
  ),
  'prev' => 
  array (
    0 => 'xml.error-codes.php',
    1 => 'C&oacute;digos de Erro',
  ),
  'next' => 
  array (
    0 => 'xml.examples.php',
    1 => 'Exemplos',
  ),
  'alternatives' => 
  array (
  ),
  'source' => 
  array (
    'lang' => 'pt_BR',
    'path' => 'reference/xml/encoding.xml',
  ),
  'history' => 
  array (
  ),
);
$setup["toc"] = $TOC;
$setup["toc_deprecated"] = $TOC_DEPRECATED;
$setup["parents"] = $PARENTS;
manual_setup($setup);

contributors($setup);

?>
<div id="xml.encoding" class="article">
 <h1 class="title">Codificação de caracteres</h1>

 <p class="para">
  A Extensão XML do PHP suporta o conjunto de caracteres <a href="http://www.unicode.org/" class="link external">&raquo;&nbsp;Unicode</a> definido por
  diferentes <span class="glossterm">codificações de caracteres</span>
  diferentes. Há dois tipos de codificação de caracteres, <span class="glossterm">codificação
  da fonte</span> e <span class="glossterm">codificação do destino</span>.
  A apresentação interna do PHP do documento é sempre codificada
  com <code class="literal">UTF-8</code>.
 </p>
 <p class="para">
  Codificação na fonte é feita quando um documento XML é <a href="function.xml-parse.php" class="link">analisado</a>. Ao <a href="function.xml-parser-create.php" class="link">criar um analisador
  XML</a>, uma codificação na fonte pode ser especificada (esta codificação
  não poderá ser alterada mais tarde durante a atividade do analisador XML). As
  codificações na fonte suportadas são <code class="literal">ISO-8859-1</code>,
  <code class="literal">US-ASCII</code> e <code class="literal">UTF-8</code>. As duas
  primeiras são codificações de um byte, o que significa que cada
  caractere é representado por um único byte.
  <code class="literal">UTF-8</code> pode codificar caracteres compostos por
  um número variável de bits (até 21) em um a quatro bytes. A
  codificação na fonte padrão usada pelo PHP é
  <code class="literal">ISO-8859-1</code>.
 </p>
 <p class="para">
  Codificação no destino é feita quando o PHP passa dados para as funções
  do analisador XML. Quando um analisador XML é criado, a codificação no destino
  é definido como a mesma da fonte, mas isto pode ser
  alterado a qualquer momento. A codificação no destino afetará dados de caracteres
  e também nomes de etiquetas e alvos de instrução de processamento.
 </p>
 <p class="para">
  Se o analisador XML encontrar caracteres de fora da faixa na qual
  sua codificação na fonte seja capaz de representar, ele retornará
  um erro.
 </p>
 <p class="para">
  Se o PHP encontrar caracteres no documento XML analisado que não
  possam ser representados na codificação de destino escolhida, os caracteres com
  problema serão &quot;rebaixados&quot;. Atualmente, isto significa que tais caracteres serão
  substituídos por um sinal de interrogação.
 </p>
</div>
<?php manual_footer($setup); ?>