Что такое код udm_check_charset

Содержание

��� ����� ��� udm_check_charset

(PHP 4 >= 4.2.0, PHP 5)

udm_check_charset — Check if the given charset is known to mnogosearch

Description bool udm_check_charset ( resource agent, string charset )

К настоящему времени эта функция еще не была документирована; для ознакомления доступен только список аргументов.

����� �����

� ��������� �������������� � ������� ��� ����� ������ ��������.

� ������������� ������� ����������� ��� �������� ����� ������� � ��������� �������������� ������.

� ������������� �������� ��� ������������ ���� �������������� �������������� � �������.

������������ � ������ ������� �����������-�������������, �Winning the Hearts: ����������� �� ������ ����������� ������� �������� � ������� ������� � ���, ��� ��������� ������ ����������� � ���������� ������������� ��������� ������������� � �������� � ���������� ������� ������, ������ � �������� ������������ ��������� ��������. ����������� �������� ���������� ������������ ����������� ����������: ������ ������� ����������� �� ����� ������ ���������� �������� �������, ��� ������ � ��������������, � ������, ������� �� ������ � ���� ��� �� Wow, ��� Must�.

udm_check_charset

Внимание

udm_check_charset — ���������, �������� �� ������ charset/����� �������� � mnogosearch.

��������

int udm_check_charset (int agent, string charset)

������� ���
����������

��� ������� � ��������� ����� ��� �� �����������������; ������� ������ ������ ����������.

������ �������� � ���������� ����������: accept-charset

���������� � ����� ���������: ������ ������������ ���� �� ����� � ������������� accept-charset, ���� ���������� ������ �������. ������ � ���� ������� �������� � ������� ����������� REST API �������, �� ������������ �� ���� ����������� ���� �XML response is broken for . �. �������� ������� �������� � GUI � ������������ ���������� ������������ ����. ����� ��� ��� ���� �������, �������� ��?

��� ����� accept-charset ����� ���� ��� ����� ������� � W3C �� ���� ������ (http://www.w3.org/TR/html401/interact/forms.html#adef-accept-charset)

������� ������ ���������� ��������:

� � ��� ���� ����
� �� ������� � meta ��������� utf-8
� �� ��������� ��������� ����� �� ������ � utf-8 (����, ������, ������)
�� ����������: �������� �� ����, ����������� � ����� � ��� �������. ������ �������� � ���, ��� ������ ��������:
1. � ����������� ������� � �������� ����� ��������������� ��������� � ��� ���� ��������� ������ ������ �� ��������� �����
2. ���� ����, ������� ���������� ���� ��������� �������
3. ���� �������� ���������� � ����� ������
4. ������: ����, ���� ��� ������������ � ��

��� �� ���������� � ����� ������ ��� ���������� ��������� �������� � ���� FORM:
1. �������� ��� ����
2. ������� � �������� ���������, ����� ��� ����� ISO-8859-1
3. ���������� ������ ������ �� ������� ���, ��������: ��������, � �������������� ��������; ������ ����� ������ � ���������� ����. �������
4. ��������� ���� �����
5. �������� ���� ������ � ���� ������ � ���������� � ����� ��������� ������ ���� ���� ������� � ��� ��� ���� ���������� ��������� ������

�����: � ��� ������� ����� � ��������� ISO-8859-1 ������ ��� ������� ������� ���������� � ������������ ������������������ � ����������� ���������, � ��� ������, ��� ���� ������ ������� ISO-8859-1, �� ������� ���������� � ���������� ISO-8859-1 ��� �������� ������ �� �����

��� � ���� ��������?

���������� � ��������� ������: ��, ������ accept-charset=�utf-8� � ���� FORM ������ ��� �� ���� ���������� ��������. ������ ������� ���� �������� ����������� �������� � ���, ��� ������ �� ����� ������� ���������� ������ � ��������� utf-8 � ������� ������

�����: ��� ���������� � ������, � ������� ����� � ���� ����� ����������.

������� ���������/Source-charset (������� �������� ���������) /source-charset (Set Source Character Set)

��������� ������� �������� ��������� ��� ������������ �����. Lets you specify the source character set for your executable.

��������� Syntax

��������� Arguments

IANA_name IANA_name
��� ������ ��������, ������������ IANA. The IANA-defined character set name.

���� CPID
������������� ������� �������� � ���� ����������� �����. The code page identifier as a decimal number.

���������� Remarks

� ������� ��������� ������� ���������/Source-charset ����� ������� ����������� ��������� ���������, ������� ����� ��������������, ���� �������� ����� �������� �������, �� �������������� � �������� ��������� ���������. You can use the /source-charset option to specify an extended source character set to use when your source files include characters that are not represented in the basic source character set. �������� ��������� � ��� �����������, ������������ ��� ������������� ��������� ������ ��������� �� ���������� �������������, ������� ������������ � �������� ������� ��� ������ ��������������� ��������� ����� �����������. The source character set is the encoding used to interpret the source text of your program into the internal representation used as input to the preprocessing phases before compilation. ����� ���������� ������������� ������������� � ����� �������� ���������� ��� �������� ����� � ���������� �������� � ����������� �����. The internal representation is then converted to the execution character set to store string and character values in the executable. ��� �������� ������������ ��������� ����� ������������ ��� IANA ��� ��������� ISO, � ����� ����� (.) � ������� �������� � 3 �� 5 ����. You can use either the IANA or ISO character set name, or a dot (.) followed by a 3 to 5 digit decimal code page identifier to specify the character set to use. ������ �������������� ��������������� ������� ������� � ���� ������� �������� ��. � ������� �������������� ������� �������. For a list of supported code page identifiers and character set names, see Code Page Identifiers.

�� ��������� Visual Studio ������������ ����� ������� ���������� ������, ����� ����������, ����� �� �������� ���� ������ � ��������� ������, �������� UTF-16 ��� UTF-8. By default, Visual Studio detects a byte-order mark to determine if the source file is in an encoded Unicode format, for example, UTF-16 or UTF-8. ���� ����� ������� ������ �� �������, ��������������, ��� �������� ���� ���������� � ������� ������� �������� �������� ������������, ���� �� ������� ��� ��������� ��� ������� �������� � ������� ��������� ������� ���������/Source-charset . If no byte-order mark is found, it assumes the source file is encoded using the current user code page, unless you specify a character set name or code page by using the /source-charset option. Visual Studio ��������� ��������� C++ �������� ��� � ������� ����� �� ���������� ��������� ��������. Visual Studio allows you to save your C++ source code by using any of several character encodings. �������������� �������� � ���������� ��������� ���� � ���������� ��. � ������� ������ �������� � ������������ �� �����. For more information about source and execution character sets, see Character Sets in the language documentation.

��������� �������� ��������� ������ ������������ 7-��������� ������� ASCII � ���� �� �������� ������� � ������ ��������, ��� �� ����� ��������� ������ ������ ����������. The source character set you supply must map the 7-bit ASCII characters to the same code points in your character set, or many compilation errors are likely to follow. ��������� ��������� ���� ������ ����� ���� ��������������� �� ����������� ��������� ������� ��������� � UTF-8. Your source character set must also be mappable to the extended Unicode character set encodable by UTF-8. �������, �� ��������� � UTF-8, ������������ ������������, ��������� �� ����������. Characters that are not encodable in UTF-8 are represented by an implementation-specific substitute. ���������� ���������� ���������� �������������� ���� ��� ���� ��������. The Microsoft compiler uses a question mark for these characters.

���� �� ������ ������ ��������� ��������� ���� � ��������� ���������� UTF-8, ����� ������������ � �������� ������ �������� ����������� /UTF-8 . If you want to set both the source character set and the execution character set to UTF-8, you can use the /utf-8 compiler option as a shortcut. �� ������������ �������� ������� ���������/Source-Charset: UTF-8/Execution-Charset: UTF-8 � ��������� ������. It is equivalent to specifying /source-charset:utf-8 /execution-charset:utf-8 on the command line. ����� �� ���� ���������� ����� �������� �������� /Validate-charset �� ���������. Any of these options also enables the /validate-charset option by default.

��������� ������� ��������� ����������� � ����� ���������� Visual Studio To set this compiler option in the Visual Studio development environment

�������� ���������� ���� ���� ������� �������. Open the project Property Pages dialog box. ��������� ��. � ������ ��������� ����������� C++ � ������� ������ � Visual Studio. For more information, see Set C++ compiler and build properties in Visual Studio.

���������� ����� �������� ������������, C/C++ , ��������� ������ . Expand the Configuration Properties, C/C++, Command Line folder.

� ���� �������������� ����������������� �������� ������� ���������/Source-charset � ������� ���������������� ���������. In Additional Options, add the /source-charset option, and specify your preferred encoding.

�������� �� ��� ���������� ��������� ���������. Choose OK to save your changes.

HTML Meta Charset � ����������� ��������� �����

����� ������: ������ ���������

��� �������� ����� � ���������� ���-�������� ����� ���������� �������: � ����� ��������� ������ ����, ��� ���������� UTF-8 �� windows-1251 � ��� �� ����������� � META Charset HTML-�������� �����. ������ �� ��� ��� ������� � ������ ������.

��� ����� ��������� ����� � ��� ��� ��������

��������� ����� ����������� � ���� �������, ��������� �� ������ ����, ���� � ������ �������� �������� ��������, ������� ������������ ������������ �������. ����� �� ���������� ��������� ����, � ������� ��������� � ��� ����� HTML-��������, �� ��������� ��������� �� ��������� ����� � ����� ��������� �� ��� �������� � ������� ����� � ��������������� ��������� �������������� ������������ ������ � ��� �������� �������� ����������� ��� ������ � �������� ���������. ���� ���������� � ��������� �� ��������� ����� ��������� � ���������� � ������� ��������� ������ � HTML-��������, �� ������������ ����� ��������� ��� �����, ����� � ������ �������. ���� �� ���� ������������, �� � ���������� ������������ ��������� ���������� ����� ��������, �������� ����� ��� ���������� � ������ �������� ����������. ���� ������������ ������� ������ � ����������� ������������, �� ������ ��������� ������ ���������, ������ ���������� ������� � ������� ��, � ������� �������� ������, � � ���������� ���������� ����� �������� ������������ � �������� �������� �����.

�� �� ����� ���������� � � HTML-���������� �����. ���� �������� ��� ��������, ��������, � ��������� UTF-8, � � ����� ��������� �������� META-��� ����������� ��� ��� ��������� windows-1251, �� ������� ����� �� ����� ������������ ����������� � ����� ������ � �������� ��������� ��� ��������� � ��� ��� ������� ������������ ��-�������, �� ������� ������� ������ ���������� ������ ���������� ����� �������� ��� �� ����� ���� ����� ���� � ���������� ����, � ������ ����� ��� ������� ����� ����������, ��������, � ���� ������ �������. ��� ���� ��������� ��������� � ��� ����� � � ����������� ���� ������.

�������� ����� �������� � ��������� ��������� ����� ����� ��������� ��� ������� ������ ���������. ����������� ��������� ��������� ������������� ����� ��������� ��������� �� ����� ��������� � ������, � ����������� ������� ��������� ������� ��������� ������ ��� ���������� �����.

����� ���������������� ���������

�� ����������� ������ �� ��� ������ ��� ����� ��������� � ������ ��������� ����� ��������� ��������� �� � ���� ������� �����. ������� ������ ������� ����� �� ��������� ��������� ����� ������� ��� �������� �����. ��������� ����� ���������������� � �������� �������� � �������� ������ ���� ������������ ������� Windows, �� ����������� ���-������������� ��������� HTML-�������� � ��������� windows-1251 (ANSI), ������� �������������� ��-���������. �� windows-1251 ������������ �� ����� ������� ���������� ���� � ��������, � ������������ ����� ������������ � ����� ������� ��������� ���������, ��������, ���������� � ������ �������, � ��� ����� ���� ������������� ��������� ����� �� ������ ������ � ����� ���������, ������� �� ����� �� ��� ����� ������ ����� ����������� UTF-8 � ����������� ������������� ���������� ������ ��� ���������.

�������� � ���������� �� ������ � HTML-��������

����, ���������� �� ���� �������� �� �� ������ ������� ����������� HTML-���������� ��� ������� ������������ �������� ������������ �������� �� ����, ����������� �� ���-�������, ������� ����� �������� � ������������ ����������. � ���� ������ ������ ���������� � ����� ���������, � ���� �������� ��� ������� ��������� � ������ ���������, �� ����� �� ����� ���� �������� � ������������ ������� � �������� ������������. ������ �������� ��������� ������ ��������� � ������� ��������� � ������������ � ���, ������� ������������ � ������ �����, ����� ������ ���������� ��� �� ��������� �� � ����� .htaccess, ���� �� �������� ������������ ���������� ���-������ Apache.

����������� �� ���� ����������� ���� �� ��������� ��� ������������� ���� ������ MySQL � ��� ����� ����� ����� ���������� ������� � ����������. ���� ����� ����� ��������� � ����� ���������, � ���������� � ���� ������ � ������, �� �� �������� �� ����� ����������, ������� ��������� �� ���� ������ ����� ������������ � ���� ��� ��� �� ������ �������� ��� ������ ���������� ��������. ����� �������� ������� � ���������� ��� ������ ���� ���������� ��� ���-�������, ���� ������ MySQL, � ��������, � HTML-��������� ����� � � META-����, ������� ������������� � HTML-����. ���� ���� �������� � ������������ ������, �� ���������� �� ������� �������� ��� ���� �������������.

META Charset HTML-���������

����� �������� �������� � ��������� �������� � ����� ��������� ��������� �������� ����� � �� ���� ������������� META Charset.

��� ��������� windows-1251:

��� ��������� UTF-8:

������ �� ������ ��� ����� ��������� ����� � ��� ������ �������� ���� � �����-���� ����� ����� ����������� ������������ �����.

������ ������ �� ���� � ������� ������ �� HTML � CSS

HTML Meta Charset � ����������� ��������� �����

����� ������: ������ ���������

��� �������� ����� � ���������� ���-�������� ����� ���������� �������: � ����� ��������� ������ ����, ��� ���������� UTF-8 �� windows-1251 � ��� �� ����������� � META Charset HTML-�������� �����. ������ �� ��� ��� ������� � ������ ������.

��� ����� ��������� ����� � ��� ��� ��������

��������� ����� ����������� � ���� �������, ��������� �� ������ ����, ���� � ������ �������� �������� ��������, ������� ������������ ������������ �������. ����� �� ���������� ��������� ����, � ������� ��������� � ��� ����� HTML-��������, �� ��������� ��������� �� ��������� ����� � ����� ��������� �� ��� �������� � ������� ����� � ��������������� ��������� �������������� ������������ ������ � ��� �������� �������� ����������� ��� ������ � �������� ���������. ���� ���������� � ��������� �� ��������� ����� ��������� � ���������� � ������� ��������� ������ � HTML-��������, �� ������������ ����� ��������� ��� �����, ����� � ������ �������. ���� �� ���� ������������, �� � ���������� ������������ ��������� ���������� ����� ��������, �������� ����� ��� ���������� � ������ �������� ����������. ���� ������������ ������� ������ � ����������� ������������, �� ������ ��������� ������ ���������, ������ ���������� ������� � ������� ��, � ������� �������� ������, � � ���������� ���������� ����� �������� ������������ � �������� �������� �����.

�� �� ����� ���������� � � HTML-���������� �����. ���� �������� ��� ��������, ��������, � ��������� UTF-8, � � ����� ��������� �������� META-��� ����������� ��� ��� ��������� windows-1251, �� ������� ����� �� ����� ������������ ����������� � ����� ������ � �������� ��������� ��� ��������� � ��� ��� ������� ������������ ��-�������, �� ������� ������� ������ ���������� ������ ���������� ����� �������� ��� �� ����� ���� ����� ���� � ���������� ����, � ������ ����� ��� ������� ����� ����������, ��������, � ���� ������ �������. ��� ���� ��������� ��������� � ��� ����� � � ����������� ���� ������.

�������� ����� �������� � ��������� ��������� ����� ����� ��������� ��� ������� ������ ���������. ����������� ��������� ��������� ������������� ����� ��������� ��������� �� ����� ��������� � ������, � ����������� ������� ��������� ������� ��������� ������ ��� ���������� �����.

����� ���������������� ���������

�� ����������� ������ �� ��� ������ ��� ����� ��������� � ������ ��������� ����� ��������� ��������� �� � ���� ������� �����. ������� ������ ������� ����� �� ��������� ��������� ����� ������� ��� �������� �����. ��������� ����� ���������������� � �������� �������� � �������� ������ ���� ������������ ������� Windows, �� ����������� ���-������������� ��������� HTML-�������� � ��������� windows-1251 (ANSI), ������� �������������� ��-���������. �� windows-1251 ������������ �� ����� ������� ���������� ���� � ��������, � ������������ ����� ������������ � ����� ������� ��������� ���������, ��������, ���������� � ������ �������, � ��� ����� ���� ������������� ��������� ����� �� ������ ������ � ����� ���������, ������� �� ����� �� ��� ����� ������ ����� ����������� UTF-8 � ����������� ������������� ���������� ������ ��� ���������.

�������� � ���������� �� ������ � HTML-��������

����, ���������� �� ���� �������� �� �� ������ ������� ����������� HTML-���������� ��� ������� ������������ �������� ������������ �������� �� ����, ����������� �� ���-�������, ������� ����� �������� � ������������ ����������. � ���� ������ ������ ���������� � ����� ���������, � ���� �������� ��� ������� ��������� � ������ ���������, �� ����� �� ����� ���� �������� � ������������ ������� � �������� ������������. ������ �������� ��������� ������ ��������� � ������� ��������� � ������������ � ���, ������� ������������ � ������ �����, ����� ������ ���������� ��� �� ��������� �� � ����� .htaccess, ���� �� �������� ������������ ���������� ���-������ Apache.

����������� �� ���� ����������� ���� �� ��������� ��� ������������� ���� ������ MySQL � ��� ����� ����� ����� ���������� ������� � ����������. ���� ����� ����� ��������� � ����� ���������, � ���������� � ���� ������ � ������, �� �� �������� �� ����� ����������, ������� ��������� �� ���� ������ ����� ������������ � ���� ��� ��� �� ������ �������� ��� ������ ���������� ��������. ����� �������� ������� � ���������� ��� ������ ���� ���������� ��� ���-�������, ���� ������ MySQL, � ��������, � HTML-��������� ����� � � META-����, ������� ������������� � HTML-����. ���� ���� �������� � ������������ ������, �� ���������� �� ������� �������� ��� ���� �������������.

META Charset HTML-���������

����� �������� �������� � ��������� �������� � ����� ��������� ��������� �������� ����� � �� ���� ������������� META Charset.

��� ��������� windows-1251:

��� ��������� UTF-8:

������ �� ������ ��� ����� ��������� ����� � ��� ������ �������� ���� � �����-���� ����� ����� ����������� ������������ �����.

������ ������ �� ���� � ������� ������ �� HTML � CSS

�������� ��������� �������� ��������� ���������

���������

Intended audience: ������������, ������������� XHTML/HTML (��������� ��������� ��� �������), ������������ �������� (PHP, JSP, � �.�.), ��������� ���-��������, � ������, ��� ����� ������, ��� ��������� ��������� �������� ���������.

Question

��� � ���� ��������� ��������� �� ����������� �������� ����� ��������� ��������� W3C HTML ���������?

Answer

����� ���������, ��� ��� ���������� ��������� ����� ��� ��������� ���������� � ����������������, ����� ����� ��������� ������� ��������� �������� (‘charset’). ���� �� �������� ��� ��������� — ������������ W3C ������ �������� ��������. ��������� ������ ���������� ��������� �������� � HTTP ���������� � ���������� � ���������. ���� ��������� �� � ��������� ���������� ���������, �� � ����� ����� ������� �� �������� ����������� ���������� � ������� ��������������� ���� ‘���������’ (������).

�� �����, ��������� �� ��������, ���� ���� ������������ ��� ��������� ������������ �����������. ������� ����� � ���, ��� ����� ��������� ����� ������, � ��������� ��������� ������ ��������� �������� � �� ����� ������ ����� �� ����� �������������� ����� ��� ���. ����� ���������, ��� �� ������ ���������� �����������, ������� ��������, ��� �������� ����� ��������� ������������ ��� ���������, ����������� ��������� ������:

���� ��������� ��� ����������� �����������: US-ASCII , UTF-8 , UTF-16 , ��� iso-2022-jp (Japanese JIS), � ��������� �� �������� �� �������� � ����������, �� ���� ����� ������� ����������� ����, ��� ����������� ��������� ���������. �������� ��������, ��� US-ASCII �������� ������� ������������� ��������� UTF-8 , � �������, ���� US-ASCII ��������, �� UTF-8 ����� ����� ��������.

��� ������ ������� ����������� ��������� ���������� ��������. �������� ����� Show Source (�������� ��������) � Extended Interface (������������ ����������) ����������, � ��������� ��������� �� ������������ � ������ non-ASCII �������. ��� ������� �� ����������� ������, ���, ��� �������, ����� ������� ���������� ������. ��� ������� �� ���������� ����� �� ����� ����������� non-ASCII ���������, ��� ����� ���� ����� ������� �������.

��������, ���� �� �������� ���������������� ������� �������� W3C ��� iso-8859-1, ���, ��������, �������� ������������ �������� ����� �� ����� ��� ����, ����� ����� ����� �����, ��� ‘�’ � ‘�’ � �������, ��� ��� ������������ �����. (�������, �� ��������, � ������ ������ ��������� ����������, ��� ��� ������������ � UTF-8, � ������� �� ����� ���� ��� �� ����� ���-�� ��� ���������.)

� ��������� ������� ����� ��� ���� ��������� ����� ��������� ������������ ������� � ���������. ��������, ���� ��������� ���������� ����� iso-8859-1 (Latin-1, �������� ������) � iso-8859-2 (Latin-2, ��������� ������), � ������ ��������� � ���� �����. ���� ����� ���������� ��������, �� �� ������ ����� �������, �� ����� ����� ����� ����������. ������� �������� ���� ��������� � ����� ������ ������� ������ � � ����� ������ ���������� �������������� �������� ��������� ������ ������ ���������� ������ ����� ������ ��������� ���������� �� �����������.

���� �� ���� �� ������������ ����������� ��������� �� ��������, �� �� ���� ������ �������� � ���������, ������� ��������� (����) �� ������������, ��� ���-��, ����� � ���������� ��������� ���������� �������� �� ��������. � ������ ������, �������� �� validator mailing list (������ �������� ����������) (public archive (������������ �����)), ����� ���� ��������� �������� ��������. � ��������� ������, �� ������ ��������� ���� ��������, ��� ��� ������ ���-�������� ����� ������������ ������ ���� ��������� ��������.

By the way

��������� �� ����� �������� ��� ���������� � ��������� ������ ��� SGML ��� XML �������� �������� �� �������� ������������������� �������� � ���������, �� ��, ��� ��������� ��������� � �������� ������� ������ — ������ ������������������ ������. ������ ����������� �������� ��������� ���������� ���������� ����� � �������. � �����, ��� �� �� ����� ������������� ��� ���� ������ ����� ����������, ������� ��������. ���� ������� ���������� �� ���������, �� ��� ������� ����� ���������� ������������ ����������.

��������� ������ ��� ����� �������������� �� ���������� ����������� � UTF-8, � ���������� UTF-8 ���������. ���� �������������� � UTF-8 �� ������� ������, ��� ��������� ������������������ ������ �� ����� ��������� �� ������� ����������, �� ��������� ������ ��������� �� ������. � UTF-8 ��� ���������� �� �����, ��������� ��������� ������������� �� ������ UTF-8 ������������������ ������ ������������.

�������� ��������, ��� ���������� �������� ���-�������� � ������� �������� ��� ������������� ��������� ����� �����������, ���������:

  • ��������� �������� ���������� ������������� ������� ��������� ����������� ��������.
  • ������ ������� ����� ���������, ������� ������������ ��� ������������ �������, � ���� �� ��������� �������� ����� ���������� ���������� ��������, �� �� �� �������, ��� �������� � ������� ����������� � ��������� �� �������.
  • ����� ������ �� ��������, ���� ��� ����� � ��������� (�������� ����� �������� alt � ), ������� ����� ���������.

Further reading

����������� ��������� ������� (charsets) � IANA (�������� ������� ����� ���������, ��� ������ �������������, �, ���������, ������� ����� �����, � �� ���������)

FoxTools v.2.0

������, �����! ��� IP: 188.64.174.135

������������� ������� ������

��� ����� ���������?

��������� (������� ��������) � ��� ����� ����, ��������������� ��������� �������. ��� ������� �� ������� ��������� ������������ ��������� ������ ������������.

� ������ ������� � �������� ����� �������������� ������ ������� ��������.

��� ����������� ������������� ������� ������������ ���������: Windows-1251, KOI8, MacCyrillic, � ����� ������������� ������� �������� — ������ (UTF-8).

������ ���������� ��������� ��� ���?

������������� ������� ������ �������� ������������� ���������� ������� �������� ������. ��� ����, ������������ ������������ ������� ������ ������������ ����� ������� �������� ����������. ��� ���������� ����� ������� ���������� ���������� ���������� ��������� ����� �����������, ��� ������� ������� ��� ������ ����������� ���� ������� �������. ���� �������� ����� ���� ����������, �� � ������ ����� ������� ������ ��������� ������������� ������, � ����� ���������� ����� ������. � ����������� �������, ������������� ������ ���������� ��������� ������ ���������.

���� �������� �� HTML5

��� ���������� ������ ������� ����� ��������� HTML5.

����������, �������������� ���������, ������� ������������ HTML5. ������ ����������� �������� ������������ HTML5. ��������:

��� ��������� ��������� ������ � Java?

� ���� ���������� � ������� ���������� � ������������ �� LDAP, � ������ ������ ��� ������������ ������ � ������������ ���������. ��������:

�� ����� ����� ���� �� ���������� ��� ������� ����� � ��������� ���������. ���� ��� ������������ ����������, ��� ����������� � ���� ������. ���� ���� � ������ �������� � db, ��� �� ����� ��������.

� ���� ��������� ��� �� ����������, ������ ���

������, ���� � ���� ������������ ��� ��� ������, ���������� ������� �� ������� ����� (��������, «����61 ��������61» ), � ������� ���-�� ����� ����� «. 61. 61».

������ �� �� ���������� ���-��, ��� ����� ���������� ��������� ������?

������ � java, AFAIK, �� ��������� �������� ��������� — ��� ������ �������� ������ �����-���� ����� � �������. �� ������ ���������� ��������� ��������� ������/������ — ��� ������ � �����, ��� ��� ����� String.toBytes() ������� �������.

� ������, ���� �� ������ �������� ����� �����, �� �������� �� �������, �� ������ ��������� ��� ����� ���-�� ����� �����: http://code.google.com/p/juniversalchardet/

���� ����� ������ ���������� ���������, � �����

���� ���� ������ LDAP ��������� �����������. ����������, ���������� ������ � ����, ������ ������������� � ��������� ��������� ������ ��������, � ����� ������, ������ �����, UTF_16. �������� ��������. ��� ������ ����������� ��������� — �������.

����������, ������������ ��������, �������� ������������, ������� ����� ������������, ����� ��������� ��� ����������, � ����� ��������� ������������� � ������ ���������, ����� ??��� UTF_16.

��������� UTF-8 �� ��������, ��������� ? ������ ������� ����

������ ����, ��������, ���!!

������� � ��������� � ��� � ���� � ��� ����� ��������� ����� ��������

1. ��������� ��������� UTF-8 � HTML (meta charset);
2. ��������� ��������� � PHP (header charset);
3. ��������� ��������� � ����� .htaccess — AddDefaultCharset UTF-8 ;
4. ��������� ��������� ��������� � ��������� � UTF-8, � UTF-8 without BOM;
5. ���� ��������� ������ ‘russian’

��� ��� ����� ����������� �������, ���� ������ ��������.

Илон Маск рекомендует:  Как сделать upcase русских букв
Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL
��������������!