Японский язык и японские иероглифы

Раздел форума посвященный Локализации (русификации), а так же переводу на другие языки.
Аватара пользователя
bellic
Сообщения: 1003
Зарегистрирован: 11 мар 2017, 07:47
Откуда: Rostov-on-Don
Контактная информация:

Японский язык и японские иероглифы

Сообщение bellic » 11 янв 2018, 09:09

Думаю не лишним будет завести такую тему или лучше даже - целый Раздел с таким названием!?
(я до сих пор к сожалению путаюсь (в нашем форуме) в определении - где у нас Форум, ПодФорум, Раздел, и т.д.... :cry: )
Тем более, что наш форум все таки связан с Японией, японским языком и японскими символами(иероглифами)!
Как вы думаете?

Ну собственно - нужно как то и когда нибудь начинать!?.. :smile:
Не знаю - будем ли мы тут говорить об отдельных фразах или понятиях, но раз уж некоторые любители занимаются "Локализацией", то прежде всего стоит начать разговор с японского алфавита, а точнее - с японских иероглифов.
Японские иероглифы могут обозначать как отдельные звуки, так и целые слова, понятия или выражения!
И еще скажу в предисловии, что этих "Иероглифов" - несметное количество!!! :lol:
На этом мое предисловие прошу считать законченным, а кому интересны подробности - ищите инфу в Интернете сами и на свой вкус!

Ну а теперь я коснусь "Code Pages"(Кодовых Страниц) - т.е. отдельных наборов иероглифов, которые могут встретиться в JDM-магнитолах на поприще "Локализации".

На самом деле - и этих Кодовых страниц превеликое множество, но речь пойдет только от Трех из них:
Shift_JS, CP932 (разработана специально для Windows) и 20932.

● Первые две таблицы (Shift_JS и CP932) очень похожи друг на друга, но все же имеют различия;
● символы(иероглифы) в первых двух таблицах могут кодироваться как Одним, так и Двумя байтами;
● в 20932 - символы могут кодироваться Одним, Двумя или Тремя байтами;

Ну а теперь самое время вставить имеющиеся картинки.. ;)

Shift_JS
Shift_JS.jpg
http://www.kreativekorp.com/charset/encoding.php?name=Shift-JIS

CP932
ср932.jpg
http://www.kreativekorp.com/charset/encoding.php?name=CP932

и Легенда для них:
legenda.jpg
legenda.jpg (32.57 КБ) 3135 просмотров
Для любопытных умов сообщу, что перейдя по соответствующим ссылкам ниже скриншотов - вы сможете изучить таблицы более подробно, забравшись в самые сокровенные их уголки... - реально и интерактивно пощелкать по практически каждому символу и увидеть куда он ведет!

К сожалению, что касается 20932-й Кодовой страницы - на вышеуказанном сайте найти не получится, но в Интернете есть описания о ее содержимом...
(к сожалению на Английском языке,... перевести Гуглом то можно, но при этом могут быть ошибки толкования и неточности... :cry: )

В данный момент ведутся изыскательные работы по данной Кодовой странице... :ugeek:

Ну а пока позволю сюда вставить отдельные ссылки, что бы мне не забыть и Вам почитать на досуге:
1. http://www.sljfaq.org/afaq/encodings.ht ... ngs-EUC-JP
2. http://www.kreativekorp.com/charset/encoding.php
3. http://en.academic.ru/dic.nsf/enwiki/298402
4. https://encoding.spec.whatwg.org/#shift_jis
5.https://encoding.spec.whatwg.org/#euc-jp
6. Extended Unix Code: EUC-JP

Аватара пользователя
NaviGuru
Сообщения: 438
Зарегистрирован: 10 мар 2017, 17:36
Откуда: Tomsk
Контактная информация:

Японский язык

Сообщение NaviGuru » 11 янв 2018, 15:57

согласен. ;) почему бы нет :good: осталось пригласить на форум самих японцев :?

Аватара пользователя
bellic
Сообщения: 1003
Зарегистрирован: 11 мар 2017, 07:47
Откуда: Rostov-on-Don
Контактная информация:

Японский язык и японские иероглифы

Сообщение bellic » 15 янв 2018, 20:53

Вот попробовал перевести информацию о EUC-JP - это вроде и есть она самая 20932-я Кодовая страница...
Extended Unix Code. EUC-JP (Английский):
EUC-JP is a variable-width encoding used to represent the elements of three Japanese character set standards, namely JIS X 0208, JIS X 0212, and JIS X 0201.

* A character from JIS-X-0208 (code set 1) is represented by two bytes, both in the range 0xA1 -- 0xFE.
* A character from JIS-X-0212 (code set 3) is represented by three bytes, the first being 0x8F, the following two in the range 0xA1 -- 0xFE.
* A character from the "upper half" of JIS-X-0201 (half-width kana, code set 2) is represented by two bytes, the first being 0x8E, the second in the range 0xA1 -- 0xDF.
* A character from the "lower half" of JIS-X-0201 (ASCII, code set 0) is represented by one byte, in the range 0x21 -- 0x7E.

This encoding scheme allows the easy mixing of 7-bit ASCII and 8-bit Japanese without the need for the escape characters employed by ISO-2022-JP, which is based on the same character set standards.

In Japan, the EUC-JP encoding is heavily used by Unix or Unix-like operating systems (except for HP-UX), while Shift_JIS or its extensions (Windows code page 932 and MacJapanese) are used on other platforms. Therefore, whether Japanese web sites use EUC-JP or Shift_JIS often depends on what OS the author uses.

EUC-JISX0213 is similar to but different from EUC-JP in that two planes of JIS-X-0213 take place of JIS-X-0208 and JIS-X-0212. There is a similar relationship between Shift_JIS and Shift-JISX0213
А теперь - перевод от Google-Translate (пока без моей правки):

EUC-JP - это кодирование с переменной шириной, используемое для представления элементов трех японских стандартов набора символов, а именно JIS X 0208, JIS X 0212 и JIS X 0201.

* Символ из JIS-X-0208 (код 1) представлен двумя байтами, как в диапазоне 0xA1 -- 0xFE.
* Символ из JIS-X-0212 (код 3) представлен тремя байтами, первый из которых равен 0x8F, следующие два в диапазоне 0xA1 -- 0xFE.
* Символ из «верхней половины» JIS-X-0201 (полуширина kana, код 2) представлен двумя байтами, первый из которых равен 0x8E, второй - в диапазоне 0xA1 -- 0xDF.
* Символ из «нижней половины» JIS-X-0201 (ASCII, код 0) представлен одним байтом в диапазоне 0x21 -- 0x7E.

Эта схема кодирования позволяет легко смешивать 7-битные ASCII и 8-битные японцы без необходимости использования символов escape, используемых ISO-2022-JP, который основан на тех же стандартах набора символов.

В Японии кодирование EUC-JP в значительной степени используется Unix или Unix-подобными операционными системами (кроме HP-UX), в то время как Shift_JIS или его расширения (кодовая страница Windows 932 и MacJapanese) используются на других платформах. Поэтому, независимо от того, используют ли японские веб-сайты EUC-JP или Shift_JIS, зависит от того, какую ОС использует автор.

EUC-JISX0213 похож на EUC-JP, но отличается от EUC-JP тем, что две плоскости JIS-X-0213 имеют место JIS-X-0208 и JIS-X-0212. Аналогичная связь между Shift_JIS и Shift-JISX0213


Аватара пользователя
bellic
Сообщения: 1003
Зарегистрирован: 11 мар 2017, 07:47
Откуда: Rostov-on-Don
Контактная информация:

Японский язык и японские иероглифы

Сообщение bellic » 15 янв 2018, 21:01

Ну в принципе - очень даже не плохо!? - я имею ввиду то как справился Гугл с переводом! :grin:
А у нас ведь вроде имеются в совершенстве владеющие Английским :?:
Или я ошибаюсь? ;)
Вот бы малость подчистить шероховатости в переводе!... :oops:

Еще больше информации по японским Кодовым страницам есть тут:
http://www.sljfaq.org/afaq/encodings.ht ... onversions
Но я пока не буду ее сюда выкладывать и переводить!

P.S. Не сильно много я Болдов поставил в форматировании? Не напрягает?

Аватара пользователя
vitecd
Сообщения: 173
Зарегистрирован: 12 июл 2017, 06:29
Откуда: Auckland, NZ
Контактная информация:

Японский язык и японские иероглифы

Сообщение vitecd » 21 янв 2018, 08:15

а зачем эта информация? я в прошивках встречал только две кодировке. Или есть места, где используется больше?

Аватара пользователя
bellic
Сообщения: 1003
Зарегистрирован: 11 мар 2017, 07:47
Откуда: Rostov-on-Don
Контактная информация:

Японский язык и японские иероглифы

Сообщение bellic » 21 янв 2018, 11:58

vitecd писал(а):
21 янв 2018, 08:15
а зачем эта информация? я в прошивках встречал только две кодировке. Или есть места, где используется больше?
Тебе возможно эта инфа и не нужна! :grin:
Хотя ты мог бы оказать большую помощь в корректировке Гуловских переводов Мануалов по Кодовым страницам!
А какие именно ты встречал кодировки в прошивках?
Есть прошивки, в которых одновременно встречаются кодировки как 932, так и 20932!
Данная информация может быть полезна для программистов, разбирающих прошивки, если конечно они когда нибудь появятся на нашем форуме! :cool:

Ответить

Вернуться в «Локализация (переводы)»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 5 гостей