Японский язык и японские иероглифы
- bellic
- Сообщения: 1505
- Зарегистрирован: 11 мар 2017, 07:47
- Откуда: Rostov-on-Don
- Контактная информация:
Японский язык и японские иероглифы
(я до сих пор к сожалению путаюсь (в нашем форуме) в определении - где у нас Форум, ПодФорум, Раздел, и т.д.... )
Тем более, что наш форум все таки связан с Японией, японским языком и японскими символами(иероглифами)!
Как вы думаете?
Ну собственно - нужно как то и когда нибудь начинать!?..
Не знаю - будем ли мы тут говорить об отдельных фразах или понятиях, но раз уж некоторые любители занимаются "Локализацией", то прежде всего стоит начать разговор с японского алфавита, а точнее - с японских иероглифов.
Японские иероглифы могут обозначать как отдельные звуки, так и целые слова, понятия или выражения!
И еще скажу в предисловии, что этих "Иероглифов" - несметное количество!!!
На этом мое предисловие прошу считать законченным, а кому интересны подробности - ищите инфу в Интернете сами и на свой вкус!
Ну а теперь я коснусь "Code Pages"(Кодовых Страниц) - т.е. отдельных наборов иероглифов, которые могут встретиться в JDM-магнитолах на поприще "Локализации".
На самом деле - и этих Кодовых страниц превеликое множество, но речь пойдет только от Трех из них:
Shift_JS, CP932 (разработана специально для Windows) и 20932.
● Первые две таблицы (Shift_JS и CP932) очень похожи друг на друга, но все же имеют различия;
● символы(иероглифы) в первых двух таблицах могут кодироваться как Одним, так и Двумя байтами;
● в 20932 - символы могут кодироваться Одним, Двумя или Тремя байтами;
Ну а теперь самое время вставить имеющиеся картинки..
Shift_JS http://www.kreativekorp.com/charset/encoding.php?name=Shift-JIS
CP932 http://www.kreativekorp.com/charset/encoding.php?name=CP932
и Легенда для них: Для любопытных умов сообщу, что перейдя по соответствующим ссылкам ниже скриншотов - вы сможете изучить таблицы более подробно, забравшись в самые сокровенные их уголки... - реально и интерактивно пощелкать по практически каждому символу и увидеть куда он ведет!
К сожалению, что касается 20932-й Кодовой страницы - на вышеуказанном сайте найти не получится, но в Интернете есть описания о ее содержимом...
(к сожалению на Английском языке,... перевести Гуглом то можно, но при этом могут быть ошибки толкования и неточности... )
В данный момент ведутся изыскательные работы по данной Кодовой странице...
Ну а пока позволю сюда вставить отдельные ссылки, что бы мне не забыть и Вам почитать на досуге:
1. http://www.sljfaq.org/afaq/encodings.ht ... ngs-EUC-JP
2. http://www.kreativekorp.com/charset/encoding.php
3. http://en.academic.ru/dic.nsf/enwiki/298402
4. https://encoding.spec.whatwg.org/#shift_jis
5.https://encoding.spec.whatwg.org/#euc-jp
6. Extended Unix Code: EUC-JP
Японский язык
- bellic
- Сообщения: 1505
- Зарегистрирован: 11 мар 2017, 07:47
- Откуда: Rostov-on-Don
- Контактная информация:
Японский язык и японские иероглифы
EUC-JP - это кодирование с переменной шириной, используемое для представления элементов трех японских стандартов набора символов, а именно JIS X 0208, JIS X 0212 и JIS X 0201.
* Символ из JIS-X-0208 (код 1) представлен двумя байтами, как в диапазоне 0xA1 -- 0xFE.
* Символ из JIS-X-0212 (код 3) представлен тремя байтами, первый из которых равен 0x8F, следующие два в диапазоне 0xA1 -- 0xFE.
* Символ из «верхней половины» JIS-X-0201 (полуширина kana, код 2) представлен двумя байтами, первый из которых равен 0x8E, второй - в диапазоне 0xA1 -- 0xDF.
* Символ из «нижней половины» JIS-X-0201 (ASCII, код 0) представлен одним байтом в диапазоне 0x21 -- 0x7E.
Эта схема кодирования позволяет легко смешивать 7-битные ASCII и 8-битные японцы без необходимости использования символов escape, используемых ISO-2022-JP, который основан на тех же стандартах набора символов.
В Японии кодирование EUC-JP в значительной степени используется Unix или Unix-подобными операционными системами (кроме HP-UX), в то время как Shift_JIS или его расширения (кодовая страница Windows 932 и MacJapanese) используются на других платформах. Поэтому, независимо от того, используют ли японские веб-сайты EUC-JP или Shift_JIS, зависит от того, какую ОС использует автор.
EUC-JISX0213 похож на EUC-JP, но отличается от EUC-JP тем, что две плоскости JIS-X-0213 имеют место JIS-X-0208 и JIS-X-0212. Аналогичная связь между Shift_JIS и Shift-JISX0213
- bellic
- Сообщения: 1505
- Зарегистрирован: 11 мар 2017, 07:47
- Откуда: Rostov-on-Don
- Контактная информация:
Японский язык и японские иероглифы
А у нас ведь вроде имеются в совершенстве владеющие Английским
Или я ошибаюсь?
Вот бы малость подчистить шероховатости в переводе!...
Еще больше информации по японским Кодовым страницам есть тут:
http://www.sljfaq.org/afaq/encodings.ht ... onversions
Но я пока не буду ее сюда выкладывать и переводить!
P.S. Не сильно много я Болдов поставил в форматировании? Не напрягает?
- vitecd
- Сообщения: 175
- Зарегистрирован: 12 июл 2017, 06:29
- Откуда: Auckland, NZ
- Контактная информация:
Японский язык и японские иероглифы
- bellic
- Сообщения: 1505
- Зарегистрирован: 11 мар 2017, 07:47
- Откуда: Rostov-on-Don
- Контактная информация:
Японский язык и японские иероглифы
Тебе возможно эта инфа и не нужна!
Хотя ты мог бы оказать большую помощь в корректировке Гуловских переводов Мануалов по Кодовым страницам!
А какие именно ты встречал кодировки в прошивках?
Есть прошивки, в которых одновременно встречаются кодировки как 932, так и 20932!
Данная информация может быть полезна для программистов, разбирающих прошивки, если конечно они когда нибудь появятся на нашем форуме!
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 20 гостей