Pull to refresh

Comments 39

Пожалуйста, укажите название лицензии, по которой вы используете визуальный контент Ильи Варламова.

Спасибо!

Очевидно, что в данном случае использование изображения вполне подпадает под fair use, добросовестное использование, или, если оперировать нормами Гражданского кодекса РФ (в юрисдикции которой, как я полагаю, работает Хабр), то ст. 1274 части четвертой ГК, которая позволяет использование произведения без разрешения автора и выплаты ему вознаграждения:

  • свободное использование произведения в информационных, научных, учебных или культурных целях;

Но какой же смысл использовать по fair use изображение, которое является свободным контентом, полученным от фотографа по свободной лицензии?

"иероглиф состоит из ключа 口 (kǒu, рот) — не правда ли, похоже на открытый рот, это 3 штриха"

Простите, но как здесь оказалось 3 штриха, если явно 4 линии?

Это такая особенность, что по правилам он рисуется именно тремя штрихами (strokes count):
image

Да, точно. Если можно — я позже добавлю в пост ваше объяснение.

Ещё бы теперь узнать, как об этом догадаться, когда печатный вариант вот совсем не похож на рукописный — вот так он выглядит в Firefox (шрифт Microsoft YaHei): Иероглиф 口.

Хм...

"Штрих
1. Тонкая черта, линия. Штрих на бумаге. Штрихами на планах изображается рельеф местности. Портрет был почти совсем готов, оставалось докончить лицо несколькими штрихами. Тургенев. ". (с) Из словаря Ушакова.

Я всегда думал, что штрих прямой. А это - вероятно мазок.

Ни разу не эксперт, но подсчёты в статье подпадают под формулу вида "минимальное кол-во непрерывных вертикально невозрастающих штрихов"

Мне кажется, человеку который не изучает китайский язык если надо перевести надпись на реальном объекте, проще всего будет достать телефон, запустить приложение Переводчик, нажать значок камеры и навести камеру на надпись.

Человеку, который не в теме, определить какая из компонент иероглифа является ключом для поиска в словаре, сделать это почти невозможно или крайне трудоёмко. Особенно если иероглиф состоит из нескольких компонент и все они являются ключами. Например 猪 — тут три компонента и все три входят в список ключей. Который из них ключ?

Еще есть проблема деления предложения на слова. Большинство слов состоят из нескольких иероглифов и между ними нет пробелов. Как понять, этот иероглиф — это одно слово из одного иероглифа или часть слова из нескольких иероглифов?

И подсчёт количества черт для человека, который не знает правил написания, наверное тоже неочевиден.

Угу, поиск по ключам / числу штрихов в словаре (даже электронном) был актуален в эпоху до распознавания камерой и рукописного ввода стилусом (пальцем). Не знаю, работает ли распознавание камерой без интернета (ни разу не пользовался), но умение писать иероглифы (знание порядка написания черт) реально помогает писать их правильно и проходить первый этап распознавания. Если ввести первый иероглиф, электронный словарь предложит варианты его сочетаний и если второй иероглиф является частью слова, то это будет видно.

Например 猪 — тут три компонента и все три входят в список ключей. Который из них ключ?

Тот, который слева.

>Мне кажется, человеку который не изучает китайский язык если надо перевести надпись на реальном объекте, проще

Конечно проще, но мне хотелось разобраться именно с тем, как устроен бумажный китайский словарь.

>Как понять, этот иероглиф — это одно слово из одного иероглифа или часть слова из нескольких иероглифов?
Как не странно — по контексту, в словарях сразу дается использование данного иероглифа в сложных словах.


>И подсчёт количества черт для человека, который не знает правил написания, наверное тоже неочевиден.

Позже добавлю в пост апдейт по комментам @akhalat и @zantor, которые очень лаконично объяснили, каким образом подсчитываются штрихи в ключах. Но вообще в словарях даются таблички с ключами и количеством штрихов в них, и найти необходимый ключ не очень большая проблема.

Ох, лучше бы Мао таки осуществил реформу языка на буквенную запись.

Очевидно, это породило больше проблем, чем решений, хотя бы потому, что современный китайский — это пучок из десятка фонетически разнообразных диалектов, использующих одну грамматическую и словарную базу.

Та же запись в романизациях китайских диалектов громоздкая и неудобная. Если брать два самых распространенных диалекта, путунхуа и кантонский, то у одного романизация(ханьюй пиньинь) требует использование по одному из четырех акцентов почти в каждом слоге (shì, shí, shǐ, shī), то у другого (у кантонской романизации ютпхин) вообще девять акцентов, которые обозначаются по обыкновению цифирным надиндекском или просто цифрой после слога. На мой взгляд, это породило бы типографический ад даже сейчас, а во времена Мао вообще бы откинуло китайский язык в дописьменные времена.

А китайцам вполне удобно и с иероглифической системой записи, как это не странно — много языков — одна запись.

Ну получился бы очередной вьетнамский. Все слова из трех латинских букв, зато на каждой букве пờ тṗи этẩжặ диакритических знаков. И все означают какие-то восходящие интонации/придыхания, которые европеец даже не тренировал, и все его попытки сказать "фо бо" будут означать не традиционный суп, а что-то вроде "я шатал твой отец".

всё так, но порог входа у Вьетнамского "20 минут" для того чтобы прочитать название улицы или надпись вместо китайских "очень много недель чтобы запомнить 400 самых популярных", а потом всё равно обломаться если встретить что-то редкое

Значит китайцам все равно сколько иностранцы будут учить их язык. С другой стороны это давало унификацию с другими языками Азии. С тем же вьетнамским до реформы или японским.

В общем они могли вести осмысленную беседу рисуя иероглифы, но не зная языка.

>всё так, но порог входа у Вьетнамского "20 минут" для того чтобы прочитать название улицы

Кого интересует мнение варваров с Запада?

> Кого интересует мнение варваров с Запада?
В 17ом веке таки волновало! Спасибо Александру де Роду из Франции (в случае Вьетнама)

А мне вот интересно было бы мнение самих китайцев. Понимают ли они, что их язык, как письменный так и устный, неоправданно сложен? Что учить "алфавит" всё детство и юность - это ненормально. Что есть языки, развившиеся позднее, на которых можно хоть кричать, хоть шептать, без выделения тонами или прищёлкиваниями (как у некоторых африканских языков) - и при этом быть однозначно понятыми с первого раза. Что есть языки мелодичные, с богатыми оттенками смысла для любого понятия, на которых просто слагать красивые легко запоминающиеся стихи, и подкладывать под них музыку...

Мне кажется, китайский язык стал жертвой своей древней истории. Его ограниченное фонетическое разнообразие, давно устаревшая письменность усложняет китайцам как общение с другими народами, так и образование нового поколения.

>Его ограниченное фонетическое разнообразие, давно устаревшая письменность усложняет китайцам как общение с другими народами

Полагаю, полутора миллиардам китайцев это волнует немногим менее, чем никак: Китай — страна с рекордно низким показателем процента населения, знающего 2 или более языка.

> так и образование нового поколения.

И это никак не мешает китайцам быть лидерами по абсолютному количеству успешных математиков, например.

>и при этом быть однозначно понятыми с первого раза.

Ну, тут, как говорит одна моя приятельница, по совместительству когда-то работавшая в СБУ преподавателем китайского языка, все просто: когда ты знаешь язык — ты понимаешь его с первого раза :)

>на которых просто слагать красивые легко запоминающиеся стихи, и подкладывать под них музыку...

Вот тут вся очень богатая китайская литература смотрит с отчаянным недоумением :) То, что западный мир практически не знаком с китайской литературой, не умоляет достоинств и не снижает ее величия. Полагаю, с мелодичностью песен на китайском дело обстоит примерно так же — то, что лично для вас китайские песни недостаточно выразительны или мелодичны, не делает их хуже в глазах китайцев :) Ну а уж в области поэзии китайцы точно дадут фору любой нации: стихосложение для китайцев — это настоящее кунг-фу, искусство, которое подразумевает постоянное совершенствование, а не только ожидание «музы», которая позволит срифмовать «палка-селедка».

>Что учить "алфавит" всё детство и юность - это ненормально. 

Тут, опять-таки, опираясь на высказывания моей приятельницы, могу возразить — будучи носителем неиероглифического языка, вы точно также всю свою жизнь (а не только юность и детство) учите новые слова, точно так же как и китайцы. Толку с того, что в первом классе вы сможете прочитать слово «синхрофазотрон». Без понимания значения это слово для вас — такой же набор непонятных черточек, как и соответствующий набор иероглифов для китайца. Мало того, китайские иероглифы в очень сложном слове 同步相位加速器 четко описывают общий функционал данного устройства простыми китайскими словами, а вот слово «синхрофазотрон» для первоклашки — всего лишь набор непонятных звуков.

>Понимают ли они, что их язык, как письменный так и устный, неоправданно сложен? 

Как не странно, китайский (я сейчас о путунхуа и упрощенной иероглифике) — очень логичный и стройный, с минимумом исключений, с очень любопытной простой грамматикой, с понятной, четкого оговоренной фонетикой (пусть и непривычной для людей, незнакомых с тоническими языками) и вообще чрезвычайно симпатичный язык. А вот русский, например, китайцев приводит в хтонический ужас своею сложностью в грамматическом, фонетическом и словообразовательном плане, и вдобавок помноженной на адское количество исключений и двусмысленностей.

>Мне кажется, китайский язык стал жертвой своей древней истории

Не сомневаюсь — полутора миллиардам китайцев кажется совсем не так:)

Возможно вы правы и свой язык и письменность кажутся большинству китайцев самыми лучшими. Но только по 1 причине: они не знают других, а значит не могут сравнить.

Насчёт простоты грамматики, цитата:

Многие в России считают грамматику китайского языка легкой. Однако Чжао Юньпин утверждает, что так же, как «грамматика русского языка трудна своей сложностью, грамматика китайского языка трудна своей простотой. Грамматические правила русского языка очень строгие, слова всегда изменяются, а грамматические правила китайского – довольно гибкие, а слова остаются неизменяемыми при любых условиях. Сравнительно легче одолеть сложную строгость, чем освоить простую гибкость» [Чжао Юньпин, 2003, 19].

Насчёт лидерства в математике: здесь срабатывает теория больших чисел. Чем больше людей охватывается образованием, тем больше талантов раскроют свои способности.

Насчёт искусства стихосложения: так у них нет другого выхода. Чтобы красиво изложить суть, нужно каждый раз решать иероглифические ребусы. Т.е. много думать о форме, а не о сути. Вы ещё вспомните про калиграфию, которая там тоже искусство.

Теперь по поводу понятности китайского синхрофазотрона первоклашке, или человеку с улицы цитата:

Даже зная значение каждого иероглифа в составе слова, во многих случаях трудно или невозможно догадаться о смысле этого слова. Необходимо учить не только иероглифы, но и слова, которые они образуют вместе с другими иероглифами.

Китайские иероглифы создавались тысячи лет назад, и попытки описать ими новые понятия в физике и других науках сродни объяснению высоких материй на пальцах.

>Насчёт лидерства в математике: здесь срабатывает теория больших чисел

Что-то в случае с Индонезией и Нигерией, например, закон больших чисел совершенно не срабатывает. Да и с Пакистаном тоже не очень, как по мне. Индия под вопросом. По идее все четыре страны должны выдавать на-гора сравнимое с Китаем количество математиков, но по итогу только у Индии получается хоть что-то сравнимое, и то — благодаря не меньшему историческому контексту и сильному влиянию колониального прошлого в прошедшие 2-3 века.

>Но только по 1 причине: они не знают других, а значит не могут сравнить.

Ну, зато могут сравнить лаоваи-китаеведы (особенно китаеведы-лингвисты), большая часть из которых в восторге от изучаемого предмета :)

ЗЫ: Кстати, слово "простая" в качестве эпитета к китайской грамматике я выделил курсивом совсем неспроста.

Я писал не об абсолютной численности населения, а об охвате его образованием. Очевидно, в Индонезии и Нигерии с этим проблема. Лингвисты в восторге от сложности постигаемого предмета, не удивительно. Я бы тоже этим гордился, если бы владел китайским языком.

Китайские иероглифы создавались тысячи лет назад, и попытки описать ими новые понятия в физике и других науках сродни объяснению высоких материй на пальцах.

В целом я с вами согласен, но вот здесь замечу — σύν-χρόνος-φάσις-ἤλεκτρον, как и многие другие новые научные понятия, тоже использует слова тысячелетней давности.

Скажите, как носитель русского, понимаете ли вы, что он неоправданно сложен? Что учить "правила написания слов" 11 лет в школе – это ненормально, потому что слова ни черта не пишутся так, как читаются? Что есть языки, в которых ударение всегда падает в одно и то же место, и не приходится его запоминать? Что нам приходится уметь произносить невозможно долгие слова (взять хотя бы мою фамилию "Мирошниченко", проблем с которой не возникает исключительно у русских), которые нормальный человек выговорить не может, потому что у нас из них состоит весь язык? Что вместо использования простых предлогов (of thing, to thing, with thing...) у нас есть падежи, и каждое слово меняется непредсказуемым образом (Зализняк 50 типов склонений насчитал), в чём мы и сами порой путаемся, а если говорить о сложностях для изучения иностранцами, то ещё и невероятные глаголы движения (сравните "ходить" и "идти"), миллиард приставок, обозначающие результативность, финальность действия, повторяемость, регулярность, привычность и что только не).

Что касается китайского, тона, как и иероглифы, дают гораздо большую плотность информации. Мой комментарий был бы раза в 3 короче на китайском, в том числе и на слух (а если б не его излишняя аналитичность и избыточность, то и в 5). Разве это не прекрасно?

У меня иногда возникает желание перевести японские иероглифы, написанные от руки(!) японцами. При наличии электронного текста можно воспользоться гугл транслейтом, или сразу несколькими онлайн-переводчиками. Но проблема в том, что нужно перевести иероглифы с картинки в текст. Нормальных OCR онлайн-сервисов я не знаю, те что нагугливал - выдавали какую-то полную хрень.

Мобильное приложение гугл транслейт же умеет переводить по картинке, как минимум то что в объективе камеры

Даже написанные коряво от руки и сохраненные в маленькой картинке?

С какой-то долей вероятности )

Напрашивается идея какой-то интерактивности. Чтобы программа вывела варианты в иероглифах с вариантами перевода, а я уже выбрал бы наиболее подходящие по смыслу.

Как повезет. Не знаю как с японским, но китайский иногда успешно переводит даже с совершенно нестандартными шрифтами, а рукописный переводит успешно, наверное, в 80% — плохой почерк для образованного человека у китайцев скорее редкость.

Неужели и такое распознает?

Это, полагаю, было написано до культурной революции :)

Как раз во время неё — в 1969.
(На картинке висит ссылка на викистатью)

Насчёт распознавания по картинке не уверен, но вот поле рукописного ввода Google Translate более-менее успешно распознаёт мой рукописный японский - а это задача, которая, боюсь, далеко не каждому образованному японцу по плечу.

Ну а написанное коряво от руки и сохранённое в маленькой картинке я и по-русски далеко не всегда с первого раза смогу прочитать - даже (особенно!) если писавшим это человеком был я полгода назад :-)

Прекрасная статья, и новая для меня.

214 ключей используют и в японском языке (для человека неподготовленного всё-таки сложно по ним искать, - может японский имеет свои особенности). Мне потребовалось определить графическую форму: катакана или хирагана. Но успехом не увенчался поиск 2-го иероглифа выбранного заголовка по ключам. Только через программу с озвучиванием стало ясно, что звуки "ka u ru" нужно записывать как "カ ウ ル". И уже эти иероглифы можно перевести.

Sign up to leave a comment.

Articles