Это говорит только о примитивной логике распространенных NAT'ов (в отличие от спец-прокси).
Но это не значит, что в Firewall нельзя закрыть UDP полностью, а открывать только для желательных UDP-протоколов (DNS и т.п. по конкретным портам). И вообще, если задача админа стоит в блокировке Skype, то и начинать нужно блокировки его управляющих TCP-соединений, чьи параметры также хорошо известны. В этом случае до NAT'а и уязвимости его дефолтных политик для UDP дело даже не дойдет.
Отдельным словом оно и переводилось правильно. А в том предложении "And so when we see increasing differences in income in a rich country, there is a tendency to worry that it's sliding back toward becoming another Venezuela." по-прежнему заменяется Японией и сегодня.
Если урезать до "becoming another Venezuela.", то тоже - "стать другом Японии."
А вот если убрать becoming в начале или точку в конце - всплывает Венесуэла :)
Интересные у них алгоритмы...
Один реальный баг (а не недоученность) в гуглопереводчике хорошо заметен, он многократно повторяется на в переводах разных статей: это инверсия смысла предложения. Часто бывает, что утвердительное предложение в переводе звучит наоборот, как отрицающее высказывание. И наоборот.
Например:
"We did not run out of money." -> "У нас не хватило денег."
а вот Промт дает правильный перевод:
"Мы не исчерпывали деньги." (в смысле "денег нам хватило")
Впрочем, может быть именно этот пример исправится доучиванием ("пониманием" смысла "run out", тогда перевод мог бы звучать "у нас не не хватило денег" или после редукции "у нас хватило денег") без перепрограммирования. Вчера попадались более нелепые необъяснимые инверсии, жаль не записал.
По поводу ПроМТа. Может он и не бета, но вот сейчас он вообще не работает... При попытке перевода веб-страницы через translate.ru:
Error: IsComplete is not found
soap:ServerSystem.Web.Services.Protocols.SoapException: Server was unable to process request. ---> System.Exception: PitsUnkError
at Promt.Pits.Translator.Services.Translator2.TranslateHTMLFile(Int32 DirId, String TplId, Byte[] data, TemplateDataSet Context, String URLBase, String HrefPrefix)
--- End of inner exception stack trace ---
Может он по технологии перевода впереди на поколения, но по веб-технологиям - позади на столько же.
Веб в целом — поток очень грязный, как и "почта в целом".
Я потому и спрашивал тут где-то - "Интересно, на каких текстах тренировали переводчика". Хоть веб и грязный - переводено из этой грязи далеко не всё! :) А только жизнеспособное, кому-то полезное. Естественный отбор-с.
Возвращаясь к ПЗУ мозгов. Хорошую метафору подсказал Игорь. Кто-нибудь меняет схему/ПЗУ наших мозгов после первых нескольких месяцев (ну или лет, допустим) от рождения? И ведь продолжают работать хоть бы что, самообучаясь на автопилоте с обратной связью.
Нет, я почти цитирую. Раз это (уже?) не так (вам-то виднее), то расскажите, сколько процентов фильтрует RBL, сколько шинглы, сколько и т.п. И скажите, какие из этих методов НЕ используют статистические данные.
Согласен, алгоритм "извлечения материала" из текста - работа для лингвистов. После извлечения - работа стат.методов. В гугловом переводчике, конечно, тоже. Да и в байесе (собственно лингвистической частью разные байесы и отличаются друг от друга, причем очень сильно). И даже RBL'ные системы работают по-разному, учитывают разные факторы, т.е. своего рода "лингвистику" сетевых признаков.
Но знания лингвистов должны зашиваться в программу (программа обучается на лингвистах :), и врядли после этого нужны круглосуточные лаборатории, т.к. эти знания не так уж часто меняются. Лингвистика - это ПЗУ, как вы верно говорили выше. А зачем ПЗУ перепрошивать 20 раз в день? ;) Если это требуется - знать, плохое ПЗУ.
Процентов почты 25 фильтрует, процентов 10-15 спама пропускает. Так что, в общем, не львиная доля объема, и уж точно не львиная доля качества.
Причем здесь байес? (Байес - частный случай сематической сети, это вообще универсальный инструмент; если не знаете примеров байеса на корп.серверах, то вы тоже "не в теме" :). А здесь я о другом:
У яндекса основной поток спама отсеивается по собственным RBL. Это тоже статистический фильтр. Крупнейшие западные антиспамы - ВСЕ статистические, т.к. их основа - обработка спама с миллионов ловушек...
И Антиспам Касперского будет развиваться в сторону стат.методов (которые в нем наверняка уже сейчас больше половины спама ловят). Кстати, на mail.ru спамтест работает лучше, чем тот же спамтест на KHS - может это из-за бОльшей статистики на mail.ru? ;) Посмотрим лет через 3-5 на антиспамы и переводчики :)
Да, Гугл очень наблюдателен. По его мнению, Венесуэла по-русски Япония! :))
"And so when we see increasing differences in income in a rich country, there is a tendency to worry that it's sliding back toward becoming another Venezuela.
И поэтому, когда мы видим, растет разница в доходах, в такой богатой стране,наблюдается тенденция к тому, чтобы беспокоиться о том, что оно скатывается к другому становится Япония."
1) сейчас туда-обратно выглядит в гугле слегка иначе (может от знаков препинания зависит?):
В lukomoria дуб зеленый, Zlataya цепи экосистемы.И днем и ночью ученый во всех ходит по цепи кругом, правая ведет песню, слева - рассказ сказано.Там чудеса : дьявол бродит в городе филиала; Там, мощные тропы Следы невиданных зверей.Открывает там одичавшие пакет стоит без окон, без дверей.
Но это не значит, что в Firewall нельзя закрыть UDP полностью, а открывать только для желательных UDP-протоколов (DNS и т.п. по конкретным портам). И вообще, если задача админа стоит в блокировке Skype, то и начинать нужно блокировки его управляющих TCP-соединений, чьи параметры также хорошо известны. В этом случае до NAT'а и уязвимости его дефолтных политик для UDP дело даже не дойдет.
Если урезать до "becoming another Venezuela.", то тоже - "стать другом Японии."
А вот если убрать becoming в начале или точку в конце - всплывает Венесуэла :)
Интересные у них алгоритмы...
Например:
"We did not run out of money." -> "У нас не хватило денег."
а вот Промт дает правильный перевод:
"Мы не исчерпывали деньги." (в смысле "денег нам хватило")
Впрочем, может быть именно этот пример исправится доучиванием ("пониманием" смысла "run out", тогда перевод мог бы звучать "у нас не не хватило денег" или после редукции "у нас хватило денег") без перепрограммирования. Вчера попадались более нелепые необъяснимые инверсии, жаль не записал.
Error: IsComplete is not found
soap:ServerSystem.Web.Services.Protocols.SoapException: Server was unable to process request. ---> System.Exception: PitsUnkError
at Promt.Pits.Translator.Services.Translator2.TranslateHTMLFile(Int32 DirId, String TplId, Byte[] data, TemplateDataSet Context, String URLBase, String HrefPrefix)
--- End of inner exception stack trace ---
Может он по технологии перевода впереди на поколения, но по веб-технологиям - позади на столько же.
Я потому и спрашивал тут где-то - "Интересно, на каких текстах тренировали переводчика". Хоть веб и грязный - переводено из этой грязи далеко не всё! :) А только жизнеспособное, кому-то полезное. Естественный отбор-с.
Возвращаясь к ПЗУ мозгов. Хорошую метафору подсказал Игорь. Кто-нибудь меняет схему/ПЗУ наших мозгов после первых нескольких месяцев (ну или лет, допустим) от рождения? И ведь продолжают работать хоть бы что, самообучаясь на автопилоте с обратной связью.
Но знания лингвистов должны зашиваться в программу (программа обучается на лингвистах :), и врядли после этого нужны круглосуточные лаборатории, т.к. эти знания не так уж часто меняются. Лингвистика - это ПЗУ, как вы верно говорили выше. А зачем ПЗУ перепрошивать 20 раз в день? ;) Если это требуется - знать, плохое ПЗУ.
Причем здесь байес? (Байес - частный случай сематической сети, это вообще универсальный инструмент; если не знаете примеров байеса на корп.серверах, то вы тоже "не в теме" :). А здесь я о другом:
У яндекса основной поток спама отсеивается по собственным RBL. Это тоже статистический фильтр. Крупнейшие западные антиспамы - ВСЕ статистические, т.к. их основа - обработка спама с миллионов ловушек...
И Антиспам Касперского будет развиваться в сторону стат.методов (которые в нем наверняка уже сейчас больше половины спама ловят). Кстати, на mail.ru спамтест работает лучше, чем тот же спамтест на KHS - может это из-за бОльшей статистики на mail.ru? ;) Посмотрим лет через 3-5 на антиспамы и переводчики :)
Интересно, на каких текстах тренировали переводчика и как?
"And so when we see increasing differences in income in a rich country, there is a tendency to worry that it's sliding back toward becoming another Venezuela.
И поэтому, когда мы видим, растет разница в доходах, в такой богатой стране,наблюдается тенденция к тому, чтобы беспокоиться о том, что оно скатывается к другому становится Япония."
Но в отличие от Москвы у них стимула вызовет немало.
But unlike serfs they had an incentive to create a lot of it.
В lukomoria дуб зеленый, Zlataya цепи экосистемы.И днем и ночью ученый во всех ходит по цепи кругом, правая ведет песню, слева - рассказ сказано.Там чудеса : дьявол бродит в городе филиала; Там, мощные тропы Следы невиданных зверей.Открывает там одичавшие пакет стоит без окон, без дверей.
Вцелом неплохо. А (2) - чей продукт?